CN116993342A - 异常交易操作检测方法、装置、计算机设备和存储介质 - Google Patents

异常交易操作检测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN116993342A
CN116993342A CN202210429294.4A CN202210429294A CN116993342A CN 116993342 A CN116993342 A CN 116993342A CN 202210429294 A CN202210429294 A CN 202210429294A CN 116993342 A CN116993342 A CN 116993342A
Authority
CN
China
Prior art keywords
dimension
transaction
outlier
abnormal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210429294.4A
Other languages
English (en)
Inventor
王婷
郭润增
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210429294.4A priority Critical patent/CN116993342A/zh
Publication of CN116993342A publication Critical patent/CN116993342A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Finance (AREA)
  • Algebra (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及一种异常交易操作检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:根据各交易设备分别在多个第一维度下的设备特征数据,从所述多个第一维度中确定第一离群维度;获取各交易设备分别在所述第一离群维度下的目标设备特征数据,并根据所述目标设备特征数据,从多个交易设备中确定出异常交易设备集合;根据各对象分别在多个第二维度下的对象特征数据,从所述多个第二维度中确定第二离群维度;获取各对象分别在所述第二离群维度下的目标对象特征数据,并根据所述目标对象特征数据,从多个对象中确定出异常风险对象集合;基于所述异常交易设备集合和所述异常风险对象集合,确定异常交易操作,提升了检测结果准确度。

Description

异常交易操作检测方法、装置、计算机设备和存储介质
技术领域
本申请涉及互联网技术领域,特别是涉及一种异常交易操作检测方法、装 置、计算机设备、存储介质和计算机程序产品。
背景技术
随着互联网技术的发展,消费者可选择的支付方式也呈现多样化。目前, 支持消费者支付商品费用的硬件设备有手机、刷脸设备、刷卡设备、刷掌设备、 电脑等。以刷脸设备为例,设备服务商购买刷脸设备后,将刷脸设备铺设于门 店中,消费者在门店选购商品后,结账时可选择使用刷脸设备进行支付,支付 完成后,刷脸设备便生成对应的交易数据。设备卖家会对所有刷脸设备的交易 数据进行统计,并对一段时间内超过一定交易阈值的刷脸设备进行返佣。若有 预谋地对刷脸设备进行人为的异常交易操作,则将这些异常交易操作称为刷单 操作。
传统技术中,判断设备是否在某个地点突然出现大量的交易,或者被少量 的用户在短时间内进行了大量的交易,若是,则认为这些交易操作均为刷单操 作。然而,上述方法存在将正常操作误判为异常操作的风险,检测结果准确度 不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升刷单操作检测准确 度的异常交易操作检测方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种异常交易操作检测方法。方法包括:
基于历史交易数据,确定各交易设备分别在多个第一维度下的设备特征数 据,以及各对象分别在多个第二维度下的对象特征数据;
根据各交易设备分别在多个第一维度下的设备特征数据,从多个第一维度 中确定第一离群维度;
获取各交易设备分别在第一离群维度下的目标设备特征数据,并根据目标 设备特征数据,从多个交易设备中确定出异常交易设备集合;
根据各对象分别在多个第二维度下的对象特征数据,从多个第二维度中确 定第二离群维度;
获取各对象分别在第二离群维度下的目标对象特征数据,并根据目标对象 特征数据,从多个对象中确定出异常风险对象集合;
基于异常交易设备集合和异常风险对象集合,确定异常交易操作。
第二方面,本申请还提供了一种异常交易操作检测装置。装置包括:
第一确定模块,用于基于历史交易数据,确定各交易设备分别在多个第一 维度下的设备特征数据,以及各对象分别在多个第二维度下的对象特征数据;
第二确定模块,用于根据各交易设备分别在多个第一维度下的设备特征数 据,从多个第一维度中确定第一离群维度;根据各对象分别在多个第二维度下 的对象特征数据,从多个第二维度中确定第二离群维度;
第三确定模块,用于获取各交易设备分别在第一离群维度下的目标设备特 征数据,并根据目标设备特征数据,从多个交易设备中确定出异常交易设备集 合;获取各对象分别在第二离群维度下的目标对象特征数据,并根据目标对象 特征数据,从多个对象中确定出异常风险对象集合;
第四确定模块,用于基于异常交易设备集合和异常风险对象集合,确定异 常交易操作。
第三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处 理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
基于历史交易数据,确定各交易设备分别在多个第一维度下的设备特征数 据,以及各对象分别在多个第二维度下的对象特征数据;
根据各交易设备分别在多个第一维度下的设备特征数据,从多个第一维度 中确定第一离群维度;
获取各交易设备分别在第一离群维度下的目标设备特征数据,并根据目标 设备特征数据,从多个交易设备中确定出异常交易设备集合;
根据各对象分别在多个第二维度下的对象特征数据,从多个第二维度中确 定第二离群维度;
获取各对象分别在第二离群维度下的目标对象特征数据,并根据目标对象 特征数据,从多个对象中确定出异常风险对象集合;
基于异常交易设备集合和异常风险对象集合,确定异常交易操作。
第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介 质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
基于历史交易数据,确定各交易设备分别在多个第一维度下的设备特征数 据,以及各对象分别在多个第二维度下的对象特征数据;
根据各交易设备分别在多个第一维度下的设备特征数据,从多个第一维度 中确定第一离群维度;
获取各交易设备分别在第一离群维度下的目标设备特征数据,并根据目标 设备特征数据,从多个交易设备中确定出异常交易设备集合;
根据各对象分别在多个第二维度下的对象特征数据,从多个第二维度中确 定第二离群维度;
获取各对象分别在第二离群维度下的目标对象特征数据,并根据目标对象 特征数据,从多个对象中确定出异常风险对象集合;
基于异常交易设备集合和异常风险对象集合,确定异常交易操作。
第五方面,本申请还提供一种计算机程序产品。计算机程序产品,包括计 算机程序,该计算机程序被处理器执行时实现以下步骤:
基于历史交易数据,确定各交易设备分别在多个第一维度下的设备特征数 据,以及各对象分别在多个第二维度下的对象特征数据;
根据各交易设备分别在多个第一维度下的设备特征数据,从多个第一维度 中确定第一离群维度;
获取各交易设备分别在第一离群维度下的目标设备特征数据,并根据目标 设备特征数据,从多个交易设备中确定出异常交易设备集合;
根据各对象分别在多个第二维度下的对象特征数据,从多个第二维度中确 定第二离群维度;
获取各对象分别在第二离群维度下的目标对象特征数据,并根据目标对象 特征数据,从多个对象中确定出异常风险对象集合;
基于异常交易设备集合和异常风险对象集合,确定异常交易操作。
上述异常交易操作检测方法、装置、计算机设备、存储介质和计算机程序 产品,基于各交易设备分别在多个第一维度下的设备特征数据进行离群点检测, 可以初步从多个第一维度中提取出第一离群维度。相应地,基于各个对象分别 在多个第二维度下的对象特征数据进行离群点检测,可以初步从多个第二维度 中提取出第二离群维度。这样,对于交易设备而言,就可重点根据第一离群维 度下的目标设备特征数据,从多个交易设备中快速且准确地确定出异常交易设 备集合。对于交易对象而言,就可重点根据第二离群维度下的目标对象特征数 据,从多个对象中快速且准确地确定出异常风险对象集合。如此,便能将异常 风险对象在异常交易设备上完成的交易操作确定为异常交易操作,降低了正常 交易操作被误判为异常交易操作的风险,大大提高了检测结果的准确性。
附图说明
图1为一个实施例中异常交易操作检测系统的框架图;
图2为一个实施例中异常交易操作检测方法的流程示意图;
图3为一个实施例中从多个第一维度中确定第一离群维度的步骤的流程示 意图;
图4为一个实施例中正态分布示意图;
图5为一个实施例中从多个交易设备中确定出异常交易设备集合的步骤的 流程示意图;
图6为另一个实施例中从多个交易设备中确定出异常交易设备集合的步骤 的流程示意图;
图7为一个实施例中第一决策树模型的结构示意图;
图8为一个实施例中从多个第二维度中确定第二离群维度的步骤的流程示 意图;
图9为一个实施例中从多个对象中确定出异常风险对象集合的步骤的流程 示意图;
图10为另一个实施例中从多个对象中确定出异常风险对象集合的步骤的流 程示意图;
图11为一个实施例中第二决策树模型的结构示意图;
图12为一个实施例中异常交易操作检测装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅 用以解释本申请,并不用于限定本申请。
图1为本申请实施例提供的异常交易操作检测系统。如图1所示,该异常 交易操作检测系统包括:多个交易设备110和服务器120。多个交易设备110通 过网络与服务器120进行通信。数据存储系统可以存储服务器120需要处理的 数据。数据存储系统可以集成在服务器120上,也可以放在云上或其他服务器 上。在一种可能的场景中,服务商可将多个交易设备110铺设于门店中,示例 性的,在门店1铺设1个交易设备110,在门店2铺设2个交易设备110,在门 店3铺设2个交易设备110,消费者在某个门店选完商品后,结账时可选择该门店铺设的任一交易设备110进行交易操作,交易设备110检测到交易操作完成 后,生成交易数据,并将交易数据发送给服务器120,该交易数据可包括:交易 时间点、交易设备、对象、交易金额、交易时长、交易设备所在位置等。服务 器120可基于交易设备110发送的交易数据,检测异常交易操作,后续对各个 交易设备110的交易量做统计时,可将异常交易操作剔除,从而降低人为恶意 刷单的可能性。
其中,交易设备110可以但不限于是各种个人计算机、笔记本电脑、智能 手机、平板电脑、刷脸设备、刷卡设备、刷掌设备、物联网设备和便携式可穿 戴设备,物联网设备可为智能音箱、智能电视、智能车载设备等。便携式可穿 戴设备可为智能手表、智能手环、头戴设备等。服务器120可以用独立的服务 器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种异常交易操作检测方法,该方 法可由终端或服务器执行,以该方法应用于图1中的服务器120为例进行说明, 包括以下步骤:
S202、基于历史交易数据,确定各交易设备分别在多个第一维度下的设备 特征数据,以及各对象分别在多个第二维度下的对象特征数据。
其中,历史交易数据包括多个对象分别在不同的交易设备上进行交易操作 而产生的数据。
在其中一个实施例中,如上文所描述,每个交易设备每次生成交易数据后, 会将交易数据发送给服务器,服务器可将接收到的所有交易数据作为历史交易 数据,或者以交易时间点为依据,从接收到的所有交易数据中提取第一时间段 内多次历史交易操作所产生的交易数据,将提取到的交易数据作为历史交易数 据。上述第一时间段可以为预设历史时间段,预设历史时间段例如可以为近一 周、近一个月或者近一年等,本申请实施例对此不作限定。
在一个实施例中,多个第一维度可以包括交易设备标识、交易设备的位置、 交易设备的型号、交易设备来源、设备每天交易笔数、设备每天交易金额、设 备上交易对象数量、设备上交易对象存在共同社交群组数量、笔均金额等。其 中,交易设备标识、交易设备的位置、交易设备的型号、交易设备来源属于设 备属性维度;设备每天交易笔数属于交易数量维度;设备每天交易金额属于交 易资源维度;设备上交易对象数量、设备上交易对象存在共同社交群组数量属 于交易对象维度,笔均金额属于统计维度。其中,第一维度可以根据实际需求 灵活设定,本申请实施例对此不作限定。
在一个实施例中,服务器在得到历史交易数据和多个第一维度后,可统计 历史交易数据中包含的交易设备,针对每个交易设备,计算该交易设备在多个 第一维度下的设备特征数据。
示例性的,参见表1所示,假设多个第一维度包括:设备每天交易笔数、 设备每天交易金额、设备上交易对象数量、设备上交易对象存在共同社交群组 数量和设备笔均金额,假设历史交易数据为近一个月内的交易数据,服务器统 计近一个月内的交易数据中包含的交易设备,假设统计得到的交易设备包括:abc1、abc2、abc3、abc4和abc5。服务器针对每个交易设备,从历史交易数据 中提取该交易设备近一个月的交易数据,统计该交易设备近一个月的交易数据 的数量,将该数量除以30,得到日均笔数,将该日均笔数作为该交易设备在“设 备每天交易笔数”这一维度下的设备特征数据;计算该交易设备近一个月的交易 数据的交易金额之和,得到总金额,将该总金额除以30,得到日均金额,将该 日均金额作为该交易设备在“设备每天交易金额”这一维度下的设备特征数据;统 计该交易设备近一个月的交易数据的对象数量,将该对象数量作为该交易设备 在“设备上交易对象数量”这一维度下的设备特征数据;查找该交易设备近一个月 的交易数据的对象,统计这些对象的共同社交群组数量,将该数量作为该交易 设备在“设备上交易对象存在共同社交群组数量”这一维度下的设备特征数据,比 如:该交易设备近一个月的交易数据的对象有100个,只要这100个对象中有 两个或者两个以上在同一社交群组,则将该社交群组作为共同社交群组,假设 统计得到这100个对象的共同社交群组有10个,则将10作为该交易设备在“设备上交易对象存在共同社交群组数量”这一维度下的设备特征数据;将上述总金 额除以该交易设备近一个月的交易数据的数量,得到笔均金额,将该笔均金额 作为该交易设备在“设备笔均金额”这一维度下的设备特征数据。按照这种方式可 得到abc1、abc2、abc3、abc4和abc5分别在多个第一维度的设备特征数据,如 表1所示。
需要说明的是:表1中,abc1、abc2、abc3、abc4和abc5仅是设备唯一性 标识码的一种举例,设备唯一性标识码还可以使用其他形式,本申请实施例对 此不作限定。同样,表1中,交易设备的个数以及多个第一维度也是一种举例, 本申请实施例对此也不作限定。
表1
在一个实施例中,对象可以是用户、企业或者交易账号等,本申请实施例 对此不作限定。
在一个实施例中,多个第二维度可以包括:对象标识、对象社交群组信息、 对象所属区域、对象每天交易笔数、每天交易设备量、设备位置数量、交易间 隔时长均值、对象交易平均耗时等。其中,对象标识、对象社交群组信息、对 象所属区域属于对象属性维度;对象每天交易笔数属于交易数量维度;每天交 易设备量、设备位置数量属于交易设备维度;交易间隔时长均值属于交易间隔 维度;对象交易平均耗时属于统计维度。同第一维度,第二维度可以根据实际 需求灵活设定,本申请实施例对此不作限定。
在一个实施例中,服务器在得到历史交易数据和多个第二维度后,可统计 历史交易数据中包含的对象,针对每个对象,计算该对象在多个第二维度下的 对象特征数据。
示例性的,参见表2所示,假设多个第二维度包括:对象每天交易笔数、 每天交易设备量、交易间隔时长均值、设备位置数量和对象交易平均耗时。假 设历史交易数据为近一个月内的交易数据。服务器统计近一个月内的交易数据 中包含的对象,假设统计得到的对象包括:10001、10002、10003、10004和10005。 服务器针对每个对象,从历史交易数据提取该对象近一个月的交易数据,统计 该对象近一个月的交易数据的数量,将该数量除以30,得到日均笔数,将该日 均笔数作为该对象在“对象每天交易笔数”这一维度下的对象特征数据;统计该对 象近一个月的交易数据包含的交易设备总量,将该交易设备总量除以30,得到 日均交易设备量,将该日均交易设备量作为该对象在“每天交易设备量”这一维度下的对象特征数据;按照交易时间点,对该对象近一个月的交易数据进行排序, 基于排序结果,计算相邻两次交易操作相隔的时长,然后求取时长平均值,将 该时长平均值作为该对象在“交易间隔时长均值”这一维度下的对象特征数据;统 计该对象近一个月的交易数据包含的交易设备所在位置,得到位置数量,将该 位置数量作为该对象在“设备位置数量”这一维度下的对象特征数据;统计该对象 近一个月的交易数据包含的交易时长之和,得到交易时长总和,将交易时长总 和除以该对象近一个月的交易数据的数量,得到时长均值,将该时长均值作为 该对象在“对象交易平均耗时”这一维度下的对象特征数据。按照这种方式可得到 10001、10002、10003、10004和10005分别在多个第二维度的对象特征数据, 如表2所示。
需要说明的是:表1中,10001、10002、10003、10004和10005仅是对象 唯一性标识码的一种举例,对象唯一性标识码还可以使用其他形式,本申请实 施例对此不作限定。同样,表1中,对象的个数以及多个第二维度也是一种举 例,本申请实施例对此也不作限定。
表2
S204、根据各交易设备分别在多个第一维度下的设备特征数据,从多个第 一维度中确定第一离群维度。
在其中一个实施例中,服务器可针对每个第一维度,获取各交易设备在该 第一维度下的设备特征数据,然后从这些设备特征数据中找出异常数据,并统 计异常数据的数量。基于各个第一维度对应的异常数据的数量,从多个第一维 度中确定第一离群维度。
S206、获取各交易设备分别在第一离群维度下的目标设备特征数据,并根 据目标设备特征数据,从多个交易设备中确定出异常交易设备集合。
具体地,每个交易设备在第一离群维度下的目标设备特征数据,可以是从 预设历史交易数据中查找到的该第一离群维度下的数据,也可以是基于实际需 求,或者指定预设历史时间段内的历史交易数据中筛选第一离群维度下的数据 得到。
进一步地,对于每个交易设备,服务器在获取到该交易设备在第一离群维 度下的目标设备特征数据后,基于目标设备特征数据,可通过统计学方法,判 断该交易设备是否为异常交易设备,或者通过预先建立的决策树模型,判断该 交易设备是否为异常交易设备,服务器得到各交易设备各自的异常判断结果后, 将多个交易设备中异常的交易设备组成的集合作为异常交易设备集合。
以表1为例,假设从多个第一维度中确定的第一离群维度包括:设备每天 交易笔数、设备上交易对象数量以及设备笔均金额,服务器获取abc1、abc2、 abc3、abc4和abc5分别在这几个维度下的设备特征数据,即表1中第1列数据、 第3列数据和第5列数据,基于这3列数据,从abc1、abc2、abc3、abc4和abc5 中确定出异常交易设备集合。
S208、根据各对象分别在多个第二维度下的对象特征数据,从多个第二维 度中确定第二离群维度。
在其中一个实施例中,服务器可针对每个第二维度,获取各对象在该第二 维度下的对象特征数据,然后从这些对象特征数据中找出异常数据,并统计异 常数据的数量。基于各个第二维度对应的异常数据的数量,从多个第二维度中 确定第二离群维度。
S210、获取各对象分别在第二离群维度下的目标对象特征数据,并根据目 标对象特征数据,从多个对象中确定出异常风险对象集合。
具体的,每个对象在第二离群维度下的目标设备特征数据,可以是从预设 历史交易数据中查找到的该第二离群维度下的数据,也可以是基于实际需求, 或者指定预设历史时间段内的历史交易数据中筛选第二离群维度下的数据得 到。
进一步地,对于每个对象,服务器在获取到该对象在第二离群维度下的目 标设备特征数据后,基于目标设备特征数据,可通过统计学方法,判断该对象 是否为异常风险对象,或者通过预先建立的决策树模型,判断该对象是否为异 常风险对象,服务器得到各对象各自的异常判断结果后,将多个对象中异常的 对象组成的集合作为异常风险对象集合。
以表2为例,假设从多个第二维度中确定的第二离群维度包括:对象每天 交易笔数、每天交易设备量以及设备位置数量。服务器获取10001、10002、10003、 10004和10005分别在这几个维度下的对象特征数据,即表2中第1列数据、第 2列数据和第4列数据,基于这3列数据,从10001、10002、10003、10004和 10005中确定出异常风险对象集合。
需要说明的是:S204-S206可以先于S208-S210执行,或者后于S208-S210 执行,或者和S208-S210同时执行,图2所示执行顺序仅是中示例,本申请实 施例对这两个过程的执行顺序不做限定。
S212、基于异常交易设备集合和异常风险对象集合,确定异常交易操作。
在一个实施例中,如上文所描述,每个交易设备每次生成交易数据后,会 将交易数据发送给服务器,服务器可从接收到的所有交易数据中提取第二时间 段的交易数据,基于第二时间段的交易数据、异常交易设备集合以及异常风险 对象集合,确定异常交易操作。上述第二时间段可以和第一时间段相同,也可 以是第一时间段中的部分时间段,还可以是包括有第一时间段,且范围大于第 一时间段的时间段,本申请实施例对此不作限定。
本申请实施例提供的异常交易操作检测方法,基于各交易设备分别在多个 第一维度下的设备特征数据进行离群点检测,可以初步从多个第一维度中提取 出第一离群维度。相应地,基于各个对象分别在多个第二维度下的对象特征数 据进行离群点检测,可以初步从多个第二维度中提取出第二离群维度。这样, 对于交易设备而言,就可重点根据第一离群维度下的目标设备特征数据,从多 个交易设备中快速且准确地确定出异常交易设备集合。对于交易对象而言,就 可重点根据第二离群维度下的目标对象特征数据,从多个对象中快速且准确地 确定出异常风险对象集合。如此,便能将异常风险对象在异常交易设备上完成 的交易操作确定为异常交易操作,降低了正常交易操作被误判为异常交易操作的风险,大大提高了检测结果的准确性。
在一个实施例中,参见图3所示,根据各交易设备分别在多个第一维度下 的设备特征数据,从多个第一维度中确定第一离群维度,包括:
S301、根据各交易设备分别在多个第一维度下的设备特征数据,确定每个 第一维度下的设备特征数据的分布情况,并根据该分布情况确定每个第一维度 下的异常数据。
对于每个第一维度,服务器可通过以下方式确定分布情况,比如:分布情 况可以通过统计学的方式计算统计参数(比如均值、方差、中位数、众数等) 得到;也可通过建立数据轴或坐标系的方式,进行描点绘制相应的分布图得到; 还可以基于设备特征数据进行热力图绘制,基于热力图得到对应的分布情况。
S302、根据每个第一维度下的异常数据的数量,从多个第一维度中筛选出 异常数据的数量满足第一预设条件的第一维度,作为第一离群维度。
在一个实施例中,服务器在得到每个第一维度下的异常数据的数量后,可 从多个第一维度中筛选出异常数据的数量大于预设值的第一维度,作为第一离 群维度,预设值可根据实际情况灵活设定,本申请实施例对此不做限定。
在一个实施例中,服务器在得到每个第一维度下的异常数据的数量后,可 按照异常数据的数量从多到少的顺序,对多个第一维度进行排序,将排在前面 的N个第一维度作为第一离群维度,N可根据实际情况灵活设定,本申请实施 例对此不做限定。
上述实施例中,第一维度下设备特征数据的分布情况可以反映某一设备特 征数据和其他设备特征数据的偏离程度,基于该分布情况确定的异常数据更加 准确,进而,基于异常数据的数量,筛选出来的第一离群维度也更加准确。
在一个实施例中,根据各交易设备分别在多个第一维度下的设备特征数据, 确定每个第一维度下的设备特征数据的分布情况,并根据分布情况确定每个第 一维度下的异常数据,包括:根据各交易设备分别在多个第一维度下的设备特 征数据,确定每个第一维度分别对应的均值和标准差;根据各第一维度对应的 均值和标准差,确定各第一维度分别对应的异常阈值;根据各第一维度下的设 备特征数据和各第一维度各自所对应的异常阈值,确定各第一维度下的异常数 据。
在一个实施例中,参见图4所示,在正态分布中,数值分布在(μ-σ,μ+σ) 中的概率为0.6526;数值分布在(μ-2σ,μ+2σ)中的概率为0.9544;数值分布 在(μ-3σ,μ+3σ)中的概率为0.9974,其中,σ代表标准差,μ代表均值。由于 “小概率事件”通常指发生的概率小于5%的事件,而从图4可知,数值分布在 (μ-3σ,μ+3σ)以外的概率小于千分之三,因此,可将μ-3σ和μ+3σ作为小概 率事件的判定阈值。
因此,本申请实施例中,服务器可基于根据各交易设备分别在多个第一维 度下的设备特征数据,确定每个第一维度分别对应的均值和标准差。在得到每 个第一维度分别对应的均值和标准差后,对于每个第一维度,可计算,μ-3σ和 μ+3σ,将μ-3σ和μ+3σ作为该第一维度的异常阈值,对于该第一维度下的每个 设备特征数据,判断该设备特征数据是否在(μ-3σ,μ+3σ)这一区间内,若在, 则确定该设备特征数据为正常数据,若不在,则确定该设备特征数据为异常数 据,由此便可得到该第一维度下的异常数据。
下面举例说明:
结合表1,表1示出了5个第一维度,以“设备每天交易笔数”这一维度为例, 表1中各交易设备在这一维度下的设备特征数据分别是:1000、2000、1500、 5000、2000,服务器计算这些设备特征数据的均值μ和标准差σ,将μ-3σ和μ+3σ 作为异常阈值,对于1000、2000、1500、5000、2000中的每个设备特征数据, 判断该设备特征数据是否在(μ-3σ,μ+3σ)范围内,若不在,则确定该设备特 征数据为异常数据,由此便可得到“设备每天交易笔数”这一维度下的异常数据。
上述实施例中,在统计工作中,均值和标准差是描述数据集中趋势和离散 程度的两个最重要的测度值,基于均值和标准差确定的异常阈值,筛选出来的 异常数据满足小概率事件的基本假设,准确度较高。
在一个实施例中,从多个第一维度中确定出的第一离群维度有多个,这里 的多个指的是两个或者两个以上,参见图5所示,根据目标设备特征数据,从 多个交易设备中确定出异常交易设备集合,包括:
S501、获取每个第一离群维度分别对应的异常阈值。
在一个实施例中,服务器可根据各交易设备分别在多个第一维度下的设备 特征数据,确定每个第一维度分别对应的均值和标准差;根据各第一维度对应 的均值和标准差,确定各第一维度分别对应的异常阈值;根据各第一维度下的 设备特征数据和各第一维度各自所对应的异常阈值,确定各第一维度下的异常 数据,根据每个第一维度下的异常数据的数量,从多个第一维度中筛选出异常 数据的数量满足第一预设条件的第一维度,作为第一离群维度。上述过程中已 经得到各第一维度分别对应的异常阈值,服务器在确定出第一离群维度后,从 各第一维度分别对应的异常阈值中,查找每个第一离群维度分别对应的异常阈 值。
S502、根据每个第一离群维度下的目标设备特征数据、以及每个第一离群 维度各自所对应的异常阈值,确定每个交易设备分别在各第一离群维度下的异 常判断结果。
在一个实施例中,对于每个第一离群维度,服务器可基于第一离群维度对 应的异常阈值,确定异常范围,可根据交易设备在每个第一离群维度下的目标 设备特征数据、以及每个第一离群维度各自所对应的异常范围,确定交易设备 分别在各第一离群维度下的异常判断结果。
在一个实施例中,第一离群维度对应的异常阈值可以包括:μ-3σ和μ+3σ, 其中,μ为第一离群维度下设备特征数据的均值,σ为第一离群维度下设备特征 数据的标准差,基于异常阈值确定的异常范围可以包括:(-∞,μ-3σ)和(μ+3σ, +∞)。
在一个实施例中,服务器可获取各交易设备分别在多个第一离群维度下的 目标设备特征数据,对于每个交易设备,将交易设备在每个第一离群维度下的 目标设备特征数据和相应维度对应的异常范围进行比较,若目标设备特征数据 在异常范围内,则确定交易设备在相应离群维度下是异常的,由此,可得到交 易设备在各第一离群维度下的异常判断结果。
下面举例说明:
以表1为例,假设服务器从多个第一维度中确定的第一离群维度包括:设 备每天交易笔数、设备上交易对象数量以及设备笔均金额,“设备每天交易笔数” 这一维度对应的异常阈值包括:μ1-3σ1和μ1+3σ1。“设备上交易对象数量”这一维 度对应的异常阈值包括:μ2-3σ2和μ2+3σ2。“设备笔均金额”这一维度对应的异常 阈值包括:μ3-3σ3和μ3+3σ3。服务器可将(-∞,μ1-3σ1)和(μ1+3σ1,+∞)作为“设 备每天交易笔数”这一维度对应的异常范围。可将(-∞,μ2-3σ2)和(μ2+3σ2,+∞) 作为“设备上交易对象数量”这一维度对应的异常范围。可将(-∞,μ3-3σ3)和 (μ3+3σ3,+∞)作为“设备笔均金额”这一维度对应的异常范围。对于每个交易设备,以表1中abc2为例,abc2在“设备每天交易笔数”这一维度下的目标设备 特征数据为2000,在“设备上交易对象数量”这一维度下的目标设备特征数据为 300,在“设备笔均金额”这一维度下的目标设备特征数据为0.1,服务器可判断 2000是否在(-∞,μ1-3σ1)或(μ1+3σ1,+∞)范围内,若在,则确定abc2在“设 备每天交易笔数”这一维度下是异常的,若不在,则确定abc2在“设备每天交易 笔数”这一维度下是正常的;判断300是否在(-∞,μ2-3σ2)或(μ2+3σ2,+∞) 范围内,若在,则确定abc2在“设备上交易对象数量”这一维度下是异常的,若不在,则确定abc2在“设备上交易对象数量”这一维度下是正常的;判断0.1是 否在(-∞,μ3-3σ3)或(μ3+3σ3,+∞)范围内,若在,则确定abc2在“设备笔均 金额”这一维度下是异常的,若不在,则确定abc2在“设备笔均金额”这一维度下 是正常的。采用同样的方法,可以得到abc1、abc3、abc4、abc5分别在“设备每 天交易笔数”、“设备上交易对象数量”、“设备笔均金额”下的异常判断结果。
S503、根据每个交易设备分别在各第一离群维度下的异常判断结果,确定 每个交易设备的异常判断结果。
S504、根据各交易设备各自的异常判断结果,从多个交易设备中确定出异 常交易设备集合。
在一个实施例中,服务器在得到每个交易设备分别在各第一离群维度下的 异常判断结果后,对于每个交易设备,从交易设备在各第一离群维度下的异常 判断结果中,统计异常结果的数量,然后计算异常结果的数量和第一离群维度 数量的比例,若该比例大于预设阈值,则确定交易设备是异常的,若该比例小 于或者等于预设阈值,则确定交易设备是正常的,采用同样的方法,可以得到 所有交易设备的异常判断结果,基于各交易设备各自的异常判断结果,筛选得 到异常交易设备集合。
下面举例说明:
结合S502的例子,以abc2为例,假设预设阈值为0.8,经过判断,abc2在 “设备每天交易笔数”这一维度下是异常的,在“设备上交易对象数量”这一维度下 是异常的,在“设备笔均金额”这一维度下是正常的,异常结果的数量为2,第一 离群维度数量为3,异常结果的数量和第一离群维度数量的比例为2/3,由于2/3 小于0.8,则确定abc2是异常的。采用同样的方法,可以得到abc1、abc3、abc4、 abc5各自的异常判断结果,假设abc1的异常判断结果为正常,abc2的异常判断 结果为异常,abc3的异常判断结果为正常,abc4的异常判断结果为异常,abc5 的异常判断结果为正常,则可将abc2、abc4构成的集合作为异常交易设备集合。
上述实施例中,对于每个交易设备,获取交易设备在每个第一离群维度下 的异常判断结果,统计其中异常结果所占的比例,当该比例超过预设阈值时, 则确定交易设备为异常交易设备,该方法从多个第一离群维度确定交易设备是 否为异常交易设备,和一些实施例中,仅使用一个维度确定交易设备是否为异 常交易设备的方式相比,结果更加准确。
在一个实施例中,从多个第一维度中确定出的第一离群维度有多个,这里 的多个指的是两个或者两个以上,参见图6所示,根据目标设备特征数据,从 多个交易设备中确定出异常交易设备集合,包括:
S601、获取预先构建的第一决策树模型,第一决策树模型包括第一根节点、 多个第一中间节点、以及多个第一叶子节点。
S602、对于每个交易设备,依据相应交易设备所对应的各个第一离群维度 下的目标设备特征数据,从第一决策树模型的第一根节点开始,不断地自上向 下从第一决策树模型中查找与交易设备相匹配的第一目标中间节点,直至达到 第一目标叶子节点时为止。
S603、根据第一决策树模型的第一目标叶子节点所对应的分类标签,确定 与相应交易设备对应的异常判断结果。
其中,分类标签用于指示交易设备正常或者异常。
其中,第一根节点和第一中间节点用于对交易设备在各个第一离群维度下 的目标设备特征数据进行分支判断,第一叶子节点用于存储分类标签。具体地, 可获取构建好的第一决策树模型,进而将交易设备在各个第一离群维度下的目 标设备特征数据输入至第一决策树模型中,从第一决策树模型的第一根节点开 始遍历,根据交易设备在每个第一离群维度下的目标设备特征数据与第一决策 树模型中相应维度所对应的节点的特征数据进行比较,根据比较结果选择选择 子树分支,该子树分支即为匹配的第一目标中间节点,继续进行迭代,直到到 达叶子节点后停止。可以理解,到达的叶子节点也就是第一目标叶子节点,基 于该第一目标叶子节点中存储的分类标签,确定交易设备对应的异常判断结果。
在一个实施例中,对于每个交易设备,依据相应交易设备所对应的各个第 一离群维度下的目标设备特征数据,从第一决策树模型的第一根节点开始,不 断地自上向下从第一决策树模型中查找与交易设备相匹配的第一目标中间节 点,直至达到第一目标叶子节点时为止,包括:从第一决策树模型的第一根节 点开始,根据与第一根节点所对应第一离群维度下的目标设备特征数据,以及 第一根节点所对应的特征数据,确定下一层的第一目标中间节点;根据与下一 层的第一目标内部节点所对应第一离群维度下的目标设备特征数据,以及下一 层的第一目标中间节点所对应的特征数据,确定再下一层的第一目标中间节点, 并不断往下查找与交易设备相匹配的第一目标中间节点,直至达到第一目标叶 子节点时为止。
在一个实施例中,第一根节点所对应的特征数据可以包括:与第一根节点 所对应第一离群维度所对应的异常范围,异常范围的求取可参加前述实施例。 同样的,下一层的第一目标中间节点所对应的特征数据可以包括:与下一层的 第一目标中间节点所对应第一离群维度所对应的异常范围。
在一个实施例中,通过第一决策树模型对交易设备在各个第一离群维度下 的目标设备特征数据进行分类处理时,从第一决策树模型的第一根节点开始, 根据各个第一离群维度中与第一根节点所对应的维度下的目标设备特征数据, 来确定接下来的分支路径,也就是确定下一层的第一目标中间节点。然后再根 据各个第一离群维度中与下一层的第一目标中间节点所对应的维度下的目标设 备特征数据,确定后面的分支路径,这样逐层进行分支判断,直至达到第一目 标叶子节点时为止。基于到达的第一目标叶子节点中存储的分类标签,确定交 易设备对应的异常判断结果。
示例性的,参见图7,该第一决策树模型包括有第一根节点a、第一中间节 点b-d、以及第一叶子节点P1-P5。第一叶子节点P1、第一叶子节点P2、第一叶 子节点P3、第一叶子节点P4存储的分类标签均为异常,第一叶子节点P5存储的 分类标签为正常,第一根节点a对应“设备上交易对象存在共同社交群组数量” 这一维度,第一中间节点b对应“笔均金额”这一维度,第一中间节点c对应 “设备每天交易笔数”这一维度,第一中间节点d对应“设备上交易对象数量” 这一维度,第一根节点a对应的特征数据包括:“设备上交易对象存在共同社交群组数量”这一维度所对应的异常范围(图7中使用(-∞,μ1-3σ1)和(μ1+3σ1, +∞)表示)。第一中间节点b-d对应的特征数据参见图7所示,在此不再赘述。 服务器得到交易设备在各第一离群维度下的目标设备特征数据后,获取与第一 根节点a对应的第一离群维度下的目标设备特征数据,即,获取交易设备在“设 备上交易对象存在共同社交群组数量”这一维度下的目标设备特征数据,判断 该目标设备特征数据是否在(-∞,μ1-3σ1)或(μ1+3σ1,+∞)范围内,若在,则 达到第一目标叶子节点P1,由于第一目标叶子节点P1存储的分类标签为异常, 则确定当前交易设备为异常交易设备,若目标设备特征数据不在(-∞,μ1-3σ1) 和(μ1+3σ1,+∞)范围内,则达到第一目标中间节点b,在第一目标节点b做类 似的处理,直到走到第一目标叶子节点,基于第一目标叶子节点存储的分类标 签,确定交易设备对应的异常判断结果。
需要说明的是:图7仅是第一决策树模型的一个示例,第一决策树模型还 可以是其他结构,图7所示结构不构成对本申请实施例的限制。
S604、根据各交易设备各自的异常判断结果,从多个交易设备中确定异常 交易设备集合。
在一个实施例中,服务器得到各交易设备的异常判断结果后,基于各交易 设备各自的异常判断结果,筛选得到异常交易设备集合。
下面举例说明:
结合表1,假设利用第一决策树模型,对abc1在多个第一离群维度下的目 标设备特征数据进行分支判断后,确定abc1为正常,同样的方式,确定abc3和 abc5为正常,abc2和abc4为异常,则可将abc2、abc4构成的集合作为异常交 易设备集合。
上述实施例中,通过预先构建的第一决策树模型来判断每个交易设备是否 为异常交易设备,由于第一决策树模型包括第一根节点、第一中间节点和第一 叶子节点,第一决策树模型会对交易设备做多个维度的判断,和一些实施例中, 仅使用一个维度确定交易设备是否为异常交易设备的方式相比,结果更加准确。
在一个实施例中,第一决策树模型的构建步骤包括:获取与各设备样本分 别对应的第一样本集和第一分类标签,第一样本集包括各设备样本分别在各第 一离群维度下的设备特征样本数据;根据各设备样本在各第一离群维度下的设 备特征样本数据、以及各设备样本的第一分类标签,确定各第一离群维度分别 对应的信息增益;基于各第一离群维度分别对应的信息增益,从多个第一离群 维度中选择目标第一离群维度作为分类特征以创建第一根节点,根据第一根节 点下的设备特征样本数据和各设备特征样本数据各自对应的第一分类标签,创 建第一中间节点和第一叶子节点;根据创建的第一根节点、第一根节点之下的 第一中间节点、以及第一叶子节点,确定第一决策树模型。
在一个实施例中,根据各设备样本在各第一离群维度下的设备特征样本数 据、以及各设备样本的第一分类标签,确定各第一离群维度分别对应的信息增 益,包括:根据各设备样本在各第一离群维度下的设备特征样本数据,统计每 个第一离群维度下的设备特征样本数据,对于每个第一离群维度,根据第一离 群维度下的各设备特征样本数据各自对应的第一分类标签,确定第一分类标签 为正常的设备特征样本数据所占的第一比例,以及第一分类标签为异常的设备 特征样本数据所占的第二比例,基于第一比例和第二比例确定第一样本集的信 息熵,基于第一样本集的信息熵,确定各第一离群维度分别对应的信息增益。
在一个实施例中,基于第一比例和第二比例确定第一样本集的信息熵,包 括:
采用如下公式确定第一样本集的信息熵:
其中,|y|表示第一分类标签的种类,本申请实施例中,第一分类标签有正 常和异常两种,因此|y|=2,Ent(D)=-p1log2p1-p2log2p2,p1和p2分别为第一比 例和第二比例。
在一个实施例中,基于第一样本集的信息熵,确定各第一离群维度分别对 应的信息增益,包括:
对于每个第一离群维度,根据第一离群维度下的各设备特征样本数据,确 定各设备特征样本数据对应的类别,获取每个类别下设备特征样本数据的数量 以及每个类别对应的信息熵,基于第一样本集的信息熵、每个类别下设备特征 样本数据的数量、以及每个类别对应的信息熵,确定第一离群维度对应的信息 增益。示例性的,可基于第一离群维度下的所有设备特征样本数据,计算所有 设备特征样本数据的均值和方差,基于该均值和方差,将第一离群维度下的所 有设备特征样本数据分为两类,其中,属于(μ-3σ,μ+3σ)范围内的设备特征 样本数据为一类,不属于(μ-3σ,μ+3σ)范围内的设备特征样本数据为另一类。
其中,获取每个类别对应的信息熵的过程和前述实施例中获取第一样本集 的信息熵的过程类似,在此不再赘述。
在一个实施例中,基于第一样本集的信息熵、每个类别下设备特征样本数 据的数量、以及每个类别对应的信息熵,确定第一离群维度对应的信息增益, 包括:
采用如下公式确定第一离群维度对应的信息增益:
其中,V表示第一离群维度下的各设备特征样本数据对应的类别的数量, Ent(D)表示第一样本集的信息熵,Dv表示每个类别下设备特征样本数据的数量, Ent(Dv)表示每个类别对应的信息熵,D表示设备样本的数量。
在一个实施例中,基于各第一离群维度分别对应的信息增益,从多个第一 离群维度中选择目标第一离群维度作为分类特征以创建第一根节点,包括:
将多个第一离群维度中信息增益最大的第一离群维度作为目标第一离群维 度,以目标第一离群维度作为分类特征以创建第一根节点,也就是说,第一根 节点和目标第一离群维度对应。
在一个实施例中,根据第一根节点下的设备特征样本数据和各设备特征样 本数据各自对应的第一分类标签,创建第一中间节点和第一叶子节点,包括: 按照第一根节点下的设备特征样本数据的取值,对第一根节点下的设备特征样 本数据进行分类,针对每个类别,获取该类别对应的设备样本,并获取该类别 对应的设备样本在除了目标第一离群维度以外,其他第一离群维度下的设备特 征样本数据,从各设备特征样本数据各自对应的第一分类标签中,获取该类别 对应的设备样本所对应的第一分类标签,基于该类别对应的设备样本在其他第 一离群维度下的设备特征样本数据,以及该类别对应的设备样本所对应的第一 分类标签,计算其他第一离群维度中各第一离群维度的信息增益,基于其他第 一离群维度中各第一离群维度的信息增益,确定该类别对应的中间节点(第一 中间节点),以此类推,直至得到第一叶子节点。其中,计算其他第一离群维 度中各第一离群维度的信息增益的过程,以及基于其他第一离群维度中各第一 离群维度的信息增益,确定中间节点的过程,可参见上述实施例中创建第一根 节点的过程。其中,对第一根节点下的设备特征样本数据进行分类的方式,可 参见前述实施例中将第一离群维度下的所有设备特征样本数据分为两类的方 式。在此不再赘述。
由于,信息增益越大,就意味着使用该第一离群维度来进行划分所得到的 “纯度提升”越大,上述实施例中,在从多个第一维度筛选出多个第一离群维 度的基础上,计算每个第一离群维度的信息增益,基于信息增益,构建第一决 策树模型,得到的第一决策树模型的分类准确度较高。
在一个实施例中,参见图8所示,根据各对象分别在多个第二维度下的对 象特征数据,从多个第二维度中确定第二离群维度,包括:
S801、根据各对象分别在多个第二维度下的对象特征数据,确定每个第二 维度下的对象特征数据的分布情况,并根据分布情况确定每个第二维度下的异 常数据。
对于每个第二维度,服务器可通过以下方式确定分布情况,比如:分布情 况可以通过统计学的方式计算统计参数(比如均值、方差、中位数、众数等) 得到;也可通过建立数据轴或坐标系的方式,进行描点绘制相应的分布图得到; 还可以基于设备特征数据进行热力图绘制,基于热力图得到对应的分布情况。
S802、根据每个第二维度下的异常数据的数量,从多个第二维度中筛选出 异常数据的数量满足第二预设条件的第二维度,作为第二离群维度。
在一个实施例中,服务器在得到每个第二维度下的异常数据的数量后,可 从多个第二维度中筛选出异常数据的数量大于预设值的第二维度,作为第一离 群维度,预设值可根据实际情况灵活设定,本申请实施例对此不做限定。
在一个实施例中,服务器在得到每个第二维度下的异常数据的数量后,可 按照异常数据的数量从多到少的顺序,对多个第二维度进行排序,将排在前面 的N个第二维度作为第二离群维度,N可根据实际情况灵活设定,本申请实施 例对此不做限定。
上述实施例中,第二维度下对象特征数据的分布情况可以反映某一对象特 征数据和其他对象特征数据的偏离程度,基于该分布情况确定的异常数据更加 准确,进而,基于异常数据的数量,筛选出来的第二离群维度也更加准确。
在一个实施例中,根据各对象分别在多个第二维度下的对象特征数据,确 定每个第二维度下的对象特征数据的分布情况,并根据分布情况确定每个第二 维度下的异常数据,包括:根据各对象分别在多个第二维度下的对象特征数据, 确定每个第二维度分别对应的均值和标准差;根据各第二维度对应的均值和标 准差,确定各第二维度对应的异常阈值;根据各第二维度下的对象特征数据和 各第二维度各自所对应的异常阈值,确定各第二维度下的异常数据。
在一个实施例中,服务器可基于根据各对象分别在多个第二维度下的设备 特征数据,确定每个第二维度分别对应的均值和标准差。在得到每个第二维度 分别对应的均值和标准差后,对于每个第二维度,可计算,μ-3σ和μ+3σ,将μ-3σ 和μ+3σ作为该第二维度的异常阈值,对于该第二维度下的每个对象特征数据, 判断该对象特征数据是否在(μ-3σ,μ+3σ)这一区间内,若在,则确定该对象 特征数据为正常数据,若不在,则确定该对象特征数据为异常数据,由此便可 得到该第二维度下的异常数据。
下面举例说明:
结合表2,表2示出了5个第二维度,以“对象每天交易笔数”这一维度为例, 表2中各对象在这一维度下的对象特征数据分别是:100、200、150、10、5, 服务器计算这些对象特征数据的均值μ和标准差σ,将μ-3σ和μ+3σ作为异常阈 值,对于100、200、150、10、5中的每个对象特征数据,判断该对象特征数据 是否在(μ-3σ,μ+3σ)范围内,若不在,则确定该对象特征数据为异常数据, 由此便可得到“对象每天交易笔数”这一维度下的异常数据。
上述实施例中,在统计工作中,均值和标准差是描述数据集中趋势和离散 程度的两个最重要的测度值,基于均值和标准差确定的异常阈值,筛选出来的 异常数据满足小概率事件的基本假设,准确度较高。
在一个实施例中,从多个第二维度中确定出的第二离群维度有多个,这里 的多个指的是两个或者两个以上,参见图9所示,根据目标对象特征数据,从 多个对象中确定出异常风险对象集合,包括:
S901、获取每个第二离群维度分别对应的异常阈值。
在一个实施例中,服务器可根据各对象分别在多个第二维度下的对象特征 数据,确定每个第二维度分别对应的均值和标准差;根据各第二维度对应的均 值和标准差,确定各第二维度分别对应的异常阈值;根据各第二维度下的对象 特征数据和各第二维度各自所对应的异常阈值,确定各第二维度下的异常数据, 根据每个第二维度下的异常数据的数量,从多个第二维度中筛选出异常数据的 数量满足第二预设条件的第二维度,作为第二离群维度。上述过程中已经得到 各第二维度分别对应的异常阈值,服务器在确定出第二离群维度后,从各第二 维度分别对应的异常阈值中,查找每个第二离群维度分别对应的异常阈值。
S902、根据每个第二离群维度下的目标对象特征数据、以及每个第二离群 维度各自所对应的异常阈值,确定每个对象分别在各第二离群维度下的异常判 断结果。
在一个实施例中,对于每个第二离群维度,服务器可基于第二离群维度对 应的异常阈值,确定异常范围,可根据对象在每个第二离群维度下的目标对象 特征数据、以及每个第二离群维度各自所对应的异常范围,确定对象分别在各 第二离群维度下的异常判断结果。
在一个实施例中,第二离群维度对应的异常阈值可以包括:μ-3σ和μ+3σ, 其中,μ为第二离群维度下设备特征数据的均值,σ为第二离群维度下设备特征 数据的标准差,基于异常阈值确定的异常范围可以包括:(-∞,μ-3σ)和(μ+3σ, +∞)。
在一个实施例中,服务器可获取各对象分别在多个第二离群维度下的目标 对象特征数据,对于每个对象,将对象在每个第二离群维度下的目标对象特征 数据和相应维度对应的异常范围进行比较,若目标对象特征数据在异常范围内, 则确定对象在相应离群维度下是异常的,由此,可得到对象在各第一离群维度 下的异常判断结果。
下面举例说明:
以表2为例,假设服务器从多个第二维度中确定的第二离群维度包括:对 象每天交易笔数、每天交易设备量以及设备位置数量,“对象每天交易笔数”这一 维度对应的异常阈值包括:μ1-3σ1和μ1+3σ1。“每天交易设备量”这一维度对应的 异常阈值包括:μ2-3σ2和μ2+3σ2。“设备位置数量”这一维度对应的异常阈值包括: μ3-3σ3和μ3+3σ3。服务器可将(-∞,μ1-3σ1)和(μ1+3σ1,+∞)作为“对象每天交 易笔数”这一维度对应的异常范围。可将(-∞,μ2-3σ2)和(μ2+3σ2,+∞)作为“每 天交易设备量”这一维度对应的异常范围。可将(-∞,μ3-3σ3)和(μ3+3σ3,+∞) 作为“设备位置数量”这一维度对应的异常范围。对于每个对象,以表2中10002 为例,10002在“对象每天交易笔数”这一维度下的目标对象特征数据为200,在 “每天交易设备量”这一维度下的目标对象特征数据为20,在“设备位置数量”这 一维度下的目标对象特征数据为1,服务器可判断200是否在(-∞,μ1-3σ1)或 (μ1+3σ1,+∞)范围内,若在,则确定10002在“对象每天交易笔数”这一维度 下是异常的,若不在,则确定10002在“对象每天交易笔数”这一维度下是正常的; 判断20是否在(-∞,μ2-3σ2)或(μ2+3σ2,+∞)范围内,若在,则确定10002 在“每天交易设备量”这一维度下是异常的,若不在,则确定10002在“每天交易 设备量”这一维度下是正常的;判断1是否在(-∞,μ3-3σ3)或(μ3+3σ3,+∞) 范围内,若在,则确定10002在“设备位置数量”这一维度下是异常的,若不在, 则确定10002在“设备位置数量”这一维度下是正常的。采用同样的方法,可以得 到10001、10003、10004、10005分别在“对象每天交易笔数”、“每天交易设备量”、 “设备位置数量”下的异常判断结果。
S903、根据每个对象分别在各第二离群维度下的异常判断结果,确定每个 对象的异常判断结果。
S904、根据各对象各自的异常判断结果,从多个对象中确定出异常风险对 象集合。
在一个实施例中,服务器在得到每个对象分别在各第二离群维度下的异常 判断结果后,对于每个对象,从对象在各第二离群维度下的异常判断结果中, 统计异常结果的数量,然后计算异常结果的数量和第二离群维度数量的比例, 若该比例大于预设阈值,则确定对象是异常的,若该比例小于或者等于预设阈 值,则确定对象是正常的,采用同样的方法,可以得到所有对象的异常判断结 果,基于各对象各自的异常判断结果,筛选得到异常风险对象集合。
下面举例说明:
结合S902的例子,以10002为例,假设预设阈值为0.8,经过判断,10002 在“对象每天交易笔数”这一维度下是异常的,在“每天交易设备量”这一维度下是 异常的,在“设备位置数量”这一维度下是正常的,异常结果的数量为2,第二离 群维度数量为3,异常结果的数量和第二离群维度数量的比例为2/3,由于2/3 小于0.8,则确定10002是异常的。采用同样的方法,可以得到10001、10003、 10004、10005各自的异常判断结果,假设10001的异常判断结果为正常,10002 的异常判断结果为异常,10003的异常判断结果为正常,10004的异常判断结果 为异常,10005的异常判断结果为正常,则可将10002、10004构成的集合作为 异常风险对象集合。
上述实施例中,对于每个对象,获取对象在每个第二离群维度下的异常判 断结果,统计其中异常结果所占的比例,当该比例超过预设阈值时,则确定对 象为异常风险对象,该方法从多个第二离群维度确定对象是否为异常风险对象, 和一些实施例中,仅使用一个维度确定对象是否为异常风险对象的方式相比, 结果更加准确。
在一个实施例中,从多个第二维度中确定出的第二离群维度有多个,这里 的多个指的是两个或者两个以上,参见图10所示,根据目标对象特征数据,从 多个对象中确定出异常风险对象集合,包括:
S1001、获取预先构建的第二决策树模型,第二决策树模型包括第二根节点、 多个第二中间节点、以及多个第二叶子节点。
S1002、对于每个对象,依据相应对象所对应的各个第二离群维度下的目标 设备特征数据,从第二决策树模型的第二根节点开始,不断地自上向下从第二 决策树模型中查找与对象相匹配的第二目标中间节点,直至达到第二目标叶子 节点时为止。
S1003、根据第二决策树模型的第二目标叶子节点所对应的分类标签,确定 与相应对象对应的异常判断结果。
其中,分类标签用于指示对象正常或者异常。
其中,第二根节点和第二中间节点用于对对象在各个第二离群维度下的目 标对象特征数据进行分支判断,第二叶子节点用于存储分类标签。具体地,可 获取构建好的第二决策树模型,进而将对象在各个第二离群维度下的目标对象 特征数据输入至第二决策树模型中,从第二决策树模型的第二根节点开始遍历, 根据对象在每个第二离群维度下的目标对象特征数据与第二决策树模型中相应 维度所对应的节点的特征数据进行比较,根据比较结果选择选择子树分支,该 子树分支即为匹配的第二目标中间节点,继续进行迭代,直到到达叶子节点后 停止。可以理解,到达的叶子节点也就是第二目标叶子节点,基于该第二目标 叶子节点中存储的分类标签,确定对象对应的异常判断结果。
在一个实施例中,对于每个对象,依据相应对象所对应的各个第二离群维 度下的目标对象特征数据,从第二决策树模型的第二根节点开始,不断地自上 向下从第二决策树模型中查找与对象相匹配的第二目标中间节点,直至达到第 二目标叶子节点时为止,包括:从第二决策树模型的第二根节点开始,根据与 第二根节点所对应第二离群维度下的目标对象特征数据,以及第二根节点所对 应的特征数据,确定下一层的第二目标中间节点;根据与下一层的第二目标中 间节点所对应第二离群维度下的目标对象特征数据,以及下一层的第二目标中 间节点所对应的特征数据,确定再下一层的第二目标中间节点,并不断往下查 找与对象相匹配的第二目标中间节点,直至达到第二目标叶子节点时为止。
在一个实施例中,第二根节点所对应的特征数据可以包括:与第二根节点 所对应第二离群维度所对应的异常范围,异常范围的求取可参加前述实施例。 同样的,下一层的第二目标中间节点所对应的特征数据可以包括:与下一层的 第二目标中间节点所对应第二离群维度所对应的异常范围。
在一个实施例中,通过第二决策树模型对对象在各个第二离群维度下的目 标对象特征数据进行分类处理时,从第二决策树模型的第二根节点开始,根据 各个第二离群维度中与第二根节点所对应的维度下的目标对象特征数据,来确 定接下来的分支路径,也就是确定下一层的第二目标中间节点。然后再根据各 个第二离群维度中与下一层的第二目标中间节点所对应的维度下的目标对象特 征数据,确定后面的分支路径,这样逐层进行分支判断,直至达到第二目标叶 子节点时为止。基于到达的第二目标叶子节点中存储的分类标签,确定对象对 应的异常判断结果。
示例性的,参见图11,该第二决策树模型包括有第二根节点a1、第二中间 节点b1-d1、以及第二叶子节点L1-L5。第二叶子节点L1、第二叶子节点L2、第 二叶子节点L3、第二叶子节点L4存储的分类标签均为异常,第二叶子节点L5存储的分类标签为正常,第二根节点a对应“设备位置数量”这一维度,第二 中间节点b对应“交易间隔时长均值”这一维度,第二中间节点c对应“对象 每天交易笔数”这一维度,第二中间节点d对应“每天交易设备量”这一维度, 第二根节点a对应的特征数据包括:“设备位置数量”这一维度所对应的异常 范围(图11中使用(-∞,μ1-3σ1)和(μ1+3σ1,+∞)表示)。第二中间节点b-d 对应的特征数据参见图11所示,在此不再赘述。在得到对象在各第二离群维度 下的目标对象特征数据后,获取与第二根节点a对应的第二离群维度下的目标 对象特征数据,即,获取对象在“设备位置数量”这一维度下的目标对象特征 数据,判断该目标对象特征数据是否在(-∞,μ1-3σ1)或(μ1+3σ1,+∞)范围内, 若在,则达到第二目标叶子节点L1,由于第二目标叶子节点L1存储的分类标签 为异常,则确定当前对象为异常风险对象,若目标对象特征数据不在(-∞,μ1-3σ1)和(μ1+3σ1,+∞)范围内,则达到第二目标中间节点b1,在第二目标节点b1 做类似的处理,直到走到第二目标叶子节点,基于第二目标叶子节点存储的分 类标签,确定对象对应的异常判断结果。
需要说明的是:图11仅是第二决策树模型的一个示例,第二决策树模型还 可以是其他结构,图11所示结构不构成对本申请实施例的限制。
S1004、根据各对象各自的异常判断结果,从多个对象中确定出异常风险对 象集合。
在一个实施例中,服务器得到各对象的异常判断结果后,基于各对象各自 的异常判断结果,筛选得到异常风险对象集合。
下面举例说明:
结合表2,假设利用第二决策树模型,对10001在多个第二离群维度下的目 标对象特征数据进行分支判断后,确定10001为正常,同样的方式,确定10003 和10005为正常,10002和10004为异常,则可将10002和10004构成的集合作 为异常风险对象集合。
上述实施例中,通过预先构建的第二决策树模型来判断每个交易设备是否 为异常风险对象,由于第二决策树模型包括第二根节点、第二中间节点和第二 叶子节点,第二决策树模型会对对象做多个维度的判断,和一些实施例中,仅 使用一个维度确定对象是否为异常风险对象的方式相比,结果更加准确。
在一个实施例中,第二决策树模型的构建步骤包括:获取与各对象样本分 别对应的第二样本集和第二分类标签,第二样本集包括各设备样本分别在各第 二离群维度下的对象特征样本数据;根据各对象样本在各第二离群维度下的对 象特征样本数据、以及各对象样本的第二分类标签,确定各第二离群维度分别 对应的信息增益;基于各第二离群维度分别对应的信息增益,从多个第二离群 维度中选择目标第二离群维度作为分类特征以创建第二根节点,根据第二根节 点下的对象特征样本数据和各对象特征样本数据各自对应的第二分类标签,创 建第二中间节点和第二叶子节点;根据创建的第二根节点、第二根节点之下的 第二中间节点、以及第二叶子节点,确定第二决策树模型。
在一个实施例中,根据各对象样本在各第二离群维度下的对象特征样本数 据、以及各对象样本的第二分类标签,确定各第二离群维度分别对应的信息增 益,包括:根据各对象样本在各第二离群维度下的对象特征样本数据,统计每 个第二离群维度下的对象特征样本数据,对于每个第二离群维度,根据第二离 群维度下的各对象特征样本数据各自对应的第二分类标签,确定第二分类标签 为正常的对象特征样本数据所占的第三比例,以及第二分类标签为异常的对象 特征样本数据所占的第四比例,基于第三比例和第四比例确定第二样本集的信 息熵,基于第二样本集的信息熵,确定各第二离群维度分别对应的信息增益。
在一个实施例中,基于第三比例和第四比例确定第二样本集的信息熵,包 括:
采用如下公式确定第二样本集的信息熵:
其中,|y|表示第二分类标签的种类,本申请实施例中,分类标签有正常和 异常两种,因此|y|=2,Ent(D)=-p1log2p1-p2log2p2,p1和p2分别为第三比例和 第四比例。
在一个实施例中,基于第二样本集的信息熵,确定各第二离群维度分别对 应的信息增益,包括:
对于每个第二离群维度,根据第二离群维度下的各对象特征样本数据,确 定各对象特征样本数据对应的类别,获取每个类别下对象特征样本数据的数量 以及每个类别对应的信息熵,基于第二样本集的信息熵、每个类别下对象特征 样本数据的数量、以及每个类别对应的信息熵,确定第二离群维度对应的信息 增益。示例性的,可基于第二离群维度下的所有对象特征样本数据,计算所有 对象特征样本数据的均值和方差,基于该均值和方差,将第二离群维度下的所 有对象特征样本数据分为两类,其中,属于(μ-3σ,μ+3σ)范围内的对象特征 样本数据为一类,不属于(μ-3σ,μ+3σ)范围内的对象特征样本数据为另一类。
其中,获取每个类别对应的信息熵的过程和前述实施例中获取第二样本集 的信息熵的过程类似,在此不再赘述。
在一个实施例中,基于第二样本集的信息熵、每个类别下对象特征样本数 据的数量、以及每个类别对应的信息熵,确定第二离群维度对应的信息增益, 包括:
采用如下公式确定第二离群维度对应的信息增益:
其中,V表示第二离群维度下的各对象特征样本数据对应的类别的数量, Ent(D)表示第二样本集的信息熵,Dv表示每个类别下对象特征样本数据的数量, Ent(Dv)表示每个类别对应的信息熵,D表示对象样本的数量。
在一个实施例中,基于各第二离群维度分别对应的信息增益,从多个第二 离群维度中选择目标第二离群维度作为分类特征以创建第二根节点,包括:
将多个第二离群维度中信息增益最大的第二离群维度作为目标第二离群维 度,以目标第二离群维度作为分类特征以创建第二根节点,也就是说,根节点 和目标第二离群维度对应。
在一个实施例中,根据第二根节点下的对象特征样本数据和各对象特征样 本数据各自对应的第二分类标签,创建第二中间节点和第二叶子节点,包括: 按照第二根节点下的对象特征样本数据的取值,对第二根节点下的对象特征样 本数据进行分类,针对每个类别,获取该类别对应的对象样本,并获取该类别 对应的对象样本在除了目标第二离群维度以外,其他第二离群维度下的对象特 征样本数据,从各对象特征样本数据中,获取该类别对应的对象样本所对应的 第二分类标签,基于该类别对应的对象样本在其他第二离群维度下的对象特征 样本数据,以及该类别对应的对象样本所对应的第二分类标签,计算其他第二 离群维度中各第二离群维度的信息增益,基于其他第二离群维度中各第二离群 维度的信息增益,确定该类别对应的中间节点(第二中间节点),以此类推, 直至得到第二叶子节点。其中,计算其他第二离群维度中各第二离群维度的信 息增益的过程,以及基于其他第二离群维度中各第二离群维度的信息增益,确 定中间节点的过程,可参见上述实施例中创建第二根节点的过程。其中,对第 二根节点下的对象特征样本数据进行分类的方式,可参见前述实施例中将第二 离群维度下的所有对象特征样本数据分为两类的方式。在此不再赘述。
由于,信息增益越大,就意味着使用该第二离群维度来进行划分所得到的 “纯度提升”越大,上述实施例中,在从多个第二维度筛选出多个第二离群维 度的基础上,计算每个第二离群维度的信息增益,基于信息增益,构建第二决 策树模型,得到的第二决策树模型的分类准确度较高。
在一个实施例中,历史交易数据为预设历史时间段内多次历史交易操作所 产生的交易数据,基于异常交易设备集合和异常风险对象集合,确定异常交易 操作,包括:确定与产生历史交易数据的各历史交易操作相关联的目标交易设 备和目标对象;在与任一历史交易操作相关联的目标交易设备处于异常交易设 备集合中,且相关联的目标对象处于异常风险对象集合中的情况下,确定该任 一历史交易操作为异常交易操作。
在一个实施例中,服务器在得到异常交易设备集合和异常风险对象集合后, 对于历史交易数据中任一交易数据,获取该交易数据包含的交易设备和对象, 将该交易设备作为与产生该交易数据的交易操作相关联的目标交易设备,将该 对象作为与产生该交易数据的交易操作相关联的目标对象,判断目标交易设备 是否在异常交易设备集合中,以及目标对象是否在异常风险对象集合中,若目 标交易设备在异常交易设备集合中,且目标对象在异常风险对象集合中,则确 定产生该交易数据的交易操作为异常交易操作。
下面举例说明:
假设异常交易设备集合包括表1中的abc2和abc4;异常风险对象集合包括 表2中的10002和10004。假设某个交易数据中的交易设备为abc2,对象为10002, 由于abc2在异常交易设备集合中,10002在异常风险对象集合中,则可确定产 生该交易数据的交易操作为异常交易操作。
上述实施例中,从交易设备和对象两个维度对交易操作进行判断,只有在 交易操作关联的交易设备在异常交易设备集合,且对象在异常风险对象集合中 的情况下,才将该交易操作划分为异常交易操作,和一些实施例中,某台交易 设备上交易操作频繁发生时,直接将这些交易操作视为异常交易操作的方式相 比,本申请实施例的方案准确度更高。
在一个实施例中,提供一种异常交易操作检测方法,应用于服务器,包括:
基于历史交易数据,确定各交易设备分别在多个第一维度下的设备特征数 据,以及各对象分别在多个第二维度下的对象特征数据。
根据各交易设备分别在多个第一维度下的设备特征数据,确定每个第一维 度分别对应的均值和标准差;根据各第一维度对应的均值和标准差,确定各第 一维度分别对应的异常阈值;根据各第一维度下的设备特征数据和各第一维度 各自所对应的异常阈值,确定各第一维度下的异常数据。
根据每个第一维度下的异常数据的数量,从多个第一维度中筛选出异常数 据的数量满足第一预设条件的第一维度,作为第一离群维度。
获取每个第一离群维度分别对应的异常阈值;根据每个第一离群维度下的 目标设备特征数据、以及每个第一离群维度各自所对应的异常阈值,确定每个 交易设备分别在各第一离群维度下的异常判断结果;根据每个交易设备分别在 各第一离群维度下的异常判断结果,确定每个交易设备的异常判断结果;根据 各交易设备各自的异常判断结果,从多个交易设备中确定出异常交易设备集合。
或者,
获取与各设备样本分别对应的第一样本集和第一分类标签,第一样本集包 括各设备样本分别在各第一离群维度下的设备特征样本数据;根据各设备样本 在各第一离群维度下的设备特征样本数据、及各设备样本的第一分类标签,确 定各第一离群维度分别对应的信息增益;基于各第一离群维度分别对应的信息 增益,从多个第一离群维度中选择目标第一离群维度作为分类特征以创建第一 根节点;根据第一根节点下的设备特征样本数据和各设备特征样本数据各自对 应的第一分类标签,创建第一中间节点和第一叶子节点;根据创建的第一根节 点、第一根节点之下的第一中间节点、以及第一叶子节点,确定第一决策树模 型。获取预先构建的第一决策树模型,第一决策树模型包括第一根节点、多个 第一中间节点、以及多个第一叶子节点;对于每个交易设备,依据相应交易设 备所对应的各个第一离群维度下的目标设备特征数据,从第一决策树模型的第 一根节点开始,不断地自上向下从第一决策树模型中查找与交易设备相匹配的 第一目标中间节点,直至达到第一目标叶子节点时为止;根据第一决策树模型 的第一目标叶子节点所对应的分类标签,确定与相应交易设备对应的异常判断 结果;根据各交易设备各自的异常判断结果,从多个交易设备中确定异常交易 设备集合。
根据各对象分别在多个第二维度下的对象特征数据,确定每个第二维度分 别对应的均值和标准差;根据各第二维度对应的均值和标准差,确定各第二维 度分别对应的异常阈值;根据各第二维度下的对象特征数据和各第二维度各自 所对应的异常阈值,确定各第二维度下的异常数据。
根据每个第二维度下的异常数据的数量,从多个第二维度中筛选出异常数 据的数量满足第二预设条件的第二维度,作为第二离群维度。
获取每个第二离群维度分别对应的异常阈值;根据每个第二离群维度下的 目标对象特征数据、以及每个第二离群维度各自所对应的异常阈值,确定每个 对象分别在各第二离群维度下的异常判断结果;根据每个对象分别在各第二离 群维度下的异常判断结果,确定每个对象的异常判断结果;根据各对象各自的 异常判断结果,从多个对象中确定出异常风险对象集合。
或者,
获取与各对象样本分别对应的第二样本集和第二分类标签,第二样本集包 括各设备样本分别在各第二离群维度下的对象特征样本数据;根据各对象样本 在各第二离群维度下的对象特征样本数据、以及各对象样本的第二分类标签, 确定各第二离群维度分别对应的信息增益;基于各第二离群维度分别对应的信 息增益,从多个第二离群维度中选择目标第二离群维度作为分类特征以创建第 二根节点;根据第二根节点下的对象特征样本数据和各对象特征样本数据各自 对应的第二分类标签,创建第二中间节点和第二叶子节点;根据创建的第二根 节点、第二根节点之下的第二中间节点、以及第二叶子节点,确定第二决策树 模型。获取预先构建的第二决策树模型,第二决策树模型包括第二根节点、多 个第二中间节点、以及多个第二叶子节点;对于每个对象,依据相应对象所对 应的各个第二离群维度下的目标设备特征数据,从第二决策树模型的第二根节 点开始,不断地自上向下从第二决策树模型中查找与对象相匹配的第二目标中 间节点,直至达到第二目标叶子节点时为止;根据第二决策树模型的第二目标 叶子节点所对应的分类标签,确定与相应对象对应的异常判断结果;根据各对 象各自的异常判断结果,从多个对象中确定出异常风险对象集合。
确定与产生历史交易数据的各历史交易操作相关联的目标交易设备和目标 对象;在与任一历史交易操作相关联的目标交易设备处于异常交易设备集合中, 且相关联的目标对象处于异常风险对象集合中的情况下,确定任一历史交易操 作为异常交易操作。
上述实施例中,基于各交易设备分别在多个第一维度下的设备特征数据进 行离群点检测,可以初步从多个第一维度中提取出第一离群维度。相应地,基 于各个对象分别在多个第二维度下的对象特征数据进行离群点检测,可以初步 从多个第二维度中提取出第二离群维度。这样,对于交易设备而言,就可重点 根据第一离群维度下的目标设备特征数据,从多个交易设备中快速且准确地确 定出异常交易设备集合。对于交易对象而言,就可重点根据第二离群维度下的 目标对象特征数据,从多个对象中快速且准确地确定出异常风险对象集合。如 此,便能将异常风险对象在异常交易设备上完成的交易操作确定为异常交易操 作,降低了正常交易操作被误判为异常交易操作的风险,大大提高了检测结果的准确性。
在一个可能的场景下,交易设备为刷脸设备,服务商可将多个刷脸设备铺 设于不同门店中,消费者在某个门店选完商品后,结账时可选择该门店铺设的 任一刷脸设备进行交易操作,刷脸设备检测到交易操作完成后,生成交易数据, 并将交易数据发送给服务器。服务器可从接收到的交易数据中获取历史交易数 据,基于历史交易数据,确定各刷脸设备分别在多个第一维度下的设备特征数 据,以及各对象分别在多个第二维度下的对象特征数据。多个第一维度包括: 设备每天交易笔数、设备每天交易金额、设备上交易对象数量、设备上交易对 象存在共同社交群组数量和设备笔均金额。多个第二维度包括:对象每天交易 笔数、每天刷脸设备量、设备位置数量、交易间隔时长均值和对象交易平均耗 时。服务器根据各刷脸设备分别在多个第一维度下的设备特征数据,从多个第 一维度中确定第一离群维度,获取各刷脸设备分别在第一离群维度下的目标设 备特征数据,并根据目标设备特征数据,从多个刷脸设备中确定出异常刷脸设 备集合。根据各对象分别在多个第二维度下的对象特征数据,从多个第二维度 中确定第二离群维度,获取各对象分别在第二离群维度下的目标对象特征数据, 并根据目标对象特征数据,从多个对象中确定出异常风险对象集合。基于异常 刷脸设备集合和异常风险对象集合,确定异常交易操作。降低了刷脸设备上正 常交易操作被误判为异常交易操作的风险,大大提高了检测结果的准确性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按 照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执 行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些 步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的 至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然 是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执 行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者 阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的 异常交易操作检测方法的异常交易操作检测装置。该装置所提供的解决问题的 实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个异 常交易操作检测装置实施例中的具体限定可以参见上文中对于异常交易操作检 测方法的限定,在此不再赘述。
在一个实施例中,如图12所示,提供一种异常交易操作检测装置12,该装 置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分, 该装置具体包括:
第一确定模块121,用于基于历史交易数据,确定各交易设备分别在多个第 一维度下的设备特征数据,以及各对象分别在多个第二维度下的对象特征数据。
第二确定模块122,用于根据各交易设备分别在多个第一维度下的设备特征 数据,从多个第一维度中确定第一离群维度;根据各对象分别在多个第二维度 下的对象特征数据,从多个第二维度中确定第二离群维度。
第三确定模块123,用于获取各交易设备分别在第一离群维度下的目标设备 特征数据,并根据目标设备特征数据,从多个交易设备中确定出异常交易设备 集合;获取各对象分别在第二离群维度下的目标对象特征数据,并根据目标对 象特征数据,从多个对象中确定出异常风险对象集合。
第四确定模块124,用于基于异常交易设备集合和异常风险对象集合,确定 异常交易操作。
在一个实施例中,第二确定模块122,具体用于根据各交易设备分别在多个 第一维度下的设备特征数据,确定每个第一维度下的设备特征数据的分布情况, 并根据分布情况确定每个第一维度下的异常数据;根据每个第一维度下的异常 数据的数量,从多个第一维度中筛选出异常数据的数量满足第一预设条件的第 一维度,作为第一离群维度。
在一个实施例中,第二确定模块122,具体用于根据各交易设备分别在多个 第一维度下的设备特征数据,确定每个第一维度分别对应的均值和标准差;根 据各第一维度对应的均值和标准差,确定各第一维度分别对应的异常阈值;根 据各第一维度下的设备特征数据和各第一维度各自所对应的异常阈值,确定各 第一维度下的异常数据。
在一个实施例中,第一离群维度有多个,第三确定模块123,具体用于获取 每个第一离群维度分别对应的异常阈值;根据每个第一离群维度下的目标设备 特征数据、以及每个第一离群维度各自所对应的异常阈值,确定每个交易设备 分别在各第一离群维度下的异常判断结果;根据每个交易设备分别在各第一离 群维度下的异常判断结果,确定每个交易设备的异常判断结果;根据各交易设 备各自的异常判断结果,从多个交易设备中确定出异常交易设备集合。
在一个实施例中,第一离群维度有多个,第三确定模块123,具体用于获取 预先构建的第一决策树模型,第一决策树模型包括根节点、多个中间节点、以 及多个叶子节点;对于每个交易设备,依据相应交易设备所对应的各个第一离 群维度下的目标设备特征数据,从第一决策树模型的根节点开始,不断地自上 向下从第一决策树模型中查找与交易设备相匹配的目标中间节点,直至达到目 标叶子节点时为止;根据第一决策树模型的目标叶子节点所对应的分类标签, 确定与相应交易设备对应的异常判断结果;根据各交易设备各自的异常判断结 果,从多个交易设备中确定异常交易设备集合。
在一个实施例中,第三确定模块123,还用于获取与各设备样本分别对应的 第一样本集和分类标签,第一样本集包括各设备样本分别在各第一离群维度下 的设备特征样本数据;根据各设备样本在各第一离群维度下的设备特征样本数 据、以及各设备样本的分类标签,确定各第一离群维度分别对应的信息增益; 基于各第一离群维度分别对应的信息增益,从多个第一离群维度中选择目标第 一离群维度作为分类特征以创建根节点,并根据选择的分类特征将第一样本集 分裂成多个训练子集;在分裂产生的训练子集中不断的选择分类特征创建中间 节点,并根据选择的分类特征进行数据分裂产生新的训练子集,直至将最终分 裂得到的各训练子集分别分类至相应的分类标签上;根据各分类标签创建对应的叶子节点;根据创建的根节点、根节点之下的中间节点、以及叶子节点,确 定第一决策树模型。
在一个实施例中,第二确定模块122,具体用于根据各对象分别在多个第二 维度下的对象特征数据,确定每个第二维度下的对象特征数据的分布情况,并 根据分布情况确定每个第二维度下的异常数据;根据每个第二维度下的异常数 据的数量,从多个第二维度中筛选出异常数据的数量满足第二预设条件的第二 维度,作为第二离群维度。
在一个实施例中,第二确定模块122,具体用于根据各对象分别在多个第二 维度下的对象特征数据,确定每个第二维度分别对应的均值和标准差;根据各 第二维度对应的均值和标准差,确定各第二维度对应的异常阈值;根据各第二 维度下的对象特征数据和各第二维度各自所对应的异常阈值,确定各第二维度 下的异常数据。
在一个实施例中,第二离群维度有多个,第三确定模块123,具体用于获取 每个第二离群维度分别对应的异常阈值;根据每个第二离群维度下的目标对象 特征数据、以及每个第二离群维度各自所对应的异常阈值,确定每个对象分别 在各第二离群维度下的异常判断结果;根据每个对象分别在各第二离群维度下 的异常判断结果,确定每个对象的异常判断结果;根据各对象各自的异常判断 结果,从多个对象中确定出异常风险对象集合。
在一个实施例中,第二离群维度有多个,第三确定模块123,具体用于获取 预先构建的第二决策树模型,第二决策树模型包括根节点、多个中间节点、以 及多个叶子节点;对于每个对象,依据相应对象所对应的各个第二离群维度下 的目标设备特征数据,从第二决策树模型的根节点开始,不断地自上向下从第 二决策树模型中查找与对象相匹配的目标中间节点,直至达到目标叶子节点时 为止;根据第二决策树模型的目标叶子节点所对应的分类标签,确定与相应对 象对应的异常判断结果;根据各对象各自的异常判断结果,从多个对象中确定 出异常风险对象集合。
在一个实施例中,第三确定模块123,还用于获取与各对象样本分别对应的 第二样本集和分类标签,第二样本集包括各设备样本分别在各第二离群维度下 的对象特征样本数据;根据各对象样本在各第二离群维度下的对象特征样本数 据、以及各对象样本的分类标签,确定各第二离群维度分别对应的信息增益; 基于各第二离群维度分别对应的信息增益,从多个第二离群维度中选择目标第 二离群维度作为分类特征以创建根节点,并根据选择的分类特征将第二样本集 分裂成多个训练子集;在分裂产生的训练子集中不断的选择分类特征创建中间 节点,并根据选择的分类特征进行数据分裂产生新的训练子集,直至将最终分 裂得到的各训练子集分别分类至相应的分类标签上;根据各分类标签创建对应的叶子节点;根据创建的根节点、根节点之下的中间节点、以及叶子节点,确 定第二决策树模型。
在一个实施例中,第四确定模块124,具体用于确定与产生历史交易数据的 各历史交易操作相关联的目标交易设备和目标对象;在与任一历史交易操作相 关联的目标交易设备处于异常交易设备集合中,且相关联的目标对象处于异常 风险对象集合中的情况下,确定任一历史交易操作为异常交易操作。
上述异常交易操作检测装置中的各个模块可全部或部分通过软件、硬件及 其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理 器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用 执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器, 其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出 接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出 接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中, 该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括 非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机 程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的 运行提供环境。该计算机设备的数据库用于存储历史交易数据。该计算机设备 的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现 一种异常交易操作检测方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关 的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定, 具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件, 或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储 器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中 的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序, 该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程 序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介 质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器 执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的对象信息(包括但不限于对象标识、对象 社交群组信息、对象所属区域、对象每天交易笔数、对象每天交易设备量、对 象使用过的设备所在位置的数量、交易间隔时长均值、交易平均耗时等)和数 据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经对 象授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理 需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于 一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述 各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、 数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一 种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、 软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、 磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器 (Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase ChangeMemory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器 (Random AccessMemory,RAM)或外部高速缓冲存储器等。作为说明而非局 限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory, DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库 和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数 据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计 算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述 实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特 征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域 的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和 改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利 要求为准。

Claims (16)

1.一种异常交易操作检测方法,其特征在于,所述方法包括:
基于历史交易数据,确定各交易设备分别在多个第一维度下的设备特征数据,以及各对象分别在多个第二维度下的对象特征数据;
根据各交易设备分别在多个第一维度下的设备特征数据,从所述多个第一维度中确定第一离群维度;
获取各交易设备分别在所述第一离群维度下的目标设备特征数据,并根据所述目标设备特征数据,从多个交易设备中确定出异常交易设备集合;
根据各对象分别在多个第二维度下的对象特征数据,从所述多个第二维度中确定第二离群维度;
获取各对象分别在所述第二离群维度下的目标对象特征数据,并根据所述目标对象特征数据,从多个对象中确定出异常风险对象集合;
基于所述异常交易设备集合和所述异常风险对象集合,确定异常交易操作。
2.根据权利要求1所述的方法,其特征在于,所述根据各交易设备分别在多个第一维度下的设备特征数据,从所述多个第一维度中确定第一离群维度,包括:
根据各交易设备分别在多个第一维度下的设备特征数据,确定每个第一维度下的设备特征数据的分布情况,并根据所述分布情况确定每个第一维度下的异常数据;
根据每个第一维度下的异常数据的数量,从所述多个第一维度中筛选出异常数据的数量满足第一预设条件的第一维度,作为第一离群维度。
3.根据权利要求2所述的方法,其特征在于,所述根据各交易设备分别在多个第一维度下的设备特征数据,确定每个第一维度下的设备特征数据的分布情况,并根据所述分布情况确定每个第一维度下的异常数据,包括:
根据各交易设备分别在多个第一维度下的设备特征数据,确定每个第一维度分别对应的均值和标准差;
根据各所述第一维度对应的均值和标准差,确定各所述第一维度分别对应的异常阈值;
根据各第一维度下的设备特征数据和各第一维度各自所对应的异常阈值,确定各所述第一维度下的异常数据。
4.根据权利要求1所述的方法,其特征在于,所述第一离群维度有多个,所述根据所述目标设备特征数据,从多个交易设备中确定出异常交易设备集合,包括:
获取每个第一离群维度分别对应的异常阈值;
根据每个第一离群维度下的目标设备特征数据、以及每个第一离群维度各自所对应的异常阈值,确定每个交易设备分别在各第一离群维度下的异常判断结果;
根据每个交易设备分别在各第一离群维度下的异常判断结果,确定每个交易设备的异常判断结果;
根据各所述交易设备各自的异常判断结果,从多个交易设备中确定出异常交易设备集合。
5.根据权利要求1所述的方法,其特征在于,所述第一离群维度有多个,所述根据所述目标设备特征数据,从多个交易设备中确定出异常交易设备集合,包括:
获取预先构建的第一决策树模型,所述第一决策树模型包括第一根节点、多个第一中间节点、以及多个第一叶子节点;
对于每个交易设备,依据相应交易设备所对应的各个第一离群维度下的目标设备特征数据,从所述第一决策树模型的第一根节点开始,不断地自上向下从所述第一决策树模型中查找与所述交易设备相匹配的第一目标中间节点,直至达到第一目标叶子节点时为止;
根据所述第一决策树模型的第一目标叶子节点所对应的分类标签,确定与相应交易设备对应的异常判断结果;
根据各所述交易设备各自的异常判断结果,从多个交易设备中确定所述异常交易设备集合。
6.根据权利要求5所述的方法,其特征在于,所述第一决策树模型的构建步骤包括:
获取与各设备样本分别对应的第一样本集和第一分类标签,所述第一样本集包括各设备样本分别在各所述第一离群维度下的设备特征样本数据;
根据各所述设备样本在各所述第一离群维度下的设备特征样本数据、及各所述设备样本的第一分类标签,确定各所述第一离群维度分别对应的信息增益;
基于各所述第一离群维度分别对应的信息增益,从多个所述第一离群维度中选择目标第一离群维度作为分类特征以创建第一根节点;
根据第一根节点下的设备特征样本数据和各设备特征样本数据各自对应的第一分类标签,创建第一中间节点和第一叶子节点;
根据创建的第一根节点、所述第一根节点之下的第一中间节点、以及所述第一叶子节点,确定第一决策树模型。
7.根据权利要求1所述的方法,其特征在于,所述根据各对象分别在多个第二维度下的对象特征数据,从所述多个第二维度中确定第二离群维度,包括:
根据各对象分别在多个第二维度下的对象特征数据,确定每个第二维度下的对象特征数据的分布情况,并根据所述分布情况确定每个第二维度下的异常数据;
根据每个第二维度下的异常数据的数量,从所述多个第二维度中筛选出异常数据的数量满足第二预设条件的第二维度,作为第二离群维度。
8.根据权利要求7所述的方法,其特征在于,所述根据各对象分别在多个第二维度下的对象特征数据,确定每个第二维度下的对象特征数据的分布情况,并根据所述分布情况确定每个第二维度下的异常数据,包括:
根据各对象分别在多个第二维度下的对象特征数据,确定每个第二维度分别对应的均值和标准差;
根据各所述第二维度对应的均值和标准差,确定各所述第二维度分别对应的异常阈值;
根据各第二维度下的对象特征数据和各第二维度各自所对应的异常阈值,确定各所述第二维度下的异常数据。
9.根据权利要求1所述的方法,其特征在于,所述第二离群维度有多个,所述根据所述目标对象特征数据,从多个对象中确定出异常风险对象集合,包括:
获取每个第二离群维度分别对应的异常阈值;
根据每个第二离群维度下的目标对象特征数据、以及每个第二离群维度各自所对应的异常阈值,确定每个对象分别在各第二离群维度下的异常判断结果;
根据每个对象分别在各第二离群维度下的异常判断结果,确定每个对象的异常判断结果;
根据各所述对象各自的异常判断结果,从多个对象中确定出异常风险对象集合。
10.根据权利要求1所述的方法,其特征在于,所述第二离群维度有多个,所述根据所述目标对象特征数据,从多个对象中确定出异常风险对象集合,包括:
获取预先构建的第二决策树模型,所述第二决策树模型包括第二根节点、多个第二中间节点、以及多个第二叶子节点;
对于每个对象,依据相应对象所对应的各个第二离群维度下的目标设备特征数据,从所述第二决策树模型的第二根节点开始,不断地自上向下从所述第二决策树模型中查找与所述对象相匹配的第二目标中间节点,直至达到第二目标叶子节点时为止;
根据所述第二决策树模型的第二目标叶子节点所对应的分类标签,确定与相应对象对应的异常判断结果;
根据各所述对象各自的异常判断结果,从多个对象中确定出异常风险对象集合。
11.根据权利要求10所述的方法,其特征在于,所述第二决策树模型的构建步骤包括:
获取与各对象样本分别对应的第二样本集和第二分类标签,所述第二样本集包括各设备样本分别在各所述第二离群维度下的对象特征样本数据;
根据各所述对象样本在各所述第二离群维度下的对象特征样本数据、以及各所述对象样本的第二分类标签,确定各所述第二离群维度分别对应的信息增益;
基于各所述第二离群维度分别对应的信息增益,从多个所述第二离群维度中选择目标第二离群维度作为分类特征以创建第二根节点;
根据第二根节点下的对象特征样本数据和各对象特征样本数据各自对应的第二分类标签,创建第二中间节点和第二叶子节点;
根据创建的第二根节点、所述第二根节点之下的第二中间节点、以及所述第二叶子节点,确定第二决策树模型。
12.根据权利要求1至11中任一项所述的方法,其特征在于,所述历史交易数据为预设历史时间段内多次历史交易操作所产生的交易数据,所述基于所述异常交易设备集合和所述异常风险对象集合,确定异常交易操作,包括:
确定与产生所述历史交易数据的各历史交易操作相关联的目标交易设备和目标对象;
在与任一历史交易操作相关联的目标交易设备处于所述异常交易设备集合中,且相关联的目标对象处于所述异常风险对象集合中的情况下,确定所述任一历史交易操作为异常交易操作。
13.一种异常交易操作检测装置,其特征在于,所述装置包括:
第一确定模块,用于基于历史交易数据,确定各交易设备分别在多个第一维度下的设备特征数据,以及各对象分别在多个第二维度下的对象特征数据;
第二确定模块,用于根据各交易设备分别在多个第一维度下的设备特征数据,从所述多个第一维度中确定第一离群维度;根据各对象分别在多个第二维度下的对象特征数据,从所述多个第二维度中确定第二离群维度;
第三确定模块,用于获取各交易设备分别在所述第一离群维度下的目标设备特征数据,并根据所述目标设备特征数据,从多个交易设备中确定出异常交易设备集合;获取各对象分别在所述第二离群维度下的目标对象特征数据,并根据所述目标对象特征数据,从多个对象中确定出异常风险对象集合;
第四确定模块,用于基于所述异常交易设备集合和所述异常风险对象集合,确定异常交易操作。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
CN202210429294.4A 2022-04-22 2022-04-22 异常交易操作检测方法、装置、计算机设备和存储介质 Pending CN116993342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210429294.4A CN116993342A (zh) 2022-04-22 2022-04-22 异常交易操作检测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210429294.4A CN116993342A (zh) 2022-04-22 2022-04-22 异常交易操作检测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN116993342A true CN116993342A (zh) 2023-11-03

Family

ID=88530732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210429294.4A Pending CN116993342A (zh) 2022-04-22 2022-04-22 异常交易操作检测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN116993342A (zh)

Similar Documents

Publication Publication Date Title
CN107563757B (zh) 数据风险识别的方法及装置
CN109993627B (zh) 推荐方法、推荐模型的训练方法、装置和存储介质
CN107622326B (zh) 用户分类、可用资源预测方法、装置及设备
CN110210457A (zh) 人脸检测方法、装置、设备及计算机可读存储介质
CN108170830B (zh) 群组事件数据可视化方法及系统
US20230004979A1 (en) Abnormal behavior detection method and apparatus, electronic device, and computer-readable storage medium
CN111242165B (zh) 商户聚类方法、装置、计算机设备和存储介质
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
CN116663505B (zh) 一种基于互联网的评论区管理方法及系统
CN114495137B (zh) 票据异常检测模型生成方法与票据异常检测方法
CN116993342A (zh) 异常交易操作检测方法、装置、计算机设备和存储介质
CN113592529B (zh) 债券产品的潜在客户推荐方法和装置
CN112632381B (zh) 信息查询方法、装置、计算机设备和存储介质
CN114372681A (zh) 基于流水数据的企业分类方法、装置、设备、介质和产品
CN108537654B (zh) 客户关系网络图的渲染方法、装置、终端设备及介质
CN111507397A (zh) 一种异常数据的分析方法及装置
CN117350801A (zh) 虚拟产品推荐方法、装置、计算机设备、存储介质和产品
CN114185888A (zh) 业务报表的取数方法、装置、计算机设备、存储介质
CN117033765A (zh) 业务推荐方法、装置、计算机设备和存储介质
CN118071512A (zh) 穿透式风险分析方法、装置、计算机设备和存储介质
CN116861272A (zh) 数据处理方法、装置、计算机设备和存储介质
CN116304673A (zh) 用电量异常识别模型训练方法、装置和计算机设备
CN117459576A (zh) 基于边缘计算的数据推送方法、装置和计算机设备
CN117972080A (zh) 业务数据处理、异常检测方法、装置和计算机设备
CN115659022A (zh) 资源推送数据处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40098042

Country of ref document: HK