CN115204868A - 一种数据处理的方法、装置以及存储介质 - Google Patents
一种数据处理的方法、装置以及存储介质 Download PDFInfo
- Publication number
- CN115204868A CN115204868A CN202110384213.9A CN202110384213A CN115204868A CN 115204868 A CN115204868 A CN 115204868A CN 202110384213 A CN202110384213 A CN 202110384213A CN 115204868 A CN115204868 A CN 115204868A
- Authority
- CN
- China
- Prior art keywords
- node
- transaction
- path
- platform
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/382—Payment protocols; Details thereof insuring higher security of transaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据处理的方法、装置以及存储介质。通过获取交易信息;然后将交易对象和交易平台作为网络节点,并基于交易信息对网络节点进行连接,以得到异构网络;并在异构网络中进行节点游走,以得到元路径;并根据元路径进行向量表示,以得到节点向量;进而基于节点向量之间的距离对交易对象进行分类,以得到目标类型的对象。从而实现基于人工智能的商户识别过程,由于交易平台的分布广泛,保证了交易对象的覆盖量,且识别过程中涉及的向量表示为基于交易行为的发生进行的,提高了向量表示的准确性,并提高了对象类型识别的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理的方法、装置以及存储介质。
背景技术
随着互联网技术的迅速发展,人们对网络交易的安全性要求越来越高,由于商户可以在不同的互联网平台上进行交易设置,故对于商户的安全性评价尤为重要。
一般,可以通过关联分析的方式进行黑白商户挖掘,主要是通过共同交易对手或者共同股东建立的节点都为商户、边为商户间关联的图谱,即一种同构网络;再通过图算法或其他分类器对图中的节点(商户)进行分类。
但是,由共同交易对手建立的图谱中的边描述的是经过交易对手抽象后的间接关联,会造成部分信息失真,影响异常对象识别的准确性。
申请内容
有鉴于此,本申请提供一种数据处理的方法,可以有效提高异常对象识别的准确性。
本申请第一方面提供一种数据处理的方法,可以应用于终端设备中包含数据处理的功能的系统或程序中,具体包括:
获取交易对象和交易平台之间的交易信息;
将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述网络节点进行连接,以得到异构网络;
基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量;
基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象。
可选的,在本申请一些可能的实现方式中,所述将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间关联关系对所述网络节点进行连接,以得到异构网络,包括:
将所述交易对象作为所述网络节点中的商户节点,并将所述交易平台作为所述网络节点中的平台节点;
基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述商户节点和所述平台节点进行连接,以确定第一网络边;
基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述平台节点之间存在跳转关系的节点进行连接,以确定第二网络边;
根据所述商户节点、所述平台节点、所述第一网络边和所述第二网络边得到所述异构网络。
可选的,在本申请一些可能的实现方式中,所述基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,包括:
基于所述预设路径类别确定商户起始节点和平台起始节点;
根据所述商户起始节点在所述异构网络中进行节点游走,并以终止节点为交易对象时作为停止时机,以得到商户路径;
根据所述平台起始节点在所述异构网络中进行节点游走,并以终止节点为交易平台时作为停止时机,以得到平台路径;
基于所述商户路径和所述平台路径确定所述元路径。
可选的,在本申请一些可能的实现方式中,所述根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量,包括:
将所述元路径中的起始节点作为中心节点,并将所述元路径中的终止节点作为相邻节点;
基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量。
可选的,在本申请一些可能的实现方式中,所述基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量,包括:
基于所述预设算法对所述中心节点进行向量表示,以得到中心向量;
基于所述预设算法对所述相邻节点进行向量表示,以得到相邻向量;
基于所述目标函数获取所述中心向量和所述相邻向量对应的内积,并采用逻辑回归模型计算所述相邻节点的出现概率,以使得所述相邻节点的出现概率最大化,并得到所述网络节点对应的所述节点向量。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
采用负采样的方式获取非相邻节点;
通过最小化所述非相邻节点的出现概率对所述目标函数进行更新。
可选的,在本申请一些可能的实现方式中,所述基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象,包括:
将目标向量输入分类器,以确定所述目标向量对应的样本类别;
确定与所述目标向量距离满足阈值条件的节点向量,以基于所述样本类别进行类别标记得到所述分类结果;
确定所述分类结果中的黑样本商户,以作为所述交易对象中的异常对象。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
确定所述分类结果中的黑样本平台;
将与所述黑样本平台对应的节点向量的距离小于预设值的交易对象作为所述异常对象。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
确定与所述交易对象存在交易关系的交易用户;
将所述交易用户作为所述网络节点,以对所述异构网络进行更新;
基于所述预设路径类别在更新后的所述异构网络中进行节点游走,以得到更新后的元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
根据更新后的所述元路径进行向量表示,以得到更新后的节点向量;
基于更新后的所述节点向量之间的距离进行所述交易用户、所述交易对象或所述交易平台的识别进程。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
获取所述交易用户与所述交易对象之间的交易参数;
基于所述交易参数对所述交易用户与所述交易对象组成的网络边进行加权,以对所述异构网络进行更新。
可选的,在本申请一些可能的实现方式中,所述交易平台为公众号,所述预设路径类别包括交易对象通过所述公众号进行关联的路径以及所述公众号之间的跳转路径,所述交易对象的数量大于所述公众号的数量。
可选的,在本申请一些可能的实现方式中,所述数据处理的方法应用于区块链设备,所述区块链设备为区块链中的节点。
本申请第二方面提供一种数据处理的装置,包括:
获取单元,用于获取交易对象和交易平台之间的交易信息;
连接单元,用于将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述网络节点进行连接,以得到异构网络;
游走单元,用于基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
表示单元,用于根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量;
识别单元,用于基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象。
可选的,在本申请一些可能的实现方式中,所述连接单元,具体用于将所述交易对象作为所述网络节点中的商户节点,并将所述交易平台作为所述网络节点中的平台节点;
所述连接单元,具体用于基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述商户节点和所述平台节点进行连接,以确定第一网络边;
基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述连接单元,具体用于所述平台节点之间存在跳转关系的节点进行连接,以确定第二网络边;
所述连接单元,具体用于根据所述商户节点、所述平台节点、所述第一网络边和所述第二网络边得到所述异构网络。
可选的,在本申请一些可能的实现方式中,所述游走单元,具体用于基于所述预设路径类别确定商户起始节点和平台起始节点;
所述游走单元,具体用于根据所述商户起始节点在所述异构网络中进行节点游走,并以终止节点为交易对象时作为停止时机,以得到商户路径;
所述游走单元,具体用于根据所述平台起始节点在所述异构网络中进行节点游走,并以终止节点为交易平台时作为停止时机,以得到平台路径;
所述游走单元,具体用于基于所述商户路径和所述平台路径确定所述元路径。
可选的,在本申请一些可能的实现方式中,所述表示单元,具体用于将所述元路径中的起始节点作为中心节点,并将所述元路径中的终止节点作为相邻节点;
所述表示单元,具体用于基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量。
可选的,在本申请一些可能的实现方式中,所述表示单元,具体用于基于所述预设算法对所述中心节点进行向量表示,以得到中心向量;
所述表示单元,具体用于基于所述预设算法对所述相邻节点进行向量表示,以得到相邻向量;
所述表示单元,具体用于基于所述目标函数获取所述中心向量和所述相邻向量对应的内积,并采用逻辑回归模型计算所述相邻节点的出现概率,以使得所述相邻节点的出现概率最大化,并得到所述网络节点对应的所述节点向量。
可选的,在本申请一些可能的实现方式中,所述表示单元,具体用于采用负采样的方式获取非相邻节点;
所述表示单元,具体用于通过最小化所述非相邻节点的出现概率对所述目标函数进行更新。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于将目标向量输入分类器,以确定所述目标向量对应的样本类别;
所述识别单元,具体用于确定与所述目标向量距离满足阈值条件的节点向量,以基于所述样本类别进行类别标记得到所述分类结果;
所述识别单元,具体用于确定所述分类结果中的黑样本商户,以作为所述交易对象中的异常对象。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于确定所述分类结果中的黑样本平台;
所述识别单元,具体用于将与所述黑样本平台对应的节点向量的距离小于预设值的交易对象作为所述异常对象。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于确定与所述交易对象存在交易关系的交易用户;
所述识别单元,具体用于将所述交易用户作为所述网络节点,以对所述异构网络进行更新;
所述识别单元,具体用于基于所述预设路径类别在更新后的所述异构网络中进行节点游走,以得到更新后的元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
所述识别单元,具体用于根据更新后的所述元路径进行向量表示,以得到更新后的节点向量;
所述识别单元,具体用于基于更新后的所述节点向量之间的距离进行所述交易用户、所述交易对象或所述交易平台的识别进程。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于获取所述交易用户与所述交易对象之间的交易参数;
所述识别单元,具体用于基于所述交易参数对所述交易用户与所述交易对象组成的网络边进行加权,以对所述异构网络进行更新。
本申请第三方面提供一种计算机设备,包括:存储器、处理器以及总线系统;所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行上述第一方面或第一方面任一项所述的数据处理的方法。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任一项所述的数据处理的方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面或者第一方面的各种可选实现方式中提供的数据处理的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
通过获取交易对象和交易平台之间的交易信息;然后将交易对象和交易平台作为网络节点,并基于交易信息中指示的交易对象和交易平台之间的关联关系对网络节点进行连接,以得到异构网络;进一步的基于预设路径类别在异构网络中进行节点游走,以得到元路径,该预设路径类别中路径的起始节点与终止节点对应的节点类型相同;并根据元路径进行向量表示,以得到网络节点对应的节点向量;进而基于节点向量之间的距离对交易对象进行分类,并根据分类结果进行识别以得到交易对象中的异常对象。从而实现基于异构网络的商户识别过程,由于交易平台的分布广泛,保证了交易对象的覆盖量,且识别过程中涉及的向量表示为基于交易行为的发生进行的,提高了向量表示的准确性,并提高了异常对象识别的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为数据处理的系统运行的网络架构图;
图2为本申请实施例提供的一种数据处理的的流程架构图;
图3为本申请实施例提供的一种数据处理的方法的流程图;
图4为本申请实施例提供的一种数据处理的方法的场景示意图;
图5为本申请实施例提供的另一种数据处理的方法的流程图;
图6为本申请实施例提供的另一种数据处理的方法的场景示意图;
图7为本申请实施例提供的另一种数据处理的方法的流程图;
图8为本申请实施例提供的另一种数据处理的方法的场景示意图;
图9为本申请实施例提供的一种数据处理的装置的结构示意图;
图10为本申请实施例提供的一种终端设备的结构示意图;
图11为本申请实施例提供的一种服务器的结构示意图;
图12A为本申请实施例提供的一种数据共享系统;
图12B为本申请实施例提供的一种区块链的组成;
图12C为本申请实施例提供的一种区块链节点的输入信息示意图。
具体实施方式
本申请实施例提供了一种数据处理的方法以及相关装置,可以应用于终端设备中包含数据处理的功能的系统或程序中,通过获取交易对象和交易平台之间的交易信息;然后将交易对象和交易平台作为网络节点,并基于交易信息中指示的交易对象和交易平台之间的关联关系对网络节点进行连接,以得到异构网络;进一步的基于预设路径类别在异构网络中进行节点游走,以得到元路径,该预设路径类别中路径的起始节点与终止节点对应的节点类型相同;并根据元路径进行向量表示,以得到网络节点对应的节点向量;进而基于节点向量之间的距离对交易对象进行分类,并根据分类结果进行识别以得到交易对象中的异常对象。从而实现基于异构网络的商户识别过程,由于交易平台的分布广泛,保证了交易对象的覆盖量,且识别过程中涉及的向量表示为基于交易行为的发生进行的,提高了向量表示的准确性,并提高了异常对象识别的准确性。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应理解,本申请提供的数据处理的方法可以应用于终端设备中包含数据处理的功能的系统或程序中,例如互动剧,具体的,数据处理的系统可以运行于如图1所示的网络架构中,如图1所示,是数据处理的系统运行的网络架构图,如图可知,数据处理的系统可以提供与多个信息源的数据处理的过程,即通过终端侧的交易操作生成对应的交易信息,使得服务器对交易信息进行收集并识别分类;可以理解的是,图1中示出了多种终端设备,终端设备可以为计算机设备,在实际场景中可以有更多或更少种类的终端设备参与到数据处理的的过程中,具体数量和种类因实际场景而定,此处不做限定,另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,特别是在多模型训练交互的场景中,具体服务器数量因实际场景而定。
本实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,终端以及服务器可以连接组成区块链网络,本申请在此不做限制。
可以理解的是,上述数据处理的系统可以运行于个人移动终端,例如:作为互动剧这样的应用,也可以运行于服务器,还可以作为运行于第三方设备以提供数据处理的,以得到信息源的数据处理的处理结果;具体的数据处理的系统可以是以一种程序的形式在上述设备中运行,也可以作为上述设备中的系统部件进行运行,还可以作为云端服务程序的一种,具体运作模式因实际场景而定,此处不做限定。
随着互联网技术的迅速发展,人们对网络交易的安全性要求越来越高,由于商户可以在不同的互联网平台上进行交易设置,故对于商户的安全性评价尤为重要。
一般,可以通过机器学习进行商户识别,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
具体的,通过关联分析的方式进行黑白商户挖掘,主要是通过共同交易对手或者共同股东建立的节点都为商户、边为商户间关联的图谱,即一种同构网络;再通过图算法或其他分类器对图中的节点(商户)进行分类。
但是,由共同股东所建立的图谱能覆盖的商户量很少,且由共同交易对手建立的图谱中的边描述的是经过交易对手抽象后的间接关联,会造成部分信息失真,容易出现像拼多多、京东等因为用户数过多而造成关联商户过多的超级节点,但其实这些商户之间的边并没有意义,从而影响异常对象识别的准确性。
为了解决上述问题,本申请提出了一种数据处理的方法,该方法应用于图2所示的数据处理的的流程框架中,如图2所示,为本申请实施例提供的一种数据处理的的流程架构图,用户通过终端侧的交易操作在服务器侧生成对应的交易信息,通过交易关联,将商户与其有交易的公众号(包括小程序、网页、APP等)进行关联,并将有交易跳转的公众号进行关联,得到包含公众号与商户两种节点的异构图,然后用metapath2vec得到该异构网络每个节点的表征,再用分类器对商户向量进行黑白分类。此申请的假设是黑白商户会通过公众号有各自的关联。
可以理解的是,本申请所提供的方法可以为一种程序的写入,以作为硬件系统中的一种处理逻辑,也可以作为一种数据处理的装置,采用集成或外接的方式实现上述处理逻辑。作为一种实现方式,该数据处理的装置通过获取交易对象和交易平台之间的交易信息;然后将交易对象和交易平台作为网络节点,并基于交易信息中指示的交易对象和交易平台之间的关联关系对网络节点进行连接,以得到异构网络;进一步的基于预设路径类别在异构网络中进行节点游走,以得到元路径,该预设路径类别中路径的起始节点与终止节点对应的节点类型相同;并根据元路径进行向量表示,以得到网络节点对应的节点向量;进而基于节点向量之间的距离对交易对象进行分类,并根据分类结果进行识别以得到交易对象中的异常对象。从而实现基于异构网络的商户识别过程,由于交易平台的分布广泛,保证了交易对象的覆盖量,且识别过程中涉及的向量表示为基于交易行为的发生进行的,提高了向量表示的准确性,并提高了异常对象识别的准确性。
本申请实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明:
结合上述流程架构,下面将对本申请中数据处理的方法进行介绍,请参阅图3,图3为本申请实施例提供的一种数据处理的方法的流程图,该管理方法可以是由终端设备执行的,还可以是由服务器执行的,也可以是由终端设备和服务器共同执行的,本申请实施例至少包括以下步骤:
301、获取交易对象和交易平台之间的交易信息。
本实施例中,交易对象可以是商户、个人或其他可以作为交易个体的对象,下述实施例以商户为例进行说明。其中,交易商户和交易平台之间的交易信息可以是来源于银行、网络交易平台的实时数据,或对上述信息源进行阶段性收集所得,具体的信息来源因实际场景而定。
具体的,交易平台可以是公众号、小程序、网页、APP等终端应用形式进行展现,此处以公众号为例进行说明。
302、将交易对象和交易平台作为网络节点,并基于交易信息中指示的交易对象和交易平台之间的关联关系对网络节点进行连接,以得到异构网络。
本实施例中,需要根据商户的交易信息构建一个包含商户、公众号两种节点的异构网络,其中异构网络的边指的是用户通过公众号与商户的交易。
具体的,对于异构网络的构建可以首先将交易对象作为网络节点中的商户节点,并将交易平台作为网络节点中的平台节点;然后基于交易信息中指示的交易对象和交易平台之间的关联关系对商户节点和平台节点进行连接,以确定第一网络边;并基于交易信息中指示的交易对象和交易平台之间的关联关系对平台节点之间存在跳转关系的节点进行连接,以确定第二网络边;进而根据商户节点、平台节点、第一网络边和第二网络边得到异构网络。
在一种可能的场景中,即有异构网络G=(V,E,T),V表示节点,E表示边,T表示节点的类别。在该网络中有两种节点:M表示商户,G表示公众号;有两种边:M-G表示用户在公众号上发生的与该商户的交易,G-G表示用户交易时公众号之间的跳转。
进一步的,需要通过metapath2vec的方式得到节点间的游走路径,再对游走路径建模得到节点的隐含表示向量,最后将商户的表示向量输入至分类器中完成黑白商户分类。
303、基于预设路径类别在异构网络中进行节点游走,以得到元路径。
本实施例中,预设路径类别中路径的起始节点与终止节点对应的节点类型相同,即保证元路径的端节点均为商户或平台,以保证后续向量表示的一致性,其中,元路径具体为定义在不同类型顶点之间的一系列关系序列组成的路径,该顶点即为异构网络中的节点;例如元路径1为商户1-公众号2-商户2,即商户1与公众号2之间存在交易关系,且商户2与公众号2之间也存在交易关系。
具体的,可以首先基于预设路径类别确定商户起始节点和平台起始节点;然后根据商户起始节点在异构网络中进行节点游走,并以终止节点为交易对象时作为停止时机,以得到商户路径;并根据平台起始节点在异构网络中进行节点游走,并以终止节点为交易平台时作为停止时机,以得到平台路径;进而基于商户路径和平台路径确定元路径。
可以理解的是,由于异构网络中,公众号的数目和商户数目可能存在较大差距,若直接通过节点随机游走的方式,可能导致数目多的节点产生的边占据了主导地位,使得表示学习的过程不准确。因而,应当使用上述元路径随机游走的方式得到,以保证后续向量表示的准确性。
在一种可能的场景中,元路径随机游走,即指定路径每次游走的节点类别,即V1→V2→…→Vl,且要求该路径对称,即V1=Vl。如图4所示,图4为本申请实施例提供的一种数据处理的方法的场景示意图;图中展示了商户-公众号异构网络的组成以及预设路径类别,即预设路径类别为两种路径:“MGM”表示商户通过公众号与另一个商户相关联的路径,而“GG”表示公众号之间的跳转关联。
304、根据元路径进行向量表示,以得到网络节点对应的节点向量。
本实施例中,对元路径进行向量表示可以是基于metapath2vec表示向量学习的过程,即首先将元路径中的起始节点作为中心节点,并将元路径中的终止节点作为相邻节点;然后基于预设算法对中心节点进行向量表示,以使得相邻节点的出现概率最大化,并基于目标函数得到网络节点对应的节点向量。
具体的,即在得到元路径后,可通过skip-gram算法(预设算法)得到节点的表示向量;其中,skip-gram算法对应了模型表示,该模型包括输入层、隐层和输出层,输入层用于对节点中对应的商户、公众号等信息进行编码,以得到编码序列;隐层用于将输入层生成的编码序列进行权重调整,以调整至目标维度的编码向量;输出层则为一个逻辑回归模型,它的每个结点将会基于目标维度的编码向量输出一个0-1之间的概率,并通过表示学习的目标函数使相邻节点出现的概率最大化,即保证元路径两端节点为同一类型,该目标函数可以是:
其中,Nt(v)表示v的相邻节点中属于节点类别t的节点集合,V表示节点,T表示节点的类别,P(ct|v;θ)表示参数θ时节点ct是v的相邻节点的概率。
具体的,对于相邻节点的概率最大化过程,可以首先基于预设算法对中心节点进行向量表示,以得到中心向量;然后基于预设算法对相邻节点进行向量表示,以得到相邻向量;进而基于目标函数获取中心向量和相邻向量对应的内积,并采用逻辑回归模型计算相邻节点的出现概率,以使得相邻节点的出现概率最大化,并得到网络节点对应的节点向量。
具体的,即P(ct|v;θ)可通过中心向量和相邻向量的内积并进行softmax(逻辑回归模型)得到,即通过逻辑回归模型为每个节点的输出分类的结果都赋予一个概率值,表示该节点属于每个类别的可能性,具体公式如下:
其中,Xv表示v作为中心节点的表示向量,Xct表示ct作为邻居节点的表示向量,故最终以每个节点作为中心节点时的表示向量为该节点的最终表示向量。
可选的,上述实施例采用metapath2vec对节点进行建模,即metapath2vec使用基于meta-path的随机游走来构建每个节点的异构邻域,然后用Skip-Gram模型来完成顶点的嵌入。其中,建模过程中使用softmax计算相邻节点出现概率时,对所有节点类别都进行一致的操作;但是也可以将其替换成metapath2vec++,该metapath2vec++可以同时实现异构网络中的结构和语义关联的建模,也就是说分别对同一类别内的节点作softmax,计算在某类别中节点v作为邻居节点出现的概率,从而提升计算效率。
可选的,由于skip-gram需要计算每一对节点相邻的概率。为了简化计算,可用负采样非相邻节点的方式来节省计算资源,故可以采用负采样的方式获取非相邻节点;然后通过最小化非相邻节点的出现概率对目标函数进行更新;故目标函数也可以写作:
可以理解的是,由于相邻节点是少数,而非相邻的节点为多数,所以求的分母会很慢,所以就有了底下argmax开头的这个公式,对于相邻节点,就最大化相邻节点出现的概率,所以第一个是正的;即就是非相邻节点,要最小化出现的概率。
305、基于节点向量之间的距离对交易对象进行分类,并根据分类结果进行识别以得到交易对象中的异常对象。
本实施例中,可以通过分类器对节点向量进行识别,以确定节点向量为黑样本或白样本,该分类器可以是XBGoost、逻辑回归等,且分类器经过标记为黑样本或白样本的训练集进行监督训练而得。
具体的,对于商户的识别过程,首先将目标向量输入分类器,以确定目标向量对应的样本类别;然后确定与目标向量距离满足阈值条件的节点向量,以基于样本类别进行类别标记得到分类结果;进而确定分类结果中的黑样本商户,以作为交易对象中的异常对象。
可以理解的是,在得到每个节点的表示向量后,两个向量的距离即表示了这两个节点的相近度。比如,若商户M1与商户M2距离相近,则表示这两个商户通过相似的公众号进行交易;若公众号G1与G2相近,则表示这两个公众号存在交易跳转,或者在这两个公众号上进行交易的商户相似;若商户M1与公众号G1相似,则表示该商户与该公众号存在交易关联,或与该商户强关联的商户(或公众号)与公众号G1存在交易关联。
具体的,对于节点向量表示之间的距离计算,可以采用余弦相似度进行计算,即把两个向量看成空间中的两条线段,都是从原点出发,指向不同的方向,从而利用两个向量之间的夹角的余弦值来衡量两个向量之间的余弦相似度;另外,也可以采用欧式距离,即将节点向量进行空间表示,并衡量的是空间各点的绝对直线距离,具体的距离计算方式因实际场景而定,此处不作限定。
在一种可能的场景中,还可以根据黑样本平台进行异常对象的确定,即根据商户M1与公众号G1相似,则表示该商户与该公众号存在交易关联,或与该商户强关联的商户(或公众号)与公众号G1存在交易关联进行。首先确定分类结果中的黑样本平台;然后将与黑样本平台对应的节点向量的距离小于预设值的交易对象作为异常对象,从而提高了异常对象识别的准确性。
可以理解的是,对于商户节点来说,上述表示向量是一种隐性的相似性表示,可以利用此关联对商户进行黑白分类。具体来说,可以将节点的向量表示输入分类器(如XBGoost、逻辑回归等)进行有监督分类,具体模型类别因实际场景而定。
可选的,由于商户与平台的交易过程中涉及金额、交易次数等参数不同,故可以根据这些参数对异构网络中的边进行加权,从而对相应的向量表示进行更新,即首先取交易用户与交易对象之间的交易参数(包括但不限于次数、金额或者占比);然后基于交易参数对交易用户与交易对象组成的网络边进行加权,以对异构网络进行更新,以对网络节点的向量表示进行加权调整,例如商户M1与公众号G1的交易金额越多或交易次数越多则越近似,从而提高了商户识别的准确性。
结合上述实施例可知,通过获取交易对象和交易平台之间的交易信息;然后将交易对象和交易平台作为网络节点,并基于交易信息中指示的交易对象和交易平台之间的关联关系对网络节点进行连接,以得到异构网络;进一步的基于预设路径类别在异构网络中进行节点游走,以得到元路径,该预设路径类别中路径的起始节点与终止节点对应的节点类型相同;并根据元路径进行向量表示,以得到网络节点对应的节点向量;进而基于节点向量之间的距离对交易对象进行分类,并根据分类结果进行识别以得到交易对象中的异常对象。从而实现基于异构网络的商户识别过程,由于交易平台的分布广泛,保证了交易对象的覆盖量,且识别过程中涉及的向量表示为基于交易行为的发生进行的,提高了向量表示的准确性,并提高了异常对象识别的准确性。
由于商户也存在用户维度的交易关系,故基于上述实施例还可以进行用户维度的节点添加,下面对该场景进行说明。请参阅图5,图5为本申请实施例提供的另一种数据处理的方法的流程图,本申请实施例至少包括以下步骤:
501、确定与交易商户存在交易关系的交易用户。
本实施例中,异构网络还可以再加入用户节点(交易用户),如图6所示,图6为本申请实施例提供的另一种数据处理的方法的场景示意图;即异构网络中的边可扩展到“用户-商户”边,“用户-公众号”边,“用户-用户”边。其覆盖度更广,信息更多,元路径也可以由此推广,提升商户、公众号或用户的识别范围。
502、将交易用户作为网络节点,以对异构网络进行更新。
本实施例中,异构网络进行更新的过程如图6所示的场景,即在商户节点的上一级添加用户节点,并将用户与商户之间的交易信息作为边进行节点的关联。
503、基于预设路径类别在更新后的异构网络中进行节点游走,以得到更新后的元路径。
本实施例中,预设路径类别中路径的起始节点与终止节点对应的节点类型相同,即包含了用户节点相同、商户节点相同以及公众号节点相同。
504、根据更新后的元路径进行向量表示,以得到更新后的节点向量。
本实施例中,元路径进行向量表示的过程参见图3所示实施例步骤304的描述,此处不作赘述。
505、基于更新后的节点向量之间的距离进行交易用户、交易商户或交易平台的识别进程。
本实施例中,节点向量之间的距离即说明节点之间的相似性,即商户M1与商户M2距离相近,则表示这两个商户通过相似的公众号进行交易;若公众号G1与G2相近,则表示这两个公众号存在交易跳转,或者在这两个公众号上进行交易的商户相似;若商户M1与公众号G1相似,则表示该商户与该公众号存在交易关联,或与该商户强关联的商户(或公众号)与公众号G1存在交易关联;若商户M1与用户C1相近,表示该商户与该用户存在交易关联,或与该商户强关联的商户(或用户)与用户G1存在交易关联。
可选的,还可以获取交易用户与交易商户之间的交易参数;然后基于交易参数对交易用户与交易商户组成的网络边进行加权,以对异构网络进行更新,从而保证向量表示的准确性。
基于上述实施例可知,通过黑样本商户的分类可以得到关联的异常商户,或对于黑样本用户、黑样本公众号的分类得到关联的异常商户,保证了分类的准确性。
下面,结合终端用户的操作过程对数据处理的过程进行说明,如图7所示,图7为本申请实施例提供的另一种数据处理的方法的流程图,本申请实施例至少包括以下步骤:
701、响应于目标操作发起交易进程。
本实施例中,目标操作可以是在商户中的支付操作,该商户可以是搭载于公众号中进行宣传的。
702、确定交易进程对应的交易商户的类别信息。
本实施例中,确定交易进程对应的交易商户的类别信息即触发服务器对交易商户的类型进行识别,可以是即使识别的过程,即进行图3或图5所示实施例的过程,也可以是根据图3或图5生成异常商户名单后进行的检索遍历过程,从而提升识别效率。
703、基于类别信息执行交易进程的进程。
本实施例中,对于用户在公众号中关联的商户进行交易的场景,如图8所示,图8为本申请实施例提供的另一种数据处理的方法的场景示意图。图中示出了当用户在终端进行在公众号中关联的商户进行交易时,点击确定交易A1后即会触发服务器进行发生交易的商户类型的判定,若判定商户正常则展示交易成功A2,本次交易正常进行;若判定商户异常则展示交易存在风险A3,本次交易被禁止。
通过上述实施例可以保证用户在公众号中关联的商户进行交易的安全性,避免了用户在种类多样的公众号中发生交易风险场景的发生。
为了更好的实施本申请实施例的上述方案,下面还提供用于实施上述方案的相关装置。请参阅图9,图9为本申请实施例提供的一种数据处理的装置的结构示意图,数据处理装置900包括:
获取单元901,用于获取交易对象和交易平台之间的交易信息;
连接单元902,用于将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述网络节点进行连接,以得到异构网络;
游走单元903,用于基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
表示单元904,用于根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量;
识别单元905,用于基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象。
可选的,在本申请一些可能的实现方式中,所述连接单元902,具体用于将所述交易对象作为所述网络节点中的商户节点,并将所述交易平台作为所述网络节点中的平台节点;
所述连接单元902,具体用于基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述商户节点和所述平台节点进行连接,以确定第一网络边;
基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述连接单元902,具体用于所述平台节点之间存在跳转关系的节点进行连接,以确定第二网络边;
所述连接单元902,具体用于根据所述商户节点、所述平台节点、所述第一网络边和所述第二网络边得到所述异构网络。
可选的,在本申请一些可能的实现方式中,所述游走单元903,具体用于基于所述预设路径类别确定商户起始节点和平台起始节点;
所述游走单元903,具体用于根据所述商户起始节点在所述异构网络中进行节点游走,并以终止节点为交易对象时作为停止时机,以得到商户路径;
所述游走单元903,具体用于根据所述平台起始节点在所述异构网络中进行节点游走,并以终止节点为交易平台时作为停止时机,以得到平台路径;
所述游走单元903,具体用于基于所述商户路径和所述平台路径确定所述元路径。
可选的,在本申请一些可能的实现方式中,所述表示单元904,具体用于将所述元路径中的起始节点作为中心节点,并将所述元路径中的终止节点作为相邻节点;
所述表示单元904,具体用于基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量。
可选的,在本申请一些可能的实现方式中,所述表示单元904,具体用于基于所述预设算法对所述中心节点进行向量表示,以得到中心向量;
所述表示单元904,具体用于基于所述预设算法对所述相邻节点进行向量表示,以得到相邻向量;
所述表示单元904,具体用于基于所述目标函数获取所述中心向量和所述相邻向量对应的内积,并采用逻辑回归模型计算所述相邻节点的出现概率,以使得所述相邻节点的出现概率最大化,并得到所述网络节点对应的所述节点向量。
可选的,在本申请一些可能的实现方式中,所述表示单元904,具体用于采用负采样的方式获取非相邻节点;
所述表示单元904,具体用于通过最小化所述非相邻节点的出现概率对所述目标函数进行更新。
可选的,在本申请一些可能的实现方式中,所述识别单元905,具体用于将目标向量输入分类器,以确定所述目标向量对应的样本类别;
所述识别单元905,具体用于确定与所述目标向量距离满足阈值条件的节点向量,以基于所述样本类别进行类别标记得到所述分类结果;
所述识别单元905,具体用于确定所述分类结果中的黑样本商户,以作为所述交易对象中的异常对象。
可选的,在本申请一些可能的实现方式中,所述识别单元905,具体用于确定所述分类结果中的黑样本平台;
所述识别单元905,具体用于将与所述黑样本平台对应的节点向量的距离小于预设值的交易对象作为所述异常对象。
可选的,在本申请一些可能的实现方式中,所述识别单元905,具体用于确定与所述交易对象存在交易关系的交易用户;
所述识别单元905,具体用于将所述交易用户作为所述网络节点,以对所述异构网络进行更新;
所述识别单元905,具体用于基于所述预设路径类别在更新后的所述异构网络中进行节点游走,以得到更新后的元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
所述识别单元905,具体用于根据更新后的所述元路径进行向量表示,以得到更新后的节点向量;
所述识别单元905,具体用于基于更新后的所述节点向量之间的距离进行所述交易用户、所述交易对象或所述交易平台的识别进程。
可选的,在本申请一些可能的实现方式中,所述识别单元905,具体用于获取所述交易用户与所述交易对象之间的交易参数;
所述识别单元905,具体用于基于所述交易参数对所述交易用户与所述交易对象组成的网络边进行加权,以对所述异构网络进行更新。
通过获取交易对象和交易平台之间的交易信息;然后将交易对象和交易平台作为网络节点,并基于交易信息中指示的交易对象和交易平台之间的关联关系对网络节点进行连接,以得到异构网络;进一步的基于预设路径类别在异构网络中进行节点游走,以得到元路径,该预设路径类别中路径的起始节点与终止节点对应的节点类型相同;并根据元路径进行向量表示,以得到网络节点对应的节点向量;进而基于节点向量之间的距离对交易对象进行分类,并根据分类结果进行识别以得到交易对象中的异常对象。从而实现基于异构网络的商户识别过程,由于交易平台的分布广泛,保证了交易对象的覆盖量,且识别过程中涉及的向量表示为基于交易行为的发生进行的,提高了向量表示的准确性,并提高了异常对象识别的准确性。
本申请实施例还提供了一种终端设备,如图10所示,是本申请实施例提供的另一种终端设备的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant,PDA)、销售终端(point of sales,POS)、车载电脑等任意终端设备,以终端为手机为例:
图10示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图10,手机包括:射频(radio frequency,RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(wireless fidelity,WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图10中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图10对手机的各个构成部件进行具体的介绍:
RF电路1010可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1080处理;另外,将设计上行的数据发送给基站。通常,RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
存储器1020可用于存储软件程序以及模块,处理器1080通过运行存储在存储器1020的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1030可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作,以及在触控面板1031上一定范围内的隔空触控操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1080,并能接收处理器1080发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031,输入单元1030还可以包括其他输入设备1032。具体地,其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041,可选的,可以采用液晶显示器(liquidcrystal display,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板1041。进一步的,触控面板1031可覆盖显示面板1041,当触控面板1031检测到在其上或附近的触摸操作后,传送给处理器1080以确定触摸事件的类型,随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图10中,触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1050,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1041和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1060、扬声器1061,传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号,传输到扬声器1061,由扬声器1061转换为声音信号输出;另一方面,传声器1062将收集的声音信号转换为电信号,由音频电路1060接收后转换为音频数据,再将音频数据输出处理器1080处理后,经RF电路1010以发送给比如另一手机,或者将音频数据输出至存储器1020以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图10示出了WiFi模块1070,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变申请的本质的范围内而省略。
处理器1080是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1020内的软件程序和/或模块,以及调用存储在存储器1020内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1080可包括一个或多个处理单元;可选的,处理器1080可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1080中。
手机还包括给各个部件供电的电源1090(比如电池),可选的,电源可以通过电源管理系统与处理器1080逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器1080还具有执行如上述页面处理方法的各个步骤的功能。
本申请实施例还提供了一种服务器,请参阅图11,图11是本申请实施例提供的一种服务器的结构示意图,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1122(例如,一个或一个以上处理器)和存储器1132,一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中,存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1122可以设置为与存储介质1130通信,在服务器1100上执行存储介质1130中的一系列指令操作。
服务器1100还可以包括一个或一个以上电源1126,一个或一个以上有线或无线网络接口1150,一个或一个以上输入输出接口1158,和/或,一个或一个以上操作系统1141,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由管理装置所执行的步骤可以基于该图11所示的服务器结构。
本申请实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有数据处理的指令,当其在计算机上运行时,使得计算机执行如前述图2至图8所示实施例描述的方法中数据处理的装置所执行的步骤。
本申请实施例中还提供一种包括数据处理的指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如前述图2至图8所示实施例描述的方法中数据处理的装置所执行的步骤。
本申请实施例还提供了一种数据处理的系统,所述数据处理的系统可以包含图9所描述实施例中的数据处理的装置,或图10所描述实施例中的终端设备,或者图11所描述的服务器。
在一种可能的场景中,本申请中的网络资源管理的方法应用于区块链设备中,即终端或服务器为区块链设备,且该区块链设备为区块链中的节点,下面结合附图进行说明;参见图12A所示的数据共享系统,数据共享系统1200是指用于进行节点与节点之间数据共享的系统,该数据共享系统中可以包括多个节点1201,多个节点1201可以是指数据共享系统中各个客户端。每个节点1201在进行正常工作可以接收到输入信息,并基于接收到的输入信息维护该数据共享系统内的共享数据。为了保证数据共享系统内的信息互通,数据共享系统中的每个节点之间可以存在信息连接,节点之间可以通过上述信息连接进行信息传输。例如,当数据共享系统中的任意节点接收到输入信息时,数据共享系统中的其他节点便根据共识算法获取该输入信息,将该输入信息作为共享数据中的数据进行存储,使得数据共享系统中全部节点上存储的数据均一致。
对于数据共享系统中的每个节点,均具有与其对应的节点标识,而且数据共享系统中的每个节点均可以存储有数据共享系统中其他节点的节点标识,以便后续根据其他节点的节点标识,将生成的区块广播至数据共享系统中的其他节点。每个节点中可维护一个如下表所示的节点标识列表,将节点名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(Internet Protocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
表1节点名称与节点标识的对应关系
节点名称 | 节点标识 |
节点1 | 117.114.151.174 |
节点2 | 117.116.189.145 |
… | … |
节点N | 119.123.789.258 |
数据共享系统中的每个节点均存储一条相同的区块链。区块链由多个区块组成,参见图12B,区块链由多个区块组成,创始块中包括区块头和区块主体,区块头中存储有输入信息特征值、版本号、时间戳和难度值,区块主体中存储有输入信息;创始块的下一区块以创始块为父区块,下一区块中同样包括区块头和区块主体,区块头中存储有当前区块的输入信息特征值、父区块的区块头特征值、版本号、时间戳和难度值,并以此类推,使得区块链中每个区块中存储的区块数据均与父区块中存储的区块数据存在关联,保证了区块中输入信息的安全性。
在生成区块链中的各个区块时,参见图12C,区块链所在的节点在接收到输入信息时,对输入信息进行校验,完成校验后,将输入信息存储至内存池中,并更新其用于记录输入信息的哈希树;之后,将更新时间戳更新为接收到输入信息的时间,并尝试不同的随机数,多次进行特征值计算,使得计算得到的特征值可以满足下述公式:
SHA256(SHA256(version+prev_hash+merkle_root+ntime+nbits+x))<TARGET
其中,SHA256为计算特征值所用的特征值算法;version(版本号)为区块链中相关区块协议的版本信息;prev_hash为当前区块的父区块的区块头特征值;merkle_root为输入信息的特征值;ntime为更新时间戳的更新时间;nbits为当前难度,在一段时间内为定值,并在超出固定时间段后再次进行确定;x为随机数;TARGET为特征值阈值,该特征值阈值可以根据nbits确定得到。
这样,当计算得到满足上述公式的随机数时,便可将信息对应存储,生成区块头和区块主体,得到当前区块。随后,区块链所在节点根据数据共享系统中其他节点的节点标识,将新生成的区块分别发送给其所在的数据共享系统中的其他节点,由其他节点对新生成的区块进行校验,并在完成校验后将新生成的区块添加至其存储的区块链中。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,数据处理的装置,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (15)
1.一种数据处理的方法,其特征在于,包括:
获取交易对象和交易平台之间的交易信息;
将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述网络节点进行连接,以得到异构网络;
基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量;
基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象。
2.根据权利要求1所述的方法,其特征在于,所述将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间关联关系对所述网络节点进行连接,以得到异构网络,包括:
将所述交易对象作为所述网络节点中的商户节点,并将所述交易平台作为所述网络节点中的平台节点;
基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述商户节点和所述平台节点进行连接,以确定第一网络边;
基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述平台节点之间存在跳转关系的节点进行连接,以确定第二网络边;
根据所述商户节点、所述平台节点、所述第一网络边和所述第二网络边得到所述异构网络。
3.根据权利要求1所述的方法,其特征在于,所述基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,包括:
基于所述预设路径类别确定商户起始节点和平台起始节点;
根据所述商户起始节点在所述异构网络中进行节点游走,并以终止节点为交易对象时作为停止时机,以得到商户路径;
根据所述平台起始节点在所述异构网络中进行节点游走,并以终止节点为交易平台时作为停止时机,以得到平台路径;
基于所述商户路径和所述平台路径确定所述元路径。
4.根据权利要求1所述的方法,其特征在于,所述根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量,包括:
将所述元路径中的起始节点作为中心节点,并将所述元路径中的终止节点作为相邻节点;
基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量。
5.根据权利要求4所述的方法,其特征在于,所述基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量,包括:
基于所述预设算法对所述中心节点进行向量表示,以得到中心向量;
基于所述预设算法对所述相邻节点进行向量表示,以得到相邻向量;
基于所述目标函数获取所述中心向量和所述相邻向量对应的内积,并采用逻辑回归模型计算所述相邻节点的出现概率,以使得所述相邻节点的出现概率最大化,并得到所述网络节点对应的所述节点向量。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
采用负采样的方式获取非相邻节点;
通过最小化所述非相邻节点的出现概率对所述目标函数进行更新。
7.根据权利要求1所述的方法,其特征在于,所述基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象,包括:
将目标向量输入分类器,以确定所述目标向量对应的样本类别;
确定与所述目标向量距离满足阈值条件的节点向量,以基于所述样本类别进行类别标记得到所述分类结果;
确定所述分类结果中的黑样本商户,以作为所述交易对象中的异常对象。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
确定所述分类结果中的黑样本平台;
将与所述黑样本平台对应的节点向量的距离小于预设值的交易对象作为所述异常对象。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述方法还包括:
确定与所述交易对象存在交易关系的交易用户;
将所述交易用户作为所述网络节点,以对所述异构网络进行更新;
基于所述预设路径类别在更新后的所述异构网络中进行节点游走,以得到更新后的元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
根据更新后的所述元路径进行向量表示,以得到更新后的节点向量;
基于更新后的所述节点向量之间的距离进行所述交易用户、所述交易对象或所述交易平台的识别进程。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
获取所述交易用户与所述交易对象之间的交易参数;
基于所述交易参数对所述交易用户与所述交易对象组成的网络边进行加权,以对所述异构网络进行更新。
11.根据权利要求1所述的方法,其特征在于,所述交易平台为公众号,所述预设路径类别包括交易对象通过所述公众号进行关联的路径以及所述公众号之间的跳转路径,所述交易对象的数量大于所述公众号的数量。
12.根据权利要求1所述的方法,其特征在于,所述数据处理的方法应用于区块链设备,所述区块链设备为区块链中的节点。
13.一种数据处理的装置,其特征在于,包括:
获取单元,用于获取交易对象和交易平台之间的交易信息;
连接单元,用于将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述网络节点进行连接,以得到异构网络;
游走单元,用于基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
表示单元,用于根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量;
识别单元,用于基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行权利要求1至12任一项所述的数据处理的方法。
15.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述权利要求1至12任一项所述的数据处理的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110384213.9A CN115204868A (zh) | 2021-04-09 | 2021-04-09 | 一种数据处理的方法、装置以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110384213.9A CN115204868A (zh) | 2021-04-09 | 2021-04-09 | 一种数据处理的方法、装置以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204868A true CN115204868A (zh) | 2022-10-18 |
Family
ID=83571032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110384213.9A Pending CN115204868A (zh) | 2021-04-09 | 2021-04-09 | 一种数据处理的方法、装置以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204868A (zh) |
-
2021
- 2021-04-09 CN CN202110384213.9A patent/CN115204868A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210264136A1 (en) | Model training method and apparatus, face recognition method and apparatus, device, and storage medium | |
US10943091B2 (en) | Facial feature point tracking method, apparatus, storage medium, and device | |
CN111813532B (zh) | 一种基于多任务机器学习模型的图像管理方法及装置 | |
CN111914113B (zh) | 一种图像检索的方法以及相关装置 | |
CN110704661B (zh) | 一种图像分类方法和装置 | |
CN112069414A (zh) | 推荐模型训练方法、装置、计算机设备及存储介质 | |
CN112052841B (zh) | 一种视频摘要的生成方法以及相关装置 | |
CN108875781A (zh) | 一种标签分类方法、装置、电子设备及存储介质 | |
CN110995810B (zh) | 一种基于人工智能的对象识别方法和相关装置 | |
CN109784351B (zh) | 行为数据分类方法、分类模型训练方法及装置 | |
CN114724643B (zh) | 一种多肽化合物的筛选方法以及相关装置 | |
CN114722937B (zh) | 一种异常数据检测方法、装置、电子设备和存储介质 | |
CN115392405A (zh) | 模型训练方法、相关装置及存储介质 | |
WO2023217127A1 (zh) | 一种因果关系确定方法及相关设备 | |
CN114862488A (zh) | 一种资源消耗异常对象的识别方法以及相关装置 | |
CN111984803A (zh) | 多媒体资源处理方法、装置、计算机设备及存储介质 | |
CN115080840A (zh) | 一种内容推送方法、装置及存储介质 | |
CN116992162A (zh) | 一种对象的推荐方法、装置以及存储介质 | |
CN114528994B (zh) | 一种识别模型的确定方法和相关装置 | |
CN116307394A (zh) | 产品用户体验评分方法、装置、介质及设备 | |
CN113762585B (zh) | 数据的处理方法、账号类型的识别方法及装置 | |
CN112765470B (zh) | 内容推荐模型的训练方法、内容推荐方法、装置及设备 | |
CN115204868A (zh) | 一种数据处理的方法、装置以及存储介质 | |
CN116259083A (zh) | 一种图像质量识别模型的确定方法和相关装置 | |
CN114971635A (zh) | 一种交易风险的管理方法以及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40075361 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |