CN114943543A - 模型训练方法、异常商品识别方法、电子设备及存储介质 - Google Patents
模型训练方法、异常商品识别方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114943543A CN114943543A CN202210375012.7A CN202210375012A CN114943543A CN 114943543 A CN114943543 A CN 114943543A CN 202210375012 A CN202210375012 A CN 202210375012A CN 114943543 A CN114943543 A CN 114943543A
- Authority
- CN
- China
- Prior art keywords
- sample
- commodity
- attribute
- graph
- commodities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 125
- 238000012549 training Methods 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000003062 neural network model Methods 0.000 claims abstract description 102
- 230000006870 function Effects 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 21
- 238000012935 Averaging Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 17
- 239000000047 product Substances 0.000 description 34
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 230000004913 activation Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 239000003962 counterfeit drug Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000011194 food seasoning agent Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- -1 style Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/012—Providing warranty services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Accounting & Taxation (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供一种模型训练方法、异常商品识别方法、电子设备及存储介质。在本申请实施例中,基于反映样本商品之间的风险关联关系的风险图和反映样本商品之间的属性关联关系的属性图进行图神经网络模型训练,由于在模型训练过程中充分考虑样本商品之间的风险关联关系和样本商品之间的属性关联关系,这样训练得到的目标图神经网络模型能够有效地度量商品之间的风险相关性,进而准确识别异常商品。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种模型训练方法、异常商品识别方法、电子设备及存储介质。
背景技术
随着互联网、大数据等技术的不断发展,涌现出越来越多的提供交易服务的电商平台,例如,商家对商家(Business to Business,B2B)电商平台、商家对消费者(Businessto Consumer,B2C)电商平台或者消费者对消费者(Consumer to Consumer,C2C)电商平台。
在各大电商平台的日常运营中,需要准确识别并删除电商平台上的各种异常商品。目前,通常采用传统的机器学习或深度学习方法,基于商品的属性特征来识别商品是否为异常商品。然而,异常商品的属性特征容易被篡改得和合法商品非常相似,致使难以准确地识别异常商品。
发明内容
本申请的多个方面提供一种模型训练方法、异常商品识别方法、电子设备及存储介质,用以准确地识别异常商品。
本申请实施例提供一种模型训练方法,包括:获取多个样本商品,多个样本商品中至少包括具有真实标签的样本标签商品和具有异常标签的样本异常商品,真实标签为异常标签或正常标签;根据多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图,以及根据多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图;根据风险图和属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型。
本申请实施例还提供一种异常商品识别方法,包括:获取多个商品,多个商品中至少包括待识别商品以及具有异常标签的异常商品;根据多个商品的风险信息,构建反映商品之间的风险关联关系的目标风险图,以及根据多个商品的属性特征,构建反映商品之间的属性关联关系的目标属性图;将目标风险图和目标属性图输入至目标图神经网络模型中进行异常商品识别,以得到待识别商品的识别结果;目标图神经网络模型是根据上述模型训练方法训练得到的。
本申请实施例还提供一种电子设备,包括:存储器和处理器;存储器,用于存储计算机程序;处理器耦合至存储器,用于执行计算机程序以用于执行模型训练方法中的步骤,或者,执行异常商品识别方法中的步骤。
本申请实施例还提供一种存储有计算机程序的计算机存储介质,当计算机程序被处理器执行时,致使处理器能够实现模型训练方法中的步骤,或者,能够实现异常商品识别方法中的步骤。
在本申请实施例中,基于反映样本商品之间的风险关联关系的风险图和反映样本商品之间的属性关联关系的属性图进行图神经网络模型训练,由于在模型训练过程中充分考虑样本商品之间的风险关联关系和样本商品之间的属性关联关系,这样训练得到的目标图神经网络模型能够有效地度量商品之间的风险相关性,进而准确识别异常商品。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种异常商品识别方法所适用的一种应用场景示意图;
图2为本申请实施例提供的一种模型训练方法的流程图;
图3为本申请实施例提供的一种模型训练方法所适用的一种应用场景示意图;
图4为本申请实施例提供的一种异常商品识别方法的流程图;
图5为本申请实施例提供的一种模型训练装置的结构示意图;
图6为本申请实施例提供的一种异常商品识别装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等并不对数量和执行次序进行限定,并且“第一”、“第二”等也并不限定一定不同。
首先,对本申请实施例涉及的名词进行介绍;
图(Graph):是一种由若干个节点(Node)及连接两个节点的边(Edge)所构成的图形,用于刻画不同节点之间的关联关系。在本申请实施例中,风险图是以商品为节点,反映商品之间风险关联关系的一种图;属性图是以商品为节点,反映商品之间属性关联关系的一种图。
同质图:一种单一类型节点和单一类型边的图。
异质图:包括多种类型节点或多种类型边的图。
图神经网络(Graph Neural Networks,GNN)模型:是一种直接作用于图结构上的神经网络。图神经网络模型有以下特点:1、忽略节点的输入顺序;2、在计算过程中,节点的表示受其周围邻居节点的影响,而图本身连接不变;3、图结构的表示,使得可以进行基于图的推理。其中,将图神经网络模型分为五大类别,分别是:图卷积网络(Graph ConvolutionNetworks,GCN)模型、图注意力网络(Graph Attention Networks,GAN)模型、图自编码器(Graph Autoencoders)模型、图生成网络(Graph Generative Networks,GGN)模型和图时空网络(Graph Spatial-temporal Networks)模型。
目前,通常采用传统的机器学习或深度学习方法,基于商品的属性特征来识别商品是否为异常商品。然而,异常商品的属性特征容易被篡改得和合法商品非常相似,致使难以准确地识别异常商品。为此,本申请实施例提供一种模型训练方法、异常商品识别方法、电子设备及存储介质。在本申请实施例中,基于反映样本商品之间的风险关联关系的风险图和反映样本商品之间的属性关联关系的属性图进行图神经网络模型训练,由于在模型训练过程中充分考虑样本商品之间的风险关联关系和样本商品之间的属性关联关系,这样训练得到的目标图神经网络模型能够有效地度量商品之间的风险相关性,进而准确识别异常商品。
图1为本申请实施例提供的一种异常商品识别方法所适用的一种应用场景示意图。请参照图1,终端设备10或终端设备20可以通过有线网络、或者无线网络与电商平台的服务器30进行交互。例如,有线网络可以包括同轴电缆、双绞线和光纤等,无线网络可以是2G网络、3G网络、4G网络或者5G网络、无线保真(Wireless Fidelity,简称WIFI)网络等。本申请对交互的具体类型或者具体形式并不做限定,只要其能够实现终端设备10或终端设备20与服务器30交互的功能即可。可选的,终端设备10或终端设备20例如包括但不限于手机、平板电脑、笔记本电脑、可穿戴设备、车载设备。服务器30例如包括但不限于单个服务器或多个服务器组成的分布式服务器集群。应当理解的是,图1中的终端设备10、终端设备20和服务器30的数量仅仅是示意性的。实际应用中,根据实际需求部署任意数量的终端设备10、终端设备20和服务器30。
实际应用中,如图1中①所示,某些商家可能会通过终端设备10中运行的由电商平台提供的商家端App(application,应用程序),向电商平台的服务器30发送诸如野生动植物、假冒药品、偷盗工具和造假商品等异常商品的信息。如图1中②所示,电商平台的服务器30利用目标图神经网络模型对来源于商家的商品信息进行异常商品识别,以准确识别出异常商品的信息。如图1中③所示,服务器30在识别出异常商品的信息后,禁止向用户推送异常商品的信息。这样,在用户打开终端设备20中由电商平台提供的购物App后,购物App的应用界面中显示是多个正常商品的图文信息,而不会显示异常商品的图文信息,降低了用户购买到异常商品的概率,确保电商平台的安全运营。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图2为本申请实施例提供的一种模型训练方法的流程图。参见图2,该方法可以包括以下步骤:
201、获取多个样本商品,多个样本商品中至少包括具有真实标签的样本标签商品和具有异常标签的样本异常商品,真实标签为异常标签或正常标签。
202、根据多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图,以及根据多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图。
203、根据风险图和属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型。
在本实施例中,样本商品可以是电商平台上提供的各种商品类别的商品,各种商品类别例如包括但不限于:母婴用品、服饰鞋包、节庆礼品、粮油调味和电器数码等。
在本实施例中,样本标签商品是指具有真实标签的样本商品,其中,真实标签为异常标签或正常标签。异常标签表征样本标签商品是样本异常商品,正常标签表征样本标签商品是样本正常商品。其中,样本异常商品被禁止在电商平台上售卖,样本正常商品被允许在电商平台上售卖。
在本实施例中,进行多轮迭代模型训练,以得到能够用于异常商品识别的目标图神经网络模型。在每轮模型训练时,可以准备一个或多个训练样本,并利用一个或多个训练样本进行本轮模型训练。其中,在准备每个训练样本时,需要准备至少包括一个样本标签商品和一个样本异常商品在内的多个样本商品。多个样本商品中除样本标签商品和样本异常商品之外,还可以包括其他样本商品。其他样本商品可以是真实标签已知的样本标签商品(也可以理解为打上真实标签的样本商品),或者,其他样本商品也可以是真实标签未知的样本商品(也可以理解为没有打上真实标签的样本商品)。
在本实施例中,获取到多个样本商品之后,获取各个样本商品的相关信息,并通过对多个样本商品的相关信息进行大数据分析,可以挖掘出存在风险关联关系的两两样本商品,并基于挖掘出存在风险关联关系的两两样本商品构建反映样本商品之间的风险关联关系的风险图。可选的,每个样本商品的相关信息例如包括但不限于:卖家信息、买家信息和历史访问信息。其中,历史访问信息例如包括但不限于:浏览该样本商品的浏览者信息、历史点击率、历史加入购物车操作次数和历史收藏操作次数等等。
在本实施例中,具有风险关联关系的样本商品是异常商品的概率较大。实际应用中,可以按需灵活定义风险关联关系。风险关联关系例如包括但不限于:同卖家关系、相似卖家关系或者同点击关系。其中,具有同卖家关系的两两样本商品是指售卖该两两样本商品的卖家相同。具有相似卖家关系的两两样本商品是指售卖该两两样本商品的卖家相似。具有同点击关系的两两样本商品是指浏览该两两样本商品的浏览者相同。值得注意的是,若多个卖家所使用的电子设备的设备ID(Device Identifier)或者IP地址(InternetProtocol Address)相同或相似,则多个卖家为相同卖家或相似卖家。其中,设备ID例如包括但不限于:IMEI(International Mobile Equipment Identity,国际移动设备识别码)、MAC(Media Access Control Address,媒体存取控制位址)。
实际应用中,任意两个样本商品之间可能存在一种或多种风险关联关系。例如,样本商品A和样本商品B之间存在同卖家关系、相似卖家关系或者同点击关系,则在风险图中创建连接样本商品A和样本商品B对应的节点的三条连边,其中,一条连边表征同卖家关系,一条连边表征相似卖家关系,一条连边表征同点击关系。于是,在一可选实现方式中,根据多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图可以是:将样本商品抽象为风险图中的节点;基于多个样本商品的相关信息确定存在风险关联关系的每两个样本商品,并为存在风险关联关系的每两个样本商品在风险图中创建连接对应两个节点的连边,其中,每种风险关联关系创建一条连边。
在本申请实施例中,除了构建反映样本商品之间的风险关联关系的风险图,还需要根据多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图。可选的,样本商品的属性特征包括但不限于:材质、风格、产品名(product)、地名、品牌、使用方式、型号或类型等等。在一可选实现方式中,根据多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图具体是:将样本商品抽象为属性图中的节点;针对任意两个样本商品,根据两个样本商品各自的属性特征计算两个样本商品之间的第一属性相似度;确定第一属性相似度大于第一相似度阈值的两个样本商品之间存在属性关联关系,并为存在属性关联关系的两个样本商品在属性图中创建连接对应两个节点的连边。
值得注意的是,第一属性相似度反映的是两个样本商品的属性特征之间的相似度。针对任意两个样本商品,若对应的第一属性相似度大于第一相似度阈值,则该两个样本商品的属性特征相似度较高,并确定该两个样本商品之间存在属性关联关系,此时,需要在属性图中创建该两个样本商品对应节点之间的连边。若对应的第一属性相似度小于或等于第一相似度阈值,则该两个样本商品的属性特征相似度较低,并确定该两个样本商品之间不存在属性关联关系,此时,不需要在属性图中创建该两个样本商品对应节点之间的连边。其中,第一相似度阈值可以根据实际应用需求灵活设置。
在本实施例中,在构建风险图和属性图之后,根据风险图和属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型。其中,初始图神经网络模型是未经训练的图神经网络模型,目标图神经网络模型是经过训练得到的图神经网络模型。
实际应用中,将风险图和属性图输入初始图神经网络模型中,以预测样本标签商品的标签为异常标签的概率,并根据样本标签商品的预测标签结果及其真实标签计算损失函数,根据损失函数调整初始图神经网络模型的模型参数,若本轮模型训练满足模型训练结束条件,则停止模型训练,将更新后的初始图神经网络模型作为最终的目标图神经网络模型。若本轮模型训练不满足模型训练结束条件,则重新执行步骤201至203继续进行模型训练,直至本轮模型训练满足模型训练结束条件。其中,模型训练结束条件根据实际情况设置,模型训练结束条件例如是根据样本标签商品的预测标签结果及其真实标签计算出的损失函数收敛,或者,本轮模型训练次数达到最大模型训练次数。
在本申请实施例中,对损失函数不做限制,损失函数例如包括但不限于:log对数损失函数、交叉熵损失函数(Cross-entropy loss function)和用于解决数据不平衡问题的Focal loss损失函数。
本申请实施例提供的模型训练方法,基于反映样本商品之间的风险关联关系的风险图和反映样本商品之间的属性关联关系的属性图进行图神经网络模型训练,由于在模型训练过程中充分考虑样本商品之间的风险关联关系和样本商品之间的属性关联关系,这样训练得到的目标图神经网络模型能够有效地度量商品之间的风险相关性,进而准确识别异常商品。
在本申请的一些可选实施例中,步骤203的实现方式可以是:将风险图和属性图输入初始图神经网络模型中进行图结构学习,以得到样本标签商品的第一商品特征表示以及样本异常商品的第二商品特征表示;根据第一商品特征表示、第二商品特征表示以及真实标签,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型。
可选的,将风险图和属性图输入初始图神经网络模型中进行图结构学习,以得到样本标签商品的第一商品特征表示以及样本异常商品的第二商品特征表示的实现方式可以是:针对多个样本商品中任一个第一样本商品,从风险图和属性图中确定第一样本商品对应的至少一个第一连边,每条第一连边连接第一样本商品对应的节点和第一样本商品的一个邻居商品对应的节点;根据至少一个第一连边的边权重和对应的至少一个邻居商品的属性特征的向量化表示,生成待拼接的向量化表示;将第一样本商品的属性特征的向量化表示和待拼接的向量化表示进行向量拼接,得到第一样本商品的商品特征表示;其中,在第一样本商品为样本标签商品时,第一样本商品的商品特征表示是指第一商品特征表示;在第一样本商品为样本异常商品时,第一样本商品的商品特征表示是指第二商品特征表示。
在本实施例中,第一样本商品是多个样本商品中的任一样本商品,从风险图和属性图中找出连接该第一样本商品对应节点的一条或多条连边,为了便于理解,将连接该第一样本商品对应节点的连边称作第一连边。应当理解,第一连边除了连接第一样本商品对应的节点,还连接第一样本商品的一个邻居商品对应的节点。在从风险图和属性图中找出一条或多条第一连边之后,可以根据每条第一连边的边权重和对应的邻居商品的属性特征的向量化表示,生成一个待处理向量化表示;以及对至少一个待处理向量化表示进行向量相加,得到待拼接的向量化表示;最后,将第一样本商品的属性特征的向量化表示和待拼接的向量化表示进行向量拼接,得到第一样本商品的商品特征表示。
在本申请实施例中,风险图或属性图中任一连边的边权重,可以根据连边对应的商品的属性特征以及连边所属的边类型确定。在风险图中,一种风险关联关系对应一种边类型,不同风险关联关系对应的边类型不同,于是,在风险图中,两个节点之间可能会出现多条不同边类型的连边,该风险图可以认为是一种异质图;在属性图中,只有一种反映属性关联关系的一种边类型,于是,在属性图中,两个节点之间仅会出现一条连边,不会出现多条连边,该属性图可以认为是一种同质图。
实际应用中,针对任一连边的边权重,可以根据该连边的边类型对应的先验权重,该连边所对应的两个商品在各自在相同属性类别下的属性特征,计算该两个商品之间在相同属性类别下的属性相似度;对该两个商品之间在至少一个属性类别下的至少一个属性相似度进行诸如求和、求平均或者加权平均运算,将运算结果作为该连边的边权重。其中,先验权重根据实际应用需求灵活设置。
为了便于理解,结合公式(1)至(4)进行说明。
假设第一样本商品记为vi,vi的属性特征的向量化表示记为hi,其中,
hi=σ(XiW+b)……(1)
其中,Xi表示vi的属性特征,R表示实数集,da表示属性特征Xi的维度;σ(·)表示激活函数,可选的,σ(·)为RELU(·)激活函数;b表示偏置值;W表示Xi与hi之间的映射矩阵,d表示hi的维度。其中,b和W是图神经网络模型的可学习的模型参数之一。值得注意的是,任一商品的属性特征的向量化表示均可以按照公式(1)得到。
假设第一样本商品的一个邻居商品记为vj,邻居商品vj的属性特征的向量化表示记为hj,针对商品vi和邻居商品vj之间的ψ类型的连边,ψ类型是任一种边类型,假设商品vi和邻居商品vj之间ψ类型的连边的边权重记为Γψ(vi,vj),其中,
Γψ (m)(vi,vj)=f(γψhi (m)Wψ(hj (m))T)……(2)
其中,Γψ (m)(vi,vj)表示商品vi和邻居商品vj在ψ类型连边上的第m个方面(一个方面对应一个属性类别)的属性相似度。Γψ(vi,vj)是对商品vi和邻居商品vj在ψ类型连边上的M个方面的属性相似度进行求和得到的,m和M为正整数,m在1至M中取值,Γψ(vi,vj)∈RM ×1×1。
其中,将商品vi的属性特征的向量化表示hi划分为多头的张量,hi (m)为从hi中划分出的M个张量中的第m个张量。
其中,将邻居商品vj的属性特征的向量化表示hj划分为多头的张量,hj (m)为从划分出的M个张量中的第m个张量,(hj (m))T是hj (m)的转置矩阵。
其中,γψ是ψ连边类型对应的先验权重,γψ的取值可以灵活设置,例如f(·)函数用于保证属性相似度的取值范围0至1之间,f(·)函数可以是任意函数,f(·)函数例如包括但不限于:sigmoid(·)激活函数、ReLU激活函数、Tan双曲正切激活函数。
在本实施例中,在确定风险图和属性图中各条连边的边权重之后,针对商品vi,商品vi的商品特征表示记为Hi,其中,
其中,ai,j,ψ表示风险图或属性图中商品vi和邻居商品vj对应的ψ类型连
其中,HeteAGG(·)为异质聚合器,首先,基于vi的每条连边的边权重和对应邻居商品vj的属性特征的向量化表示得到一个待处理向量化表示对全部的进行向量相加,得到待拼接的向量化表示,以实现邻域信息聚合,接着,将待拼接的向量化表示与商品vi的的属性特征的向量化表示hi进行向量拼接,得到商品vi的商品特征表示Hi。
值得注意的是,在确定商品vi的商品特征表示Hi过程中,考虑聚合邻域信息,能够有效缓解商品之间的低同配率问题(也即异常商品关联的大部分是正常商品的问题)。
在本申请的一些可选实施例中,在图学习过程中,还可以过滤掉风险图或属性图中噪声边,以便基于高质量的风险图或属性图进行图学习。在本申请实施例中,噪声边可以是指属性关联度不大的连边,或者风险关联度不大的连边。于是,进一步可选的,在从风险图和属性图中确定第一样本商品对应的至少一个第一连边之前,针对风险图或属性图中任一条第二连边,第二连边连接第二样本商品对应的节点和第三样本商品对应的节点,根据第二连边的边类型、第二样本商品和第三样本商品各自在至少一个属性类别下的属性特征,删除第二连边,以更新风险图或属性图。
在本实施例中,第二连边为风险图或属性图的任一条连边,判断该第二连边是否为噪声边,若是,则删除该第二连边,若否,则在风险图或属性图中保留该连边。
在一可选实现方式中,根据第二连边的边类型、第二样本商品和第三样本商品各自在至少一个属性类别下的属性特征,删除第二连边具体是:根据第二连边的边类型对应的先验权重、第二样本商品和第三样本商品各自在相同属性类别下的属性特征,计算第二样本商品和和第三样本商品之间在相同属性类别下的第二属性相似度;对第二样本商品和第三样本商品之间在至少一个属性类别下的至少一个第二属性相似度进行求平均值,得到第二属性相似度均值;若第二属性相似度均值小于或等于第二相似度阈值,则删除第二连边。进一步可选的,若第二属性相似度均值大于第二相似度阈值,则对第二样本商品和第三样本商品之间在至少一个属性类别下的至少一个第二属性相似度进行求和,得到第二属性相似度总和,以及将第二属性相似度总和作为第二连边的边权重。
在本实施例中,第二相似度阈值根据实际应用需求灵活设置。若第二属性相似度均值小于或等于第二相似度阈值,说明第二样本商品和第三样本商品之间的风险关联度较差或属性关联度较差;若第二属性相似度均值大于第二相似度阈值,说明第二样本商品和第三样本商品之间的风险关联度较好或属性关联度较好。
值得注意的是,在图结构学习过程中,通过度量商品之间的风险相关性或属性相关性,能够减少风险图或属性图中的噪声边并连接风险相关但未连接的商品,从而在图上进行有效的信息传播和商品特征表示。
为了便于理解,结合公式(5)进行说明
其中,∈为灵活设置的第二相似度阈值。其中,是指第二属性相似度,是指第二属性相似度均值,是指第二属性相似度总和。在满足的条件时,将Γψ(vi,vj)也即作为商品vi和邻居商品vj之间的ψ类型连边的边权重在不满足的条件时,则商品vi和邻居商品vj之间的ψ类型连边的初始边权重设置为0,也即确认商品vi和邻居商品vj之间的ψ类型连边为噪声边,需要删除。进一步可选的,针对商品vi所对应的多条连边的边权重对商品vi所对应的多条连边的边权重进行归一化操作,得到商品vi所对应的多条连边的最终的边权重ai,j,ψ。其中,归一化操作后的商品vi所对应的多条连边的最终的边权重ai,j,ψ的总和为1。
在本申请的一些实施例中,根据第一商品特征表示、第二商品特征表示以及真实标签,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型的实现方式可以是:将第一商品特征表示以及第二商品特征表示输入初始图神经网络模型中的多层感知机层进行度量学习,以预测样本标签商品的标签为异常标签的概率;根据样本标签商品的真实标签及其预测标签结果,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型。
具体而言,在初始图神经网络模型中增设多层感知机层(MLP,MultilayerPerceptron),利用多层感知机层基于样本标签商品的第一商品特征表示、样本异常商品的第二商品特征表示确定样本标签商品和样本异常商品之间的相似度,并基于样本标签商品和样本异常商品之间的相似度准确预测样本标签商品的标签为异常标签的概率。在得到样本标签商品的预测标签结果,基于预测标签结果和样本标签商品的真实标签构建损失函数,并基于损失函数更新初始图神经网络模型的模型参数,以得到目标图神经网络模型。
其中,Xi是样本标签商品vi的属性特征,XS是样本异常商品vs的属性特征。
针对任一样本标签商品vi,根据属性相似度ra(υi,υs)对多个样本异常商品vs进行降序排序,并选择排序靠前的多个样本异常商品vs分别与样本标签商品vi构建训练样本。具体的,每个训练样本中可以包括一个样本异常商品vs和样本标签商品vi。在样本标签商品vi为样本异常商品时,训练样本为正样本;在样本标签商品vi为样本正常商品时,训练样本为负样本。
作为一种示例,基于预测标签结果和样本标签商品的真实标签构建损失函数可以按照如下公式定义:
值得注意的是,在度量学习中,将商品分类任务转换为候选商品和异常商品之间的度量学习任务。具体的,可以为任一样本标签商品vi选择最相关的多个样本异常商品vs,并对任一样本标签商品vi分别与多个样本异常商品vs中每个样本异常商品组成成对训练实例。利用多个成对训练实例进行多子类上的成对度量学习,进而,从样本规模和商品特征表示两个层面对图神经网络模型的监督信息进行增强和丰富。
值得注意的是,在每次训练时,可以采用多个训练样本进行训练,对每个训练样本的损失函数进行求和,得到最终的损失函数设计这样的损失函数能够从样本规模和商品特征表示两个层面对图神经网络模型的监督信息进行增强和丰富,使得图神经网络模型在基于良好的图结构来保证有效的邻居信息聚合之外,还利用足够的细粒度的监督信息进行参数优化,这样训练得到的图神经网络模型能够较好地处理大规模图数据。
进一步可选的,为了增强目标图神经网络模型的模型性能,根据样本标签商品的真实标签及其预测标签结果,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型的实现方式为:根据样本标签商品的真实标签及其预测标签结果创建初始损失函数;根据初始图神经网络模型的当前模型参数生成正则化项,以及根据初始损失函数和正则化项生成目标损失函数;根据目标损失函数,更新初始图神经网络模型的当前模型参数,以得到目标图神经网络模型。
举例来说,目标损失函数按照如下公式进行计算:
其中,记为第t次模型训练的初始损失函数,可以按照公式(7)得到;为第t次模型训练的目标损失函数,t为正整数;ξ表示所有待学习的模型参数集合Θ的权重因子,Ω表示L2正则化项,用于保证模型泛化性能,避免过拟合。
实际应用中,异常商品的属性特征可能被卖家设计的和正常商品的属性特征非常相似,基于商品的属性信息生成的原始的属性图的同配性可能很低,其中,同配性在一定程度上可以反映连边所连接节点对应的商品之间属性相似度。而这样的属性图对目标图神经网络模型的模型性能影响很大。考虑到图结构学习到的商品特征表示中蕴含了潜在的风险特征,采用迭代的图结构优化机制,利用学习到的商品特征表示对属性图进行优化,以保证训练过程中的特征的平滑性和属性图的同配性。
于是,进一步可选的,在每次模型训练后,针对多个样本商品中的任一第四样本商品,根据第四样本商品的商品特征表示和多个样本商品中的各个第五样本商品的商品特征表示,计算第四样本商品与各个第五样本商品之间的特征相似度;若与第四样本商品的特征相似度大于第三相似度阈值的第五样本商品的数量小于或等于设定数量,则在属性图中创建第四样本商品与第五样本商品对应的节点之间的连边;若与第四样本商品的特征相似度大于第三相似度阈值的第五样本商品的数量大于设定数量,则在属性图中删除第四样本商品与第五样本商品对应的节点之间的连边。其中,设定数量和第三相似度阈值根据实际应用需求设置。
具体而言,在每次模型训练时,基于多个样本商品对应的风险图和属性图进行训练,并在本次模型训练之后,根据多个样本商品各自的商品特征表示更新属性图,以保证训练过程中特征的平滑性和属性图的同配性。下面结合公式(9)进行说明。
其中,表示第t次训练所对应的属性图A中商品vi和邻居商品vj之间的连边,表示基于第t-1次训练好的商品vi的商品特征表示Ht-1和邻居商品vj的商品特征表示Ht-1进行余弦相似度计算,所得到余弦相似度作为商品vi和邻居商品vj之间的特征相似度。ranki(·)表示从按照余弦相似度进行降序排序后的邻居商品vj中选择出余弦相似度大于第三相似度阈值的邻居商品vj的数量,其中,k为设定数量。在满足时,在商品vi和邻居商品vj之间创建连边。在不满足时,在商品vi和邻居商品vj之间删除连边。
为了便于理解,结合图3所示的应用场景图对本申请实施例提供的模型训练方法进行说明。参见图3,在模型训练阶段,构建风险图和属性图其中,风险图中各个圆圈表示一个节点,节点之间的连边的边类型包括Ψ1边类型、Ψ2边类型、Ψ3边类型。其中,属性图中各个圆圈表示一个节点,节点之间的连边的边类型均为同一种边类型,可以称作为属性边。将风险图和属性图输入至初始图神经网络模型中进行图结构学习,针对任一商品vi,对商品vi及任一邻居商品vj进行异质相似度量。在异质相似度量时,计算商品vi和邻居商品vj之间ψ类型的连边的边权重Γψ(vi,vj),以及若与可控阈值∈的大小比较结果,在风险图和属性图删除包括商品vi在内的连边。例如,图3中,vi和vj2之间的连边被删除,vi和vj4之间的连边被删除。在图结构学习中,利用异质信息传播机制,确定商品vi的当前邻居商品,并基于商品vi的属性特征的向量化表示和各个当前邻居商品属性特征的向量化表示进行融合,得到商品vi最终的商品特征表示Hi。在成对度量学习阶段,针对成对训练实例中的样本标签商品的商品特征表示及与样本异常商品的商品特征表示进行成对度量学习。在图3中,从标签商品集合中选择与样本标签商品vi最相关的样本异常商品vs1、vs2,vi与vs1 vs2分别组成成对训练实例。由于vi与样本异常商品vs3的相似度不高,vi与vs2不组成成对训练实例。
采用本申请实施例提供的模型训练方法训练得到的目标图神经网络模型可以用于进行异常商品识别。为此,为此,本申请实施例还提供一种异常商品识别方法。图4为本申请实施例提供的一种异常商品识别方法的流程图。参见图4,该方法可以包括以下步骤:
401、获取多个商品,多个商品中至少包括待识别商品以及具有异常标签的异常商品。
402、根据多个商品的风险信息,构建反映商品之间的风险关联关系的目标风险图,以及根据多个商品的属性特征,构建反映商品之间的属性关联关系的目标属性图。
403、将目标风险图和目标属性图输入至目标图神经网络模型中进行异常商品识别,以得到待识别商品的识别结果。
其中,待识别商品的识别结果可以包括待识别商品为异常商品的概率。实际应用中,还可以将概率较大的待识别商品的信息推送给相关审核人员进行人工审核,以减少异常商品误识别率。
本申请实施例提供的异常商品识别方法,由于目标图神经网络模型在模型训练过程中充分考虑样本商品之间的风险关联关系和样本商品之间的属性关联关系,利用这样的目标图神经网络模型能够准确识别异常商品。
图5为本申请实施例提供的一种模型训练装置的结构示意图。参见图5,该装置可以包括:
获取模块51,用于获取多个样本商品,多个样本商品中至少包括具有真实标签的样本标签商品和具有异常标签的样本异常商品,真实标签为异常标签或正常标签;
构建模块52,用于根据多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图,以及根据多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图;
训练模块53,用于根据风险图和属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型。
进一步可选的,构建模块52根据多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图时,具体用于:
将样本商品抽象为风险图中的节点;基于多个样本商品的相关信息确定存在风险关联关系的每两个样本商品,并为存在风险关联关系的每两个样本商品在风险图中创建连接对应两个节点的连边,其中,每种风险关联关系创建一条连边。
进一步可选的,构建模块52根据多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图时,具体用于:将样本商品抽象为属性图中的节点;针对任意两个样本商品,根据两个样本商品各自的属性特征计算两个样本商品之间的第一属性相似度;确定第一属性相似度大于第一相似度阈值的两个样本商品之间存在属性关联关系,并为存在属性关联关系的两个样本商品在属性图中创建连接对应两个节点的连边。
进一步可选的,训练模块53根据风险图和属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型时,具体用于:将风险图和属性图输入初始图神经网络模型中进行图结构学习,以得到样本标签商品的第一商品特征表示以及样本异常商品的第二商品特征表示;根据第一商品特征表示、第二商品特征表示以及真实标签,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型。
进一步可选的,训练模块53根据第一商品特征表示、第二商品特征表示以及真实标签,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型时,具体用于:将第一商品特征表示以及第二商品特征表示输入初始图神经网络模型中的多层感知机层进行度量学习,以预测样本标签商品的标签为异常标签的概率;根据样本标签商品的真实标签及其预测标签结果,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型。
进一步可选的,训练模块53根据样本标签商品的真实标签及其预测标签结果,更新初始图神经网络模型的模型参数,以得到目标图神经网络模型时,具体用于:根据样本标签商品的真实标签及其预测标签结果创建初始损失函数;根据初始图神经网络模型的当前模型参数生成正则化项,以及根据初始损失函数和正则化项生成目标损失函数;根据目标损失函数,更新初始图神经网络模型的当前模型参数,以得到目标图神经网络模型。
进一步可选的,训练模块53将风险图和属性图输入初始图神经网络模型中进行图结构学习,以得到样本标签商品的第一商品特征表示以及样本异常商品的第二商品特征表示时,具体用于:针对多个样本商品中任一第一样本商品,从风险图和属性图中确定第一样本商品对应的至少一个第一连边,每条第一连边连接第一样本商品对应的节点和第一样本商品的一个邻居商品对应的节点;根据至少一个第一连边的边权重和对应的至少一个邻居商品的属性特征的向量化表示,生成待拼接的向量化表示;将第一样本商品的属性特征的向量化表示和待拼接的向量化表示进行向量拼接,得到第一样本商品的商品特征表示;
其中,在第一样本商品为样本标签商品时,第一样本商品的商品特征表示是指第一商品特征表示;在第一样本商品为样本异常商品时,第一样本商品的商品特征表示是指第二商品特征表示。
进一步可选的,训练模块53在从风险图和属性图中确定第一样本商品对应的至少一个第一连边之前,还用于:针对风险图或属性图中任一条第二连边,根据第二连边的边类型、第二样本商品和第三样本商品各自在至少一个属性类别下的属性特征,删除第二连边,以更新风险图或属性图;其中,第二连边连接第二样本商品对应的节点和第三样本商品对应的节点。
进一步可选的,训练模块53根据第二连边的边类型、第二样本商品和第三样本商品各自在至少一个属性类别下的属性特征,删除第二连边,以更新风险图或属性图时,具体用于:根据第二连边的边类型对应的先验权重、第二样本商品和第三样本商品各自在相同属性类别下的属性特征,计算第二样本商品和和第三样本商品之间在相同属性类别下的第二属性相似度;对第二样本商品和第三样本商品之间在至少一个属性类别下的至少一个第二属性相似度进行求平均值,得到第二属性相似度均值;若第二属性相似度均值小于或等于第二相似度阈值,则删除第二连边。
进一步可选的,训练模块53,还用于:若第二属性相似度均值大于第二相似度阈值,则对第二样本商品和第三样本商品之间在至少一个属性类别下的至少一个第二属性相似度进行求和,得到第二属性相似度总和,以及将第二属性相似度总和作为第二连边的边权重。
进一步可选的,训练模块53,还用于:在每次模型训练后,针对多个样本商品中的任一第四样本商品,根据第四样本商品的商品特征表示和多个样本商品中的各个第五样本商品的商品特征表示,计算第四样本商品与各个第五样本商品之间的特征相似度;若与第四样本商品的特征相似度大于第三相似度阈值的第五样本商品的数量小于或等于设定数量,则在属性图中创建第四样本商品与第五样本商品对应的节点之间的连边;若与第四样本商品的特征相似度大于第三相似度阈值的第五样本商品的数量大于设定数量,则在属性图中删除第四样本商品与第五样本商品对应的节点之间的连边。
图5所示的模型训练装置可以执行图2所示实施例中的模型训练方法,其实现原理和技术效果不再赘述。对于上述实施例中的模型训练装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6为本申请实施例提供的一种异常商品识别装置的结构示意图。参见图6,该装置可以包括:
获取模块61,用于获取多个商品,多个商品中至少包括待识别商品以及具有异常标签的异常商品;
构建模块62,用于根据多个商品的风险信息,构建反映商品之间的风险关联关系的目标风险图,以及根据多个商品的属性特征,构建反映商品之间的属性关联关系的目标属性图;
处理模块63,用于将目标风险图和目标属性图输入至目标图神经网络模型中进行异常商品识别,以得到待识别商品的识别结果;其中,目标图神经网络模型是前述实施例提供的模型训练方法训练得到的。
图6所示的异常商品识别装置可以执行图5所示实施例中的异常商品识别方法,其实现原理和技术效果不再赘述。对于上述实施例中的异常商品识别装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤201至步骤203的执行主体可以为设备A;又比如,步骤201和202的执行主体可以为设备A,步骤203的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如201、202等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
图7为本申请实施例提供的一种电子设备的结构示意图。如图7所示,该电子设备包括:存储器71和处理器72;
存储器71,用于存储计算机程序,并可被配置为存储其它各种数据以支持在计算平台上的操作。这些数据的示例包括用于在计算平台上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器71可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器72,与存储器71耦合,用于执行存储器71中的计算机程序,以用于:获取多个样本商品,多个样本商品中至少包括具有真实标签的样本标签商品和具有异常标签的样本异常商品,真实标签为异常标签或正常标签;根据多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图,以及根据多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图;根据风险图和属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型,或者,
处理器72,与存储器71耦合,用于执行存储器71中的计算机程序,以用于:获取多个商品,多个商品中至少包括待识别商品以及具有异常标签的异常商品;根据多个商品的风险信息,构建反映商品之间的风险关联关系的目标风险图,以及根据多个商品的属性特征,构建反映商品之间的属性关联关系的目标属性图;将目标风险图和目标属性图输入至目标图神经网络模型中进行异常商品识别,以得到待识别商品的识别结果。
关于处理器执行各步骤的详细实施过程可参见前述方法实施例中的相关描述,在此不再赘述。
进一步,如图7所示,该电子设备还包括:通信组件73、显示器74、电源组件75、音频组件76等其它组件。图7中仅示意性给出部分组件,并不意味着电子设备只包括图7所示组件。另外,图7中虚线框内的组件为可选组件,而非必选组件,具体可视电子设备的产品形态而定。本实施例的电子设备可以实现为台式电脑、笔记本电脑、智能手机或IOT设备等终端设备,也可以是常规服务器、云服务器或服务器阵列等服务端设备。若本实施例的电子设备实现为台式电脑、笔记本电脑、智能手机等终端设备,可以包含图7中虚线框内的组件;若本实施例的电子设备实现为常规服务器、云服务器或服务器阵列等服务端设备,则可以不包含图7中虚线框内的组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由电子设备执行的各步骤。
相应地,本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,当计算机程序/指令被处理器执行时,致使处理器能够实现上述方法实施例中可由电子设备执行的各步骤。
上述通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G/LTE、5G等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
上述显示器包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。
上述电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
上述音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(MIC),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (14)
1.一种模型训练方法,其特征在于,包括:
获取多个样本商品,所述多个样本商品中至少包括具有真实标签的样本标签商品和具有异常标签的样本异常商品,所述真实标签为异常标签或正常标签;
根据所述多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图,以及根据所述多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图;
根据所述风险图和所述属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型。
2.根据权利要求1所述的方法,其特征在于,根据所述多个样本商品的相关信息,构建反映样本商品之间的风险关联关系的风险图,包括:
将所述样本商品抽象为所述风险图中的节点;
基于所述多个样本商品的相关信息确定存在风险关联关系的每两个样本商品,并为存在风险关联关系的每两个样本商品在所述风险图中创建连接对应两个节点的连边,其中,每种风险关联关系创建一条连边。
3.根据权利要求1所述的方法,其特征在于,根据所述多个样本商品的属性特征,构建反映样本商品之间的属性关联关系的属性图,包括:
将所述样本商品抽象为所述属性图中的节点;
针对任意两个样本商品,根据两个样本商品各自的属性特征计算两个样本商品之间的第一属性相似度;
确定第一属性相似度大于第一相似度阈值的两个样本商品之间存在属性关联关系,并为存在属性关联关系的两个样本商品在所述属性图中创建连接对应两个节点的连边。
4.根据权利要求1所述的方法,其特征在于,根据所述风险图和所述属性图训练初始图神经网络模型,得到能够用于异常商品识别的目标图神经网络模型,包括:
将所述风险图和所述属性图输入所述初始图神经网络模型中进行图结构学习,以得到所述样本标签商品的第一商品特征表示以及所述样本异常商品的第二商品特征表示;
根据所述第一商品特征表示、所述第二商品特征表示以及所述真实标签,更新所述初始图神经网络模型的模型参数,以得到所述目标图神经网络模型。
5.根据权利要求4所述的方法,其特征在于,根据所述第一商品特征表示、所述第二商品特征表示以及所述真实标签,更新所述初始图神经网络模型的模型参数,以得到所述目标图神经网络模型包括:
将所述第一商品特征表示以及所述第二商品特征表示输入所述初始图神经网络模型中的多层感知机层进行度量学习,以预测所述样本标签商品的标签为异常标签的概率;
根据所述样本标签商品的真实标签及其预测标签结果,更新所述初始图神经网络模型的模型参数,以得到所述目标图神经网络模型。
6.根据权利要求5所述的方法,其特征在于,根据所述样本标签商品的真实标签及其预测标签结果,更新所述初始图神经网络模型的模型参数,以得到所述目标图神经网络模型,包括:
根据所述样本标签商品的真实标签及其预测标签结果创建初始损失函数;
根据所述初始图神经网络模型的当前模型参数生成正则化项,以及根据所述初始损失函数和所述正则化项生成目标损失函数;
根据目标损失函数,更新所述初始图神经网络模型的当前模型参数,以得到所述目标图神经网络模型。
7.根据权利要求4所述的方法,其特征在于,将所述风险图和所述属性图输入所述初始图神经网络模型中进行图结构学习,以得到所述样本标签商品的第一商品特征表示以及所述样本异常商品的第二商品特征表示,包括:
针对多个样本商品中任一第一样本商品,从所述风险图和所述属性图中确定所述第一样本商品对应的至少一个第一连边,每条第一连边连接所述第一样本商品对应的节点和所述第一样本商品的一个邻居商品对应的节点;
根据至少一个第一连边的边权重和对应的至少一个邻居商品的属性特征的向量化表示,生成待拼接的向量化表示;
将所述第一样本商品的属性特征的向量化表示和所述待拼接的向量化表示进行向量拼接,得到所述第一样本商品的商品特征表示;
其中,在所述第一样本商品为样本标签商品时,所述第一样本商品的商品特征表示是指所述第一商品特征表示;在所述第一样本商品为样本异常商品时,所述第一样本商品的商品特征表示是指所述第二商品特征表示。
8.根据权利要求7所述的方法,其特征在于,在从所述风险图和所述属性图中确定所述第一样本商品对应的至少一个第一连边之前,还包括:
针对所述风险图或所述属性图中任一条第二连边,根据所述第二连边的边类型、第二样本商品和第三样本商品各自在至少一个属性类别下的属性特征,删除所述第二连边,以更新所述风险图或所述属性图;
其中,所述第二连边连接所述第二样本商品对应的节点和所述第三样本商品对应的节点。
9.根据权利要求8所述的方法,其特征在于,根据所述第二连边的边类型、第二样本商品和第三样本商品各自在至少一个属性类别下的属性特征,删除所述第二连边,以更新所述风险图或所述属性图,包括:
根据所述第二连边的边类型对应的先验权重、所述第二样本商品和所述第三样本商品各自在相同属性类别下的属性特征,计算所述第二样本商品和和所述第三样本商品之间在相同属性类别下的第二属性相似度;
对所述第二样本商品和所述第三样本商品之间在至少一个属性类别下的至少一个第二属性相似度进行求平均值,得到第二属性相似度均值;
若所述第二属性相似度均值小于或等于第二相似度阈值,则删除所述第二连边。
10.根据权利要求8所述的方法,其特征在于,还包括:
若所述第二属性相似度均值大于第二相似度阈值,则对所述第二样本商品和所述第三样本商品之间在至少一个属性类别下的至少一个第二属性相似度进行求和,得到第二属性相似度总和,以及将所述第二属性相似度总和作为所述第二连边的边权重。
11.根据权利要求2至10任一项所述的方法,其特征在于,还包括:
在每次模型训练后,针对多个样本商品中的任一第四样本商品,根据所述第四样本商品的商品特征表示和所述多个样本商品中的各个第五样本商品的商品特征表示,计算所述第四样本商品与各个所述第五样本商品之间的特征相似度;
若与所述第四样本商品的特征相似度大于第三相似度阈值的第五样本商品的数量小于或等于设定数量,则在所述属性图中创建所述第四样本商品与所述第五样本商品对应的节点之间的连边;
若与所述第四样本商品的特征相似度大于第三相似度阈值的第五样本商品的数量大于设定数量,则在所述属性图中删除所述第四样本商品与所述第五样本商品对应的节点之间的连边。
12.一种异常商品识别方法,其特征在于,包括:
获取多个商品,多个商品中至少包括待识别商品以及具有异常标签的异常商品;
根据所述多个商品的风险信息,构建反映商品之间的风险关联关系的目标风险图,以及根据所述多个商品的属性特征,构建反映商品之间的属性关联关系的目标属性图;
将所述目标风险图和所述目标属性图输入至目标图神经网络模型中进行异常商品识别,以得到所述待识别商品的识别结果;
所述目标图神经网络模型是根据权利要求1至11任一项所述的训练方法训练得到的。
13.一种电子设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器耦合至所述存储器,用于执行所述计算机程序以用于执行权利要求1-10任一项所述方法中的步骤,或者,执行权利要求11所述方法中的步骤。
14.一种存储有计算机程序的计算机存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器能够实现权利要求1-10任一项所述方法中的步骤,或者,能够实现权利要求11所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210375012.7A CN114943543A (zh) | 2022-04-11 | 2022-04-11 | 模型训练方法、异常商品识别方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210375012.7A CN114943543A (zh) | 2022-04-11 | 2022-04-11 | 模型训练方法、异常商品识别方法、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114943543A true CN114943543A (zh) | 2022-08-26 |
Family
ID=82906958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210375012.7A Pending CN114943543A (zh) | 2022-04-11 | 2022-04-11 | 模型训练方法、异常商品识别方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114943543A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545467A (zh) * | 2022-09-30 | 2022-12-30 | 广东工业大学 | 一种基于图神经网络的风险商品识别模型 |
-
2022
- 2022-04-11 CN CN202210375012.7A patent/CN114943543A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545467A (zh) * | 2022-09-30 | 2022-12-30 | 广东工业大学 | 一种基于图神经网络的风险商品识别模型 |
CN115545467B (zh) * | 2022-09-30 | 2024-01-23 | 广东工业大学 | 一种基于图神经网络的风险商品识别模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11748379B1 (en) | Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis | |
US11978106B2 (en) | Method and non-transitory, computer-readable storage medium for deep learning model based product matching using multi modal data | |
Miao et al. | Context‐based dynamic pricing with online clustering | |
CN110135901A (zh) | 一种企业用户画像构建方法、系统、介质和电子设备 | |
CN111626832B (zh) | 产品推荐方法、装置及计算机设备 | |
Wijaya et al. | Estimating city-level poverty rate based on e-commerce data with machine learning | |
CN113763095B (zh) | 信息推荐方法、装置和模型训练方法、装置 | |
CN112085567B (zh) | 商品推荐方法、装置、电子设备以及可读介质 | |
US10318546B2 (en) | System and method for test data management | |
US20180284971A1 (en) | Intelligent visual object management system | |
CN109636430A (zh) | 对象识别方法及其系统 | |
US9043752B2 (en) | System for selecting software components based on a degree of coherence | |
CN108109058B (zh) | 一种融合人格特质和物品标签的单分类协同过滤方法 | |
CN110598084A (zh) | 对象排序方法、商品排序方法、装置及电子设备 | |
CN113269232B (zh) | 模型训练方法、向量化召回方法、相关设备及存储介质 | |
Woo et al. | Predicting the ratings of Amazon products using Big Data | |
US10163144B1 (en) | Extracting data from a catalog | |
CN113450172B (zh) | 一种商品推荐方法和装置 | |
CN114943543A (zh) | 模型训练方法、异常商品识别方法、电子设备及存储介质 | |
WO2022017082A1 (zh) | 用于检测虚假交易订单的方法和装置 | |
CN110720099A (zh) | 基于种子监督学习提供推荐的系统和方法 | |
CN111143678A (zh) | 推荐系统和推荐方法 | |
CN113656589B (zh) | 对象属性确定方法、装置、计算机设备及存储介质 | |
CN113792952A (zh) | 用于生成模型的方法和装置 | |
CN113779276A (zh) | 用于检测评论的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |