CN110020662B - 用户分类模型的训练方法和装置 - Google Patents

用户分类模型的训练方法和装置 Download PDF

Info

Publication number
CN110020662B
CN110020662B CN201910019074.2A CN201910019074A CN110020662B CN 110020662 B CN110020662 B CN 110020662B CN 201910019074 A CN201910019074 A CN 201910019074A CN 110020662 B CN110020662 B CN 110020662B
Authority
CN
China
Prior art keywords
user
homogeneous
network
representation
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910019074.2A
Other languages
English (en)
Other versions
CN110020662A (zh
Inventor
胡斌斌
张志强
周俊
李小龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910019074.2A priority Critical patent/CN110020662B/zh
Publication of CN110020662A publication Critical patent/CN110020662A/zh
Application granted granted Critical
Publication of CN110020662B publication Critical patent/CN110020662B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

说明书披露一种用户分类模型的训练方法和装置。该方法包括:基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。

Description

用户分类模型的训练方法和装置
技术领域
本说明书涉及机器学习技术领域,尤其涉及一种用户分类模型的训练方法和装置。
背景技术
随着互联网技术的快速发展,需要对用户进行类别划分的应用场景越来越多。例如,预测用户是否为风险用户,预测用户是否为套现用户等。用户分类模型的准确性将直接影响用户类别划分的准确性。
发明内容
有鉴于此,本说明书提供一种用户分类模型的训练方法和装置。
具体地,本说明书是通过如下技术方案实现的:
一种用户分类模型的训练方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
一种用户分类方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
将所述用户的综合特征表示输入已训练的用户分类模型,输出所述用户的分类结果;
其中,所述用户分类模型根据前述用户分类模型训练方法进行训练。
一种套现用户分类模型的训练方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和套现标签对分类模型进行训练,得到套现用户分类模型。
一种用户分类模型的训练方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
采用所述若干不同的同质用户网络和所述同质用户网络中各用户的类别标签对自编码模型、融合模型和分类模型进行联合训练;
其中,所述自编码模型用于针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
所述融合模型用于针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
所述分类模型用于将用户的综合特征表示作为输入,输出所述用户的类别标签。
一种用户分类模型的训练装置,包括:
网络构建单元,基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
表示生成单元,针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
表示融合单元,针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
模型训练单元,采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
一种用户分类模型的训练装置,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,通过读取并执行所述存储器存储的与用户分类模型的训练逻辑对应的机器可执行指令,所述处理器被促使:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
由以上描述可以看出,本说明书可将多种多样的用户历史信息按照维度划分,以构建多个不同的同质用户网络,然后可为每个同质用户网络中的用户生成在该同质用户网络下的特征表示,并可融合各用户在不同同质用户网络下的特征表示,得到各用户的综合特征表示,该综合特征表示融合了用户在各维度下的特征,对用户刻画性更强。并且,本说明书采用各用户的综合特征表示和类别标签对分类模型进行训练,采用有监督的训练方式,可得到准确度更高的模型。
附图说明
图1是本说明书一示例性实施例示出的一种用户分类模型的训练方法的流程示意图。
图2是本说明书一示例性实施例示出的另一种用户分类模型的训练方法的流程示意图。
图3是本说明书一示例性实施例示出的一种同质用户网络的结构示意图。
图4是本说明书一示例性实施例示出的另一种用户分类模型的训练方法的流程示意图。
图5是本说明书一示例性实施例示出的一种用于用户分类模型的训练装置的一结构示意图。
图6是本说明书一示例性实施例示出的一种用户分类模型的训练装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本说明书提供一种用户分类模型的训练方案,可基于用户在不同维度下的历史信息构建若干不同的同质用户网络,并为每个用户生成其在每个同质用户网络下的特征表示,然后融合同一用户在不同同质用户网络下的特征表示,得到对应该用户的综合特征表示,该综合特征表示融合了用户在各维度下的特征,对用户刻画性更强。然后,可采用各用户的综合特征表示和类别标签对分类模型进行训练,得到准确性更高的用户分类模型。
下面结合具体的实施例来描述本说明书的实现过程。
请参考图1和图2,本说明书提供的用户分类模型的训练方法可包括以下步骤:
步骤102,基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系。
在本实施例中,用户的历史信息可包括:交易信息、转账信息、设备使用信息、社交信息等。
基于每个维度下的用户历史信息均可构建一个同质用户网络。所述同质用户网络中的节点均代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系。
以转账信息为例,可构建的同质用户网络是转账网络,所述转账网络中的每个节点可代表对应的用户,所述转账网络中的连边代表所连接的用户之间存在转账关系,连边的权重可基于转账次数、转账金额等信息确定。在转账网络中,连边所连接的用户之间的转账关系属于直接的关联关系。
请参考图3的示例,用户1和用户2至用户6均存在转账关系,用户4和用户6之间存在转账关系。
再以交易信息为例,可构建的同质用户网络是交易网络,所述交易网络中的每个节点也可代表对应的用户,所述交易网络中的连边代表所连接的用户在同一商户发生过交易行为,连边的权重可基于交易次数、交易金额、交易频率等信息确定。在交易网络中,连边所连接的用户之间的关联关系属于间接的关联关系。
举例来讲,假设用户1和用户2均在某餐馆就餐过,则在交易网络中用户1和用户2之间存在连边。再假设用户1和用户3均在同一家网店购买过物品,则在交易网络中,用户1和用户3之间也存在连边。
值得注意的是,在进行交易网络等同质用户网络的构建时,可根据用户账号与商户账号/用户账号之间的资金往来确定上述关联关系,这部分的处理与实现可参照相关技术,本说明书在此不再一一赘述。
再以设备信息为例,可构建的同质用户网络是设备网络,所述设备网络中的每个节点也可代表对应的用户,所述设备网络中的连边代表所连接的用户使用过同一设备,连边的权重可基于登录次数、最后使用时间距今时长等信息确定。在设备网络中,连边所连接的用户之间的关联关系也属于间接的关联关系。
上述设备可包括:手机、平板电脑、PC等终端设备,也可以包括用于接入网络的网络设备,例如Wi-Fi热点设备等,本说明书对此不作特殊限制。
基于社交信息等其他用户历史信息构建同质用户网络的方法与上述信息类似,本说明书在此不再一一赘述。
步骤104,针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示。
基于前述步骤102,针对构建的每个同质用户网络,可为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示。以用户的角度来看,可生成每个用户在各不同同质用户网络下的特征表示。
假设,前述步骤102构建出3个同质用户网络,分别为转账网络、交易网络和设备网络,则在本步骤中,可生成各用户在这3个同质用户网络下的特征表示,即每个用户对应3个特征表示。
上述特征表示的形式可包括:低维向量、矩阵、分布等。
在本实施例中,可采用自编码机(Autoencoder)的编码器来生成上述特征表示。例如,为每个不同的同质用户网络训练对应的自编码机,后续采用已训练的自编码机的编码器来进行特征表示的生成。
请参考图4,自编码机的训练过程可包括:
步骤1042,构建编码器、解码器和损失函数。
在本实施例中,编码器和解码器均可采用神经网络实现。
步骤1044,将用户在所述同质用户网络中的网络结构特征输入所述编码器,得到所述用户的内在表示。
在本实施例中,用户在同质用户网络中的网络结构特征可包括其一阶邻居的属性特征。所述一阶邻居是与该用户存在连边的用户。
在一个例子中,可将所述用户的各个一阶邻居在同一维度下的属性特征进行加权平均,并可将得到的加权平均值作为所述用户在该维度下的网络结构特征。
所述属性特征的维度可包括各应用场景通用的维度,例如:用户年龄、用户性别、用户职业、用户年收入等。
所述属性特征的维度还可包括针对应用场景所设置的个性化维度。
例如,反套现场景中,所述属性特征可包括:历史交易量、历史交易金额、历史套现率、历史套现金额等。
再例如,在反欺诈场景中,所述属性特征可包括:历史交易量、历史交易金额、历史投诉量、历史欺诈金额等。
请继续参考图3,以属性特征的维度是历史交易量为例,在确定用户1在历史交易量维度下的网络结构特征时,可将用户1的一阶邻居用户2至用户6的历史交易量分别乘以对应的连边权重后求和,然后再计算求和值的平均值,并将该平均值作为用户1在历史交易量维度下的网络结构特征。
在其他例子中,用户在同质用户网络中的网络结构特征还可包括其二阶邻居的属性特征等,本说明书对此不作特殊限制。
在本实施例中,将用户在所述同质用户网络中的各个维度下的网络结构特征输入所述编码器,通过所述编码器可输出与该用户对应的特征表示,在本例中,可将该特征表示称为内在表示,所述内在表示包括了所述用户在所述同质用户网络中的网络结构信息。
步骤1046,将所述内在表示输入所述解码器,输出所述用户的重构表示。
在对自编码机进行训练时,可将编码器输出的内在表示输入解码器,并可将解码器的输出称为重构表示。
步骤1048,根据所述损失函数计算所述重构表示和所述用户的属性特征之间的差异,并基于所述差异优化所述编码器和所述解码器的参数,直至所述差异满足预定条件。
在本实施例中,所述用户的属性特征可与所述用户的网络结构特征相对应,例如在反套现场景中所述用户的属性特征也可包括年龄、性别、职业、年收入、历史交易量、历史交易金额、历史套现率、历史套现金额等。
在本实施例中,可基于构建的损失函数计算各用户的重构表示和其自身的属性特征之间的差异,该差异越小,可说明重构的损失越小。
然后,可基于该差异优化所述编码器和解码器的参数,并基于优化后的编码器和解码器重复执行步骤1044至步骤1048,直到所述差异满足预定条件。所述预定条件可以是差异最小,或差异小于阈值等,本说明书对此不作特殊限制。
在本实施例中,可将用户在所在同质用户网络中的网络结构特性输入与该同质用户网络对应的已训练的自编码机,并可将该自编码机输出的用户内在表示作为用户在该同质用户网络下的特征表示。
在本实施例中,通过已训练的自编码机,可很好的将用户自身的属性特征和用户的网络结构特征保留在用户的特征表示中。
当然,在其他例子中,也可采用其他方式生成用户在各同质用户网络下的特征表示,本说明书对此不作特殊限制。
步骤106,针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示。
在本实施例中,可采用注意力机制融合所述用户在不同同质用户网络下的特征表示。例如,可采用注意力机制先确定用户在不同同质用户网络中的权重,然后采用加权平均的方式得到用户的综合特征表示。
在采用注意力机制对用户的特征表示进行融合时,也可设置对应的损失函数。基于该损失函数可确定融合后的综合特征表示和融合前各同质用户网络下特征表示的差异,并可基于该差异对上述权重进行调整,使得融合后的综合特征表示与融合前各同质用户网络下的特征表示尽可能相近。
步骤108,采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
在本实施例中,所述分类模型可包括:逻辑回归模型、多层感知机模型等,本说明书对此不作特殊限制。
所述类别标签与所述分类模型的应用场景相关,可以为二分类标签,例如0或1。
举例来说,在反套现场景中,所述类别标签0可表示对应用户没有套现行为,1可表示对应用户存在套现行为;在反欺诈场景中,所述类别标签0可表示对应用户是欺诈用户,1可表示对应用户是正常用户等。
基于已训练的用户分类模型,后续可将用户的综合特征表示输入所述用户分类模型,输出用户的分类结果。
由以上描述可以看出,本实施例可将多种多样的用户历史信息按照维度划分,以构建多个不同的同质用户网络,然后可为每个同质用户网络中的用户生成在该同质用户网络下的特征表示,并可融合各用户在不同同质用户网络下的特征表示,得到各用户的综合特征表示,该综合特征表示融合了用户在各维度下的特征,对用户刻画性更强。并且,本实施例采用各用户的综合特征表示和类别标签对分类模型进行训练,采用有监督的训练方式,可得到准确度更高的模型。
本说明书还提供另一种用户分类模型的训练方法,可采用端到端模型(end toend)来实现。
请参考图4,在本实施例中,依然可基于用户在不同维度下的历史信息构建若干不同的同质用户网络,然后可将构建的各同质用户网络和所述同质用户网络中各用户的类别标签输入用于用户分类的端到端模型进行训练。
所述用户分类模型可包括三类子模型:自编码子模型、融合子模型以及分类子模型。
其中,所述自编码子模型用于针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示。
例如,所述自编码层可训练若干与同质用户网络一一对应的自编码机,每个自编码机的编码器可用于为对应同质用户网络中的用户生成对应的特征表示。
所述融合子模型用于针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示。
例如,可采用注意力机制融合所述用户在不同同质用户网络下的特征表示等。
所述分类子模型用于将用户的综合特征表示作为输入,输出所述用户的类别标签。
在本实施例中,在上述用户分类模型的训练时,可综合自编码子模型的重构损失、融合子模型的融合损失以及分类子模型的预测损失来进行训练。
上述自编码子模型、融合子模型以及分类子模型的实现方法可参考前述图1所示的实施例,本说明书在此不再一一赘述。
采用端到端的用户分类模型,后续可直接将构建的同质用户网络输入已训练的端到端模型,输出各用户的分类结果,使用更方便。并且,模型对数据的自调节空间更多,整体契合度更高。
本说明书还提供一种套现用户分类模型的训练方法。
所述套现用户分类模型可用于对信用卡持卡用户、虚拟信用卡持卡用户的预测。例如,预测用户在接下来一段时间内是否会进行套现等。
在本实施例中,可基于用户在不同维度下的历史信息构建交易网络、转账网络和设备网络,然后为各网络下的用户生成在该网络下的特征表示,并可融合各用户在不同同质用户网络下的特征表示,得到各用户的综合特征表示。接着,再采用各用户的综合特征表示和套现标签对分类模型进行训练,得到套现用户分类模型。
上述网络构建、特征表示的生成、特征表示的融合以及分类模型的训练过程可以参考前述图1所示的实施例,本说明书在此不再一一赘述。
当然,在其他例子中,也可以采用图4所示的端到端模型来实现套现用户分类模型,本说明书对此不作特殊限制。
与前述用户分类模型的训练方法的实施例相对应,本说明书还提供了用户分类模型的训练装置的实施例。
本说明书用户分类模型的训练装置的实施例可以应用在服务器上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在服务器的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图5所示,为本说明书用户分类模型的训练装置所在服务器的一种硬件结构图,除了图5所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的服务器通常根据该服务器的实际功能,还可以包括其他硬件,对此不再赘述。
图6是本说明书一示例性实施例示出的一种用户分类模型的训练装置的框图。
请参考图6,所述用户分类模型的训练装置500可以应用在前述图5所示的服务器中,包括有:网络构建单元501、表示生成单元502、表示融合单元503以及模型训练单元504。
其中,网络构建单元501,基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
表示生成单元502,针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
表示融合单元503,针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
模型训练单元504,采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
可选的,所述表示生成单元502,将所述用户在所述同质用户网络中的网络结构特征输入与该同质用户网络对应的已训练自编码机的编码器,输出所述用户在该同质用户网络下的特征表示。
可选的,所述自编码机的训练过程,包括:
构建编码器、解码器和损失函数;
将用户在所述同质用户网络中的网络结构特征输入所述编码器,得到所述用户的内在表示;
将所述内在表示输入所述解码器,输出所述用户的重构表示;
根据所述损失函数计算所述重构表示和所述用户的属性特征之间的差异,并基于所述差异优化所述编码器和所述解码器的参数,直至所述差异满足预定条件。
可选的,所述网络结构特征包括:所述用户的一阶邻居的属性特征。
可选的,所述表示融合单元503,针对每个用户,采用注意力机制融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
与前述用户分类模型的训练方法的实施例相对应,本说明书还提供一种用户分类模型的训练装置,该装置包括:处理器以及用于存储机器可执行指令的存储器。其中,处理器和存储器通常借由内部总线相互连接。在其他可能的实现方式中,所述设备还可能包括外部接口,以能够与其他设备或者部件进行通信。
在本实施例中,通过读取并执行所述存储器存储的与用户分类模型的训练逻辑对应的机器可执行指令,所述处理器被促使:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
可选的,在为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示时,所述处理器被促使:
将所述用户在所述同质用户网络中的网络结构特征输入与该同质用户网络对应的已训练自编码机的编码器,输出所述用户在该同质用户网络下的特征表示。
可选的,所述自编码机的训练过程,包括:
构建编码器、解码器和损失函数;
将用户在所述同质用户网络中的网络结构特征输入所述编码器,得到所述用户的内在表示;
将所述内在表示输入所述解码器,输出所述用户的重构表示;
根据所述损失函数计算所述重构表示和所述用户的属性特征之间的差异,并基于所述差异优化所述编码器和所述解码器的参数,直至所述差异满足预定条件。
可选的,所述网络结构特征包括:所述用户的一阶邻居的属性特征。
可选的,在融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示时,所述处理器被促使:
针对每个用户,采用注意力机制融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示。
与前述用户分类模型的训练方法的实施例相对应,本说明书还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现以下步骤:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
可选的,所述为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示,包括:
将所述用户在所述同质用户网络中的网络结构特征输入与该同质用户网络对应的已训练自编码机的编码器,输出所述用户在该同质用户网络下的特征表示。
可选的,所述自编码机的训练过程,包括:
构建编码器、解码器和损失函数;
将用户在所述同质用户网络中的网络结构特征输入所述编码器,得到所述用户的内在表示;
将所述内在表示输入所述解码器,输出所述用户的重构表示;
根据所述损失函数计算所述重构表示和所述用户的属性特征之间的差异,并基于所述差异优化所述编码器和所述解码器的参数,直至所述差异满足预定条件。
可选的,所述网络结构特征包括:所述用户的一阶邻居的属性特征。
可选的,所述融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示,包括:
针对每个用户,采用注意力机制融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

Claims (19)

1.一种用户分类模型的训练方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,每个同质用户网络与一个维度相对应,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
2.根据权利要求1所述的方法,所述为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示,包括:
将所述用户在所述同质用户网络中的网络结构特征输入与该同质用户网络对应的已训练自编码机的编码器,输出所述用户在该同质用户网络下的特征表示。
3.根据权利要求2所述的方法,所述自编码机的训练过程,包括:
构建编码器、解码器和损失函数;
将用户在所述同质用户网络中的网络结构特征输入所述编码器,得到所述用户的内在表示;
将所述内在表示输入所述解码器,输出所述用户的重构表示;
根据所述损失函数计算所述重构表示和所述用户的属性特征之间的差异,并基于所述差异优化所述编码器和所述解码器的参数,直至所述差异满足预定条件。
4.根据权利要求2所述的方法,
所述网络结构特征包括:所述用户的一阶邻居的属性特征。
5.根据权利要求1所述的方法,所述融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示,包括:
针对每个用户,采用注意力机制融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示。
6.一种用户分类方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
将所述用户的综合特征表示输入已训练的用户分类模型,输出所述用户的分类结果;
其中,所述用户分类模型根据权利要求1所述的方法进行训练。
7.一种套现用户分类模型的训练方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,每个同质用户网络与一个维度相对应,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和套现标签对分类模型进行训练,得到套现用户分类模型。
8.根据权利要求7所述的方法,所述为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示,包括:
将所述用户在所述同质用户网络中的网络结构特征输入与该同质用户网络对应的已训练自编码机的编码器,输出所述用户在该同质用户网络中的特征表示。
9.根据权利要求8所述的方法,所述网络结构特征包括以下一种或多种:
一阶邻居的历史交易量、一阶邻居的历史套现率、一阶邻居的历史交易金额、一阶邻居的年龄、一阶邻居的性别、一阶邻居的职业、一阶邻居的所在地。
10.根据权利要求7所述的方法,
所述同质用户网络包括:交易网络,所述交易网络中的连边代表连接的用户在同一商户发生过交易行为。
11.根据权利要求7所述的方法,
所述同质用户网络包括:转账网络,所述转账网络中的连边代表连接的用户之间发生过转账行为。
12.根据权利要求7所述的方法,
所述同质用户网络包括:设备网络,所述设备网络中的连边代表连接的用户使用过同一设备。
13.一种用户分类模型的训练方法,包括:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,每个同质用户网络与一个维度相对应,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
采用所述若干不同的同质用户网络和所述同质用户网络中各用户的类别标签对自编码模型、融合模型和分类模型进行联合训练;
其中,所述自编码模型用于针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
所述融合模型用于针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
所述分类模型用于将用户的综合特征表示作为输入,输出所述用户的类别标签。
14.一种用户分类模型的训练装置,包括:
网络构建单元,基于用户在不同维度下的历史信息构建若干不同的同质用户网络,每个同质用户网络与一个维度相对应,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
表示生成单元,针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
表示融合单元,针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
模型训练单元,采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
15.根据权利要求14所述的装置,
所述表示生成单元,将所述用户在所述同质用户网络中的网络结构特征输入与该同质用户网络对应的已训练自编码机的编码层,输出所述用户在该同质用户网络下的特征表示。
16.根据权利要求15所述的装置,所述自编码机的训练过程,包括:
构建编码器、解码器和损失函数;
将用户在所述同质用户网络中的网络结构特征输入所述编码器,得到所述用户的内在表示;
将所述内在表示输入所述解码器,输出所述用户的重构表示;
根据所述损失函数计算所述重构表示和所述用户的属性特征之间的差异,并基于所述差异优化所述编码器和所述解码器的参数,直至所述差异满足预定条件。
17.根据权利要求15所述的装置,
所述网络结构特征包括:所述用户的一阶邻居的属性特征。
18.根据权利要求14所述的装置,
所述表示融合单元,针对每个用户,采用注意力机制融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示。
19.一种用户分类模型的训练装置,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,通过读取并执行所述存储器存储的与用户分类模型的训练逻辑对应的机器可执行指令,所述处理器被促使:
基于用户在不同维度下的历史信息构建若干不同的同质用户网络,每个同质用户网络与一个维度相对应,所述同质用户网络中的节点代表用户,连边代表所连接的用户在对应维度下存在直接或间接的关联关系;
针对每个同质用户网络,为该同质用户网络中的每个用户生成在该同质用户网络下的特征表示;
针对每个用户,融合所述用户在不同同质用户网络下的特征表示,得到所述用户的综合特征表示;
采用各用户的综合特征表示和类别标签对分类模型进行训练,得到用户分类模型。
CN201910019074.2A 2019-01-09 2019-01-09 用户分类模型的训练方法和装置 Active CN110020662B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910019074.2A CN110020662B (zh) 2019-01-09 2019-01-09 用户分类模型的训练方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910019074.2A CN110020662B (zh) 2019-01-09 2019-01-09 用户分类模型的训练方法和装置

Publications (2)

Publication Number Publication Date
CN110020662A CN110020662A (zh) 2019-07-16
CN110020662B true CN110020662B (zh) 2023-08-22

Family

ID=67188779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910019074.2A Active CN110020662B (zh) 2019-01-09 2019-01-09 用户分类模型的训练方法和装置

Country Status (1)

Country Link
CN (1) CN110020662B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837565B (zh) * 2019-11-14 2022-08-12 中山大学 实现药品推荐的模型训练装置及计算机设备
CN111260462B (zh) * 2020-01-16 2022-05-27 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN111274907B (zh) * 2020-01-16 2023-04-25 支付宝(中国)网络技术有限公司 使用类别识别模型来确定用户的类别标签的方法和装置
CN111368147B (zh) * 2020-02-25 2021-07-06 支付宝(杭州)信息技术有限公司 图特征处理的方法及装置
CN113011979A (zh) * 2021-03-29 2021-06-22 中国银联股份有限公司 交易检测方法、模型的训练方法、装置及计算机可读存储介质
CN113362157B (zh) * 2021-05-27 2024-02-09 中国银联股份有限公司 异常节点识别方法、模型的训练方法、装置及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101819572A (zh) * 2009-09-15 2010-09-01 电子科技大学 一种用户兴趣模型的建立方法
CN102467728A (zh) * 2010-11-09 2012-05-23 上海悦易网络信息技术有限公司 多方交易系统及交易方法
CN107093090A (zh) * 2016-10-25 2017-08-25 北京小度信息科技有限公司 异常用户识别方法及装置
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置

Also Published As

Publication number Publication date
CN110020662A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110020662B (zh) 用户分类模型的训练方法和装置
WO2020024716A1 (zh) 一种针对新场景的预测模型训练方法及装置
WO2018013566A1 (en) Machine learning and prediction using graph communities
CN110827138B (zh) 一种推送信息确定方法及装置
CN111553488B (zh) 一种针对用户行为的风险识别模型训练方法及系统
WO2020023647A1 (en) Privacy preserving ai derived simulated world
CN110009365B (zh) 非正常转移电子资产的用户群体检测方法、装置和设备
WO2020024718A1 (zh) 外汇交易量预测方法和装置
CN112330358A (zh) 产品销量预测的方法和装置、存储介质和电子设备
CN110046301B (zh) 对象推荐方法和装置
US10956976B2 (en) Recommending shared products
CN107451854A (zh) 确定用户类型的方法及装置、电子设备
CN112669143A (zh) 基于关联网络的风险评估方法、装置、设备以及存储介质
TW202001749A (zh) 套現識別方法和裝置
CN115269997A (zh) 一种金融产品推荐方法及装置
CN110020910B (zh) 对象推荐方法和装置
CN113034168A (zh) 内容项投放方法、装置、计算机设备及存储介质
Liu et al. Stackelberg risk preference design
CN114756720B (zh) 时序数据的预测方法及装置
CN111144899A (zh) 识别虚假交易的方法及装置和电子设备
CN114797113A (zh) 基于图卷积的资源预测方法及装置
CN110096376B (zh) 一种数据转移方法及相关设备
CN109300049A (zh) 保单贷款利息的计算方法、终端设备及介质
CN116151635B (zh) 一种基于多维关系图的抗风险企业决策的优化方法和装置
US20240202256A1 (en) Seller risk detection by product community and supply chain modelling with only transaction records

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant