CN112668703A - 一种用户收入确定方法及装置 - Google Patents

一种用户收入确定方法及装置 Download PDF

Info

Publication number
CN112668703A
CN112668703A CN202110069681.7A CN202110069681A CN112668703A CN 112668703 A CN112668703 A CN 112668703A CN 202110069681 A CN202110069681 A CN 202110069681A CN 112668703 A CN112668703 A CN 112668703A
Authority
CN
China
Prior art keywords
node
user
attribute
vector
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110069681.7A
Other languages
English (en)
Inventor
卓正兴
杨青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Du Xiaoman Technology Beijing Co Ltd
Original Assignee
Shanghai Youyang New Media Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Youyang New Media Information Technology Co ltd filed Critical Shanghai Youyang New Media Information Technology Co ltd
Priority to CN202110069681.7A priority Critical patent/CN112668703A/zh
Publication of CN112668703A publication Critical patent/CN112668703A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种用户收入确定方法及装置,获取需要进行收入预测的用户(即,目标用户)的用户属性特征和关联属性特征,其中,用户属性特征是目标用户的自身属性特征,如,性别、年龄、学历、住址、工作年限、工作单位、所属行业等;关联属性特征在一定程度也能够反映用户收入,例如,工作单位的基本信息、住址的基本信息等。将目标用户的用户属性特征及关联属性特征输入至预先训练得到的收入预测模型进行分析,得到该目标用户对应的收入区间。该方案不仅利用用户自身的属性特征,还充分挖掘了能够反映用户收入的关联信息,通过对用户多维度的信息进行分析,使得最终得到用户的收入区间水平更准确。

Description

一种用户收入确定方法及装置
技术领域
本发明属于机器学习技术领域,尤其涉及一种用户收入确定方法及装置。
背景技术
信贷业务通常依赖于对用户的收入认定决定用户的贷款额度。传统的判断用户收入的方式通常是利用机器学习手段对用户的自身变量进行预测,得到用户的贷款额度,例如,用户的自身变量可以包括:性别、年龄、工作年限、行业、学历等信息。虽然这些信息在一定程度上反映用户的收入区间,但是,这种依据用户的自身变量确定的收入区间并不准确。
发明内容
有鉴于此,本发明的目的在于提供一种用户收入确定方法及装置,以解决传统技术中仅根据用户的自身变量预测用户的收入存在的预测结果不准确的问题,其公开的技术方案如下:
第一方面,本申请提供了一种用户收入确定方法,包括:
获取目标用户的用户属性特征和关联属性特征,其中,所述关联属性特征包括反映用户收入的其他维度信息;
利用预先训练得到的收入预测模型,对所述用户属性特征及所述关联属性特征进行分析,得到所述目标用户对应的收入区间。
在第一方面一种可能的实现方式中,所述获取目标用户的用户属性特征和关联属性特征,包括:
获取所述目标用户的用户属性特征,所述用户属性特征包括个人属性信息及反映所述目标用户的社会关联关系的社会关联信息;
根据所述目标用户的社会关联信息,获取与所述目标用户相关联的关联节点;
获取与所述目标用户的节点之间具有关联关系的关联节点的属性特征,得到所述关联属性特征。
在第一方面另一种可能的实现方式中,所述利用预先训练得到的收入预测模型,对所述用户属性特征及所述关联属性特征进行分析,得到所述目标用户对应的收入区间,包括:
根据每个节点的属性特征获得属性向量,所述节点包括用户节点及其他类型节点;
针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量,所述关联节点是与所述任一节点之间具有关联关系的节点;
对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数;
根据目标用户对应的节点的最后一层汇聚向量得到所述目标用户的收入区间。
在第一方面再一种可能的实现方式中,所述方法还包括:
存储任一节点对应的所述第i层汇聚向量,以及所述节点的唯一标识,得到节点中间向量映射表;
所述对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,包括:
获取所述关联节点对应的唯一标识;
从所述节点中间向量映射表中,查询与所述关联节点的唯一标识相匹配的第i层汇聚向量;
利用与所述任一节点及所述关联节点之间的关联关系相匹配的汇聚函数,对所述任一节点对应的第i层汇聚向量及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量。
在第一方面又一种可能的实现方式中,预先训练所述收入预测模型的过程,包括:
获取训练样本节点对应的属性特征,以及获取关联节点对应的属性特征,所述训练样本节点是用户节点,所述关联节点是与所述训练样本节点相关联的节点;根据每个节点对应的属性特征获得属性向量;
针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量;
对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数;
根据所述训练样本节点对应的最后一层汇聚向量得到所述训练样本节点对应的收入预测值;
根据所述训练样本节点对应的收入准确值,对各个汇聚函数中的参数及汇聚层数进行调整,直到所述收入预测值与所述收入准确值之间的损失满足预设收敛条件,得到所述收入预测模型;
其中,所述汇聚函数用于对所述节点的向量进行汇聚。
第二方面,本申请还提供了一种用户收入确定装置,包括:
用户属性特征获取模块,用于获取目标用户的用户属性特征;
关联特征获取模块,用于获取所述目标用户对应的关联属性特征,其中,所述关联属性特征包括反映用户收入的其他维度信息;
分析模块,用于利用预先训练得到的收入预测模型,对所述用户属性特征及所述关联属性特征进行分析,得到所述目标用户对应的收入区间。
在第二方面一种可能的实现方式中,所述关联特征获取模块,包括:
社会关联信息获取子模块,用于获取所述目标用户的用户属性特征中包含的社会关联信息,所述社会关联信息是反映所述目标用户的社会关联关系的信息;
关联节点获取子模块,用于根据所述目标用户的社会关联信息,获取与所述目标用户相关联的关联节点;
关联属性特征获取子模块,用于获取与所述目标用户的节点之间具有关联关系的关联节点的属性特征,得到所述关联属性特征。
在第二方面另一种可能的实现方式中,所述分析模块,包括:
向量获取子模块,用于根据每个节点的属性特征获得属性向量,所述节点包括用户节点及其他类型节点;
第一汇聚向量获取子模块,用于针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量,所述关联节点是与所述任一节点之间具有关联关系的节点;
第二汇聚向量获取子模块,用于对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数;
收入区间确定子模块,用于根据目标用户对应的节点的最后一层汇聚向量得到所述目标用户的收入区间。
在第二方面再一种可能的实现方式中,所述装置还包括:
中间向量存储模块,用于存储任一节点对应的所述第i层汇聚向量,以及所述节点的唯一标识,得到节点中间向量映射表。
第三方面,本申请还提供了一种电子设备,包括:存储器和处理器;
所述存储器内存储有程序,所述处理器调用所述存储器内的程序以实现第一方面任一种可能的实现方式所述的用户收入确定方法。
第四方面,本申请还提供了一种计算机可读存储介质,该存储介质中存储有程序,该程序由计算设备执行时实现上述的用户收入确定方法。
本发明提供的用户收入确定方法,获取需要进行收入预测的用户(即,目标用户)的用户属性特征和关联属性特征,其中,用户属性特征是目标用户的自身属性特征,如,性别、年龄、学历、住址、工作年限、工作单位、所属行业等;关联属性特征在一定程度也能够反映用户收入,例如,工作单位的基本信息、住址的基本信息等。将目标用户的用户属性特征及关联属性特征输入至预先训练得到的收入预测模型进行分析,得到该目标用户对应的收入区间。该方案不仅利用用户自身的属性特征,还充分挖掘了能够反映用户收入的关联信息,通过对用户多维度的信息进行分析,使得最终得到用户的收入区间水平更准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种用户收入确定系统的结构示意图;
图2是一种现实中用户的关联数据实例的示意图;
图3是本申请实施例提供的一种关联网络图的示意图;
图4是本申请实施例提供的一种用户收入的确定方法的流程图;
图5是本申请实施例提供的一种获取用户属性特征和关联属性特征的过程的流程图;
图6是本申请实施例提供的另一种用户收入的确定方法的流程图;
图7是本申请实施例提供的一种获得汇聚向量过程的示意图;
图8是本申请实施例提供的一种向量汇聚过程的示意图;
图9是本申请实施例提供的一种训练收入预测模型过程的流程图;
图10是本申请实施例提供的一种用户收入确定装置的结构示意图;
图11是本申请实施例提供的另一种用户收入确定装置的结构示意图;
图12是本申请实施例提供的又一种用户收入确定装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,示出了本申请实施例提供的一种用户收入确定系统的结构示意图,该系统包括:关联网络图构建模块100和收入预测模型200。
目标用户(即,需要进行收入预测的用户)的信息作为关联网络图构建模块100的输入。
目标用户的信息包括用户属性信息和表征用户的社会关联关系的社会关联信息。其中,用户属性信息中包括用户的性别、年龄、身份证号、工作年限等个人信息,社会关联信息包括联系人、工作单位、所属行业、住址等。
此外,用户的信息可以从用户提交的信息及用户授权产品收集的信息中获取,例如,用户在移动终端上安装APP时,APP会请求获取移动终端中的部分信息,如联系人信息、IP地址或WiFi热点等信息。
其中,社会关联信息可以从公共网络中获得,例如,从用户填写的信息中提取工作单位的名称,进而从公共网络中获取该单位名称对应的相关信息,如注册资本、成立年份、所属行业等。
关联网络图构建模块100用于将用户、工作单位、工作地、居住地等作为节点,并根据用户的信息建立不同节点之间的关联,得到异构的关联网络图。例如,通过工作地可以对用户进行关联,通过居住地也可以对用户进行关联,以及,通过工作单位也可以对用户进行关联。而工作单位、工作地、居住地等节点在一定程度上反映了用户的收入区间水平。
例如,图2示出了一种现实中用户的关联数据实例的示意图,如图2所示,用户A的个人属性信息包括:性别:男;年龄:35;学历:硕士;信用卡最大额度:5k;用户A的关联属性信息:住宅小区A,建造年代:2000年;物业费:5元/m2,本月均价5w/m2;公司B:注册资本:2000w,公司成立日期:2006年;行业:计算机。可见,用户的关联属性信息在一定程度反映了用户的收入区间水平。
如图3所示,示出了本申请实施例提供的一种关联网络图的示意图,该关联网络图根据图2所示的用户关联数据实例得到。图3中的节点A表示图2中的用户A,节点B表示图2中的住宅小区A,节点C表示图2中的工作单位B。节点之间的连线表示节点之间的关联关系。
通过关联网络图表示用户与其他节点(住宅、公司、其他用户等)之间的关联关系,综合考虑这种关联关系分析得到该用户的收入区间水平。
预测模型200,用于根据关联网络图构建模块构建的关联网络图,获得目标用户的关联节点,并获取关联节点的属性特征,进而根据目标用户的用户属性特征和关联属性特征分析得到收入区间。
请参见图4,示出了本申请实施例提供的一种用户收入的确定方法的流程图,该方法应用于图1所示的系统中,如图4所示,该方法可以包括以下步骤:
S110,获取目标用户的用户属性特征和关联属性特征。
其中,所述关联属性特征包括反映用户收入的其他维度信息,例如,用户的工作单位的相关信息,如注册资金、成立年份;用户住宅的相关信息,如,建造年代、出售均价等。
在本申请的一个实施例中,如图5所示,获取用户属性特征和关联属性特征的过程可以包括以下步骤:
S111,获取目标用户的用户属性特征。
其中,用户属性特征包括个人属性信息以及反映目标用户的社会关联关系的社会关联信息。
在本申请的一个实施例中,可以从用户提交的信息或用户授权产品收集的信息中获取用户属性特征。
S112,根据目标用户的社会关联信息,获取与目标用户相关联的关联节点。
例如,用户的社会关联信息中包括联系人、工作单位和住宅小区等,分别建立用户节点与联系人的节点、工作单位节点及住宅小区节点等之间的关联关系。当对该用户的收入进行预测时,从关联网络图中确定出与该用户节点相关联的关联节点。
S113,获取与目标用户的节点之间具有关联关系的关联节点的属性特征,即,得到目标用户对应的关联属性特征。
从公共网络中获取与该用户节点相关联的关联节点的属性特征,如,工作单位节点的属性特征包括注册资金、成立日期、所属行业等;又如,住宅节点属性特征包括建造年代、物业费、出售单价等。
S120,利用预先训练得到的收入预测模型,对用户属性特征及关联属性特征进行分析,得到目标用户对应的收入区间。
利用训练样本数据预先训练得到收入预测模型,当需要预测某个用户(即,目标用户)的收入区间水平时,将目标用户对应的用户属性特征及关联属性特征输入收入预测模型,该模型的输出即该用户的收入预测结果。
本实施例提供的用户收入确定方法,获取需要进行收入预测的用户(即,目标用户)的用户属性特征和关联属性特征,其中,用户属性特征是目标用户的自身属性特征,如,性别、年龄、学历、住址、工作年限、工作单位、所属行业等;关联属性特征在一定程度也能够反映用户收入,例如,工作单位的基本信息、住址的基本信息等。将目标用户的用户属性特征及关联属性特征输入至预先训练得到的收入预测模型进行分析,得到该目标用户对应的收入区间。该方案不仅利用用户自身的属性特征,还充分挖掘了能够反映用户收入的关联信息,通过对用户多维度的信息进行分析,使得最终得到用户的收入区间水平更准确。
请参见图6,示出了本申请实施例提供的另一种用户收入的确定方法的流程图,本实施例将着重介绍收入预测模型预测用户收入的详细过程,如图6所示,该方法可以包括以下步骤:
S210,获取目标用户的用户属性特征和关联属性特征。
其中,所述关联属性特征包括反映用户收入的其他维度信息。
此外,S210的具体实施过程与图5所示的过程相同,此处不再赘述。
S220,根据每个节点的属性特征获得属性向量。其中,节点包括用户节点及其他类型节点。
对于关联网络图中的每个节点,利用与节点类型相对应的映射函数将节点的属性信息转换为向量,从而得到该节点的向量表示,即,将节点的属性信息转换为收入预测模型能够处理的向量。
其中,不同的节点对应不同的映射函数,映射函数可以是前馈神经网络。而且,映射函数可以通过对训练样本数据训练得到。
S230,针对任一节点,对该节点及关联节点对应的属性向量分别进行汇聚,得到该节点的第1层汇聚向量。
所述关联节点是与所述任一节点之间具有关联关系的节点。
S240,对任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数。
在一个实施例中,获得任一节点的向量后,对应存储节点的唯一标识及节点对应的向量,从而得到节点中间向量映射表,当任一节点的任一层汇聚向量更新后同步更新该节点中间向量映射表。
此种情况下,当进行汇聚时,从节点中间向量映射表中查询相关节点对应的向量,从而缩短汇聚所需时间。
请参见图7,示出了本申请实施例提供的一种获得汇聚向量过程的示意图。
在获得目标用户节点的第1层汇聚向量时,从节点中间向量映射表中查询目标用户节点及其关联节点对应的属性向量,并按照预设汇聚函数进行汇聚。
同理,在获得目标用户节点的第i+1层汇聚向量时,根据节点的唯一标识直接从节点中间向量映射表中,查询目标用户节点及其关联节点对应的第i层汇聚向量进行汇聚得到。从而大大缩短了汇聚过程耗用的时间。
S250,根据目标用户对应的节点的最后一层汇聚向量得到目标用户的收入区间。
其中,向量逐层汇聚过程所使用的汇聚函数中的参数和汇聚层数均可以通过训练样本数据训练得到。
下面结合图8,以图3所示关联网络图中的节点A为例说明收入预测模型内部的处理过程。
假设图3中的节点A为目标用户的节点,且节点A的关联节点分别为节点B和节点C,其中,节点B表示住宅节点,节点C表示工作单位节点。
如图8所示,首先将节点A及关联节点B和C对应的属性信息利用相应的映射函数转换为相应的属性向量,例如,针对节点A的属性信息,利用节点A对应的映射函数得到节点A的向量表示,同理,分别获得节点B和C的向量表示。
然后,针对节点A及其关联节点对应的向量进行N次汇聚后,根据节点A的最后一层汇聚向量得到节点A对应的收入预测额结果。
图8中包括两层汇聚,如图8所示,对节点A的属性向量及节点B、C对应的属性向量分别利用不同的汇聚函数进行汇聚得到节点A对应的第1层汇聚向量。
其中,不同关联关系之间的汇聚函数不同,例如,节点A与节点B之间的关联关系是居住关系,节点A与节点B之间的汇聚函数表示为f1;节点A与节点C之间是工作关系,节点A与节点C之间的汇聚函数表示为f2
利用f1对节点A和节点B的属性向量进行汇聚,同时,利用f2对节点A和节点C的属性向量进行汇聚后,得到节点A的第1层汇聚向量,并作为节点A的最新向量表示。同理,节点B和相对应的关联节点的属性向量汇聚得到节点B对应的第1层汇聚向量。同理获得节点C对应的第1层汇聚向量。
然后,继续利用节点A、节点B和节点C对应的第1层汇聚向量汇聚得到节点A的第2层汇聚向量。
最后,将节点A对应的第2层汇聚向量经过线性转换后得到节点A的收入处于各个预设收入区间的概率值,并取概率值最大的收入区间作为节点A最终的收入区间,作为收入预测模型的最终输出结果。
本实施例提供的用户收入的确定方法,利用目标用户节点的属性向量与其关联节点的属性向量进行多层汇聚后得到目标用户对应的收入预测结果,该方案不仅利用用户自身的属性特征,还充分挖掘了能够反映用户收入的关联信息,通过对用户多维度的信息进行分析,使得最终得到用户的收入区间水平更准确。
请参见图9,示出了本申请实施例提供的一种训练收入预测模型过程的流程图。
收入预测模型的训练过程是将包含收入准确值的训练样本数据输入至原始收入预测模型中,以使收入预测模型不断学习得到用户的用户属性特征和关联属性特征与收入区间之间的关系,从而得到最终用于预测用户收入区间的收入预测模型。
如图9所示,收入预测模型训练过程可以包括以下步骤:
S310,获取训练样本节点对应的属性特征,以及获取关联节点对应的属性特征。
所述训练样本节点是用户节点,所述关联节点是与所述训练样本节点相关联的节点;根据每个节点对应的属性特征获得属性向量。
S320,针对任一节点,对任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量。
S330,对任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数。
S340,根据所述训练样本节点对应的最后一层汇聚向量得到所述训练样本节点对应的收入预测值。
S350,根据所述训练样本节点对应的收入准确值,对各个汇聚函数中的参数及汇聚层数进行调整,直到收入预测值与收入准确值之间的损失满足预设收敛条件,得到收入预测模型。
在本申请的一个实施例中,收入准确值可以从用户提交的证明文件或授权官方数据库中获得。
收入预测值与收入准确值之间的损失可以根据损失函数计算得到,其中,损失函数可以是均方差损失函数或其它损失函数。
例如,预设收敛条件可以是迭代次数达到预设数值,或者,损失值达到预设值。
相应于上述的用户收入确定方法实施例,本申请还提供了用户收入确定装置实施例。
请参见图10,示出了本申请实施例提供的一种用户收入确定装置的结构示意图,如图10所示,该装置包括:
用户属性特征获取模块110,用于获取目标用户的用户属性特征。
关联特征获取模块120,用于获取所述目标用户对应的关联属性特征。其中,所述关联属性特征包括反映用户收入的其他维度信息。
在本申请的一个实施例中,关联特征获取模块120包括:
社会关联信息获取子模块,用于获取所述目标用户的用户属性特征中包含的社会关联信息。
所述社会关联信息是反映所述目标用户的社会关联关系的信息。
关联节点获取子模块,用于根据所述目标用户的社会关联信息,获取与所述目标用户相关联的关联节点。
关联属性特征获取子模块,用于获取与所述目标用户的节点之间具有关联关系的关联节点的属性特征,得到所述关联属性特征。
分析模块130,用于利用预先训练得到的收入预测模型,对所述用户属性特征及所述关联属性特征进行分析,得到所述目标用户对应的收入区间。
在本申请的一个实施例中,分析模块包括:
向量获取子模块,用于根据每个节点的属性特征获得属性向量,所述节点包括用户节点及其他类型节点。
第一汇聚向量获取子模块,用于针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量,所述关联节点是与所述任一节点之间具有关联关系的节点。
第二汇聚向量获取子模块,用于对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数。
收入区间确定子模块,用于根据目标用户对应的节点的最后一层汇聚向量得到所述目标用户的收入区间。
本实施例提供的用户收入确定装置,不仅利用用户自身的属性特征,还充分挖掘了能够反映用户收入的关联信息,通过对用户多维度的信息进行分析,使得最终得到用户的收入区间水平更准确。
请参见图11,示出了本申请实施例提供的另一种用户收入确定装置的结构示意图,该装置在图10所示实施例的基础上还包括:
中间向量存储模块210,用于存储任一节点对应的所述第i层汇聚向量,以及所述节点的唯一标识,得到节点中间向量映射表。
本实施例中,第一汇聚向量获取子模块,用于针对任一节点,获取该节点及各个关联节点对应的唯一标识,并从节点中间向量映射表中查询各个关联节点对应的属性向量,并对所述任一节点及关联节点对应的属性向量进行汇聚得到所述任一节点对应的第1层汇聚向量。
同理,第二汇聚向量获取子模块,用于针对任一节点,从节点中间向量映射表中查询各个节点对应的第i层汇聚向量并进行汇聚得到所述任一节点对应的第i+1层汇聚向量。
本实施例提供的用户收入的确定装置,利用目标用户节点的属性向量与其关联节点的属性向量进行多层汇聚后得到目标用户对应的收入预测结果,该方案不仅利用用户自身的属性特征,还充分挖掘了能够反映用户收入的关联信息,通过对用户多维度的信息进行分析,使得最终得到用户的收入区间水平更准确。
请参见图12,示出了本申请实施例提供的又一种用户收入确定装置的结构示意图,该装置在图10所示实施例的基础上还包括:
样本属性特征获取模块310,用于获取训练样本节点对应的属性特征,以及获取关联节点对应的属性特征.
所述训练样本节点是用户节点,所述关联节点是与所述训练样本节点相关联的节点;根据每个节点对应的属性特征获得属性向量。
第一节点向量汇聚模块320,用于针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量;
第二节点向量汇聚模块330,用于对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数。
收入预测模块340,用于根据所述训练样本节点对应的最后一层汇聚向量得到所述训练样本节点对应的收入预测值;
模型参数调整模块350,用于根据所述训练样本节点对应的收入准确值,对各个汇聚函数中的参数及汇聚层数进行调整,直到所述收入预测值与所述收入准确值之间的损失满足预设收敛条件,得到所述收入预测模型。
本实施例提供的用户收入确定装置,通过包含用户属性特征和关联属性特征的训练样本数据对收入预测模型的模型参数进行训练得到最终用于收入预测的收入预测模型,从而提高了收入预测模型的预测结果准确率。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现上述的任一种用户收入确定方法实施例。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机可读存储介质,该存储介质中存储有程序,该程序由计算设备执行时实现上述的用户收入确定方法。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
需要说明的是,本说明书中的各个实施例记载的技术特征可以相互替代或组合,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请各实施例中的装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
本申请所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种用户收入确定方法,其特征在于,包括:
获取目标用户的用户属性特征和关联属性特征,其中,所述关联属性特征包括反映用户收入的其他维度信息;
利用预先训练得到的收入预测模型,对所述用户属性特征及所述关联属性特征进行分析,得到所述目标用户对应的收入区间。
2.根据权利要求1所述的方法,其特征在于,所述获取目标用户的用户属性特征和关联属性特征,包括:
获取所述目标用户的用户属性特征,所述用户属性特征包括个人属性信息及反映所述目标用户的社会关联关系的社会关联信息;
根据所述目标用户的社会关联信息,获取与所述目标用户相关联的关联节点;
获取与所述目标用户的节点之间具有关联关系的关联节点的属性特征,得到所述关联属性特征。
3.根据权利要求1或2所述的方法,其特征在于,所述利用预先训练得到的收入预测模型,对所述用户属性特征及所述关联属性特征进行分析,得到所述目标用户对应的收入区间,包括:
根据每个节点的属性特征获得属性向量,所述节点包括用户节点及其他类型节点;
针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量,所述关联节点是与所述任一节点之间具有关联关系的节点;
对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数;
根据目标用户对应的节点的最后一层汇聚向量得到所述目标用户的收入区间。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
存储任一节点对应的所述第i层汇聚向量,以及所述节点的唯一标识,得到节点中间向量映射表;
所述对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,包括:
获取所述关联节点对应的唯一标识;
从所述节点中间向量映射表中,查询与所述关联节点的唯一标识相匹配的第i层汇聚向量;
利用与所述任一节点及所述关联节点之间的关联关系相匹配的汇聚函数,对所述任一节点对应的第i层汇聚向量及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量。
5.根据权利要求1所述的方法,其特征在于,预先训练所述收入预测模型的过程,包括:
获取训练样本节点对应的属性特征,以及获取关联节点对应的属性特征,所述训练样本节点是用户节点,所述关联节点是与所述训练样本节点相关联的节点;根据每个节点对应的属性特征获得属性向量;
针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量;
对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数;
根据所述训练样本节点对应的最后一层汇聚向量得到所述训练样本节点对应的收入预测值;
根据所述训练样本节点对应的收入准确值,对各个汇聚函数中的参数及汇聚层数进行调整,直到所述收入预测值与所述收入准确值之间的损失满足预设收敛条件,得到所述收入预测模型;
其中,所述汇聚函数用于对所述节点的向量进行汇聚。
6.一种用户收入确定装置,其特征在于,包括:
用户属性特征获取模块,用于获取目标用户的用户属性特征;
关联特征获取模块,用于获取所述目标用户对应的关联属性特征,其中,所述关联属性特征包括反映用户收入的其他维度信息;
分析模块,用于利用预先训练得到的收入预测模型,对所述用户属性特征及所述关联属性特征进行分析,得到所述目标用户对应的收入区间。
7.根据权利要求6所述的装置,其特征在于,所述关联特征获取模块,包括:
社会关联信息获取子模块,用于获取所述目标用户的用户属性特征中包含的社会关联信息,所述社会关联信息是反映所述目标用户的社会关联关系的信息;
关联节点获取子模块,用于根据所述目标用户的社会关联信息,获取与所述目标用户相关联的关联节点;
关联属性特征获取子模块,用于获取与所述目标用户的节点之间具有关联关系的关联节点的属性特征,得到所述关联属性特征。
8.根据权利要求6或7所述的装置,其特征在于,所述分析模块,包括:
向量获取子模块,用于根据每个节点的属性特征获得属性向量,所述节点包括用户节点及其他类型节点;
第一汇聚向量获取子模块,用于针对任一节点,对所述任一节点及关联节点对应的属性向量分别进行汇聚,得到所述任一节点的第1层汇聚向量,所述关联节点是与所述任一节点之间具有关联关系的节点;
第二汇聚向量获取子模块,用于对所述任一节点及所述关联节点对应的第i层汇聚向量进行汇聚,得到所述任一节点对应的第i+1层汇聚向量,其中,i为正整数;
收入区间确定子模块,用于根据目标用户对应的节点的最后一层汇聚向量得到所述目标用户的收入区间。
9.根据权利要求6所述的方法,其特征在于,所述装置还包括:
中间向量存储模块,用于存储任一节点对应的所述第i层汇聚向量,以及所述节点的唯一标识,得到节点中间向量映射表。
10.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器内存储有程序,所述处理器调用所述存储器内的程序以实现权利要求1-5任一项所述的用户收入确定方法。
CN202110069681.7A 2021-01-19 2021-01-19 一种用户收入确定方法及装置 Pending CN112668703A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110069681.7A CN112668703A (zh) 2021-01-19 2021-01-19 一种用户收入确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110069681.7A CN112668703A (zh) 2021-01-19 2021-01-19 一种用户收入确定方法及装置

Publications (1)

Publication Number Publication Date
CN112668703A true CN112668703A (zh) 2021-04-16

Family

ID=75415587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110069681.7A Pending CN112668703A (zh) 2021-01-19 2021-01-19 一种用户收入确定方法及装置

Country Status (1)

Country Link
CN (1) CN112668703A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822464A (zh) * 2021-08-11 2021-12-21 大箴(杭州)科技有限公司 用户信息的处理方法及装置、电子设备、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574622A (zh) * 2016-02-05 2016-05-11 北京普猎创新网络科技有限公司 一种从业者职业生涯总收入预估方法
CN110197301A (zh) * 2019-05-27 2019-09-03 深圳乐信软件技术有限公司 一种可支配收入的预测方法、装置、服务器及存储介质
CN110490388A (zh) * 2019-08-27 2019-11-22 中国联合网络通信集团有限公司 预测用户收入的方法及系统
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN111667374A (zh) * 2020-06-10 2020-09-15 创新奇智(上海)科技有限公司 一种构建用户画像的方法、装置、存储介质和电子设备
CN111858711A (zh) * 2020-07-20 2020-10-30 深圳凤凰木网络有限公司 一种个人财富估值方法、装置、存储介质及计算机设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574622A (zh) * 2016-02-05 2016-05-11 北京普猎创新网络科技有限公司 一种从业者职业生涯总收入预估方法
CN110197301A (zh) * 2019-05-27 2019-09-03 深圳乐信软件技术有限公司 一种可支配收入的预测方法、装置、服务器及存储介质
CN110490388A (zh) * 2019-08-27 2019-11-22 中国联合网络通信集团有限公司 预测用户收入的方法及系统
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN111667374A (zh) * 2020-06-10 2020-09-15 创新奇智(上海)科技有限公司 一种构建用户画像的方法、装置、存储介质和电子设备
CN111858711A (zh) * 2020-07-20 2020-10-30 深圳凤凰木网络有限公司 一种个人财富估值方法、装置、存储介质及计算机设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822464A (zh) * 2021-08-11 2021-12-21 大箴(杭州)科技有限公司 用户信息的处理方法及装置、电子设备、存储介质

Similar Documents

Publication Publication Date Title
WO2020135535A1 (zh) 一种推荐模型训练方法及相关装置
Li et al. Multi-attribute decision making with generalized fuzzy numbers
CN111079056A (zh) 提取用户画像的方法、装置、计算机设备和存储介质
RU2013143815A (ru) Компьютерная система, база данных и использование таковых
CN111931076B (zh) 基于有权有向图进行关系推荐的方法、装置和计算机设备
Chan et al. Modelling customer satisfaction for product development using genetic programming
CN110008397B (zh) 一种推荐模型训练方法及装置
WO2020073727A1 (zh) 风险预测方法、装置、计算机设备和存储介质
CN108021673A (zh) 一种用户兴趣模型生成方法、职位推荐方法及计算设备
CN110647683B (zh) 一种信息推荐方法、装置
JP7231317B2 (ja) 推定装置、推定方法及び推定プログラム
CN111695024A (zh) 对象评估值的预测方法及系统、推荐方法及系统
CN113706251A (zh) 基于模型的商品推荐方法、装置、计算机设备和存储介质
CN115564152A (zh) 基于stirpat模型的碳排放量预测方法及装置
CN116401379A (zh) 金融产品数据推送方法、装置、设备及存储介质
CN112668703A (zh) 一种用户收入确定方法及装置
CN110889748B (zh) 店商平台产品推荐方法、装置、计算机设备以及存储介质
CN111079894B (zh) Bp神经网络模型构建、商家评价方法与装置
CN116503092A (zh) 用户留资意向识别方法、装置、电子设备及存储介质
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN114429384B (zh) 基于电商平台的产品智能推荐方法及系统
CN116049544A (zh) 一种全局因子分解的多特征融合网络兴趣预测方法
CN113779116A (zh) 对象排序方法、相关设备及介质
CN114707510A (zh) 资源推荐信息推送方法、装置、计算机设备及存储介质
CN110544165B (zh) 一种信用风险评分卡创建方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: B7-7-2, Yuxing Plaza, No.5, Huangyang Road, Yubei District, Chongqing

Applicant after: Chongqing duxiaoman Youyang Technology Co.,Ltd.

Address before: 201800 room j1328, 3 / F, building 8, 55 Huiyuan Road, Jiading District, Shanghai

Applicant before: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20211213

Address after: 100193 Room 606, 6 / F, building 4, West District, courtyard 10, northwest Wangdong Road, Haidian District, Beijing

Applicant after: Du Xiaoman Technology (Beijing) Co.,Ltd.

Address before: B7-7-2, Yuxing Plaza, No.5, Huangyang Road, Yubei District, Chongqing

Applicant before: Chongqing duxiaoman Youyang Technology Co.,Ltd.

TA01 Transfer of patent application right