CN111178925B - 用户画像的属性预测方法、装置、服务器和计算机可读介质 - Google Patents

用户画像的属性预测方法、装置、服务器和计算机可读介质 Download PDF

Info

Publication number
CN111178925B
CN111178925B CN201811334383.0A CN201811334383A CN111178925B CN 111178925 B CN111178925 B CN 111178925B CN 201811334383 A CN201811334383 A CN 201811334383A CN 111178925 B CN111178925 B CN 111178925B
Authority
CN
China
Prior art keywords
attribute
neural network
user portrait
task
characteristic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811334383.0A
Other languages
English (en)
Other versions
CN111178925A (zh
Inventor
康建峰
孟一凡
李春林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811334383.0A priority Critical patent/CN111178925B/zh
Publication of CN111178925A publication Critical patent/CN111178925A/zh
Application granted granted Critical
Publication of CN111178925B publication Critical patent/CN111178925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本公开提供了一种用户画像的属性预测方法,该方法包括:基于预先生成的多任务学习的神经网络模型和预先获取的指定的特征信息,对所述用户画像的多个属性标签进行预测生成多个所述属性标签的预测结果。本公开还提供了一种用户画像的属性预测装置、服务器和计算机可读介质。

Description

用户画像的属性预测方法、装置、服务器和计算机可读介质
技术领域
本公开涉及计算机技术领域,具体地,涉及用户画像的属性预测方法、装置、服务器和计算机可读介质。
背景技术
随着大数据及互联网技术的发展,用户画像在用户分析、精准营销、个性推荐等场景发挥越来越大的作用。用户画像具备多个属性,用户画像的多个属性预测通常通过针对每个属性标签单独挖掘的方法实现,具体包为:指定要预测的属性标签;分别在各属性标签上单独进行样本清洗、特征筛选、训练建模及线上预测。
发明内容
本公开实施例提出了用户画像的属性预测方法、装置、服务器和计算机可读介质。
第一方面,本公开实施例提供了一种用户画像的属性预测方法,包括:
基于预先生成的多任务学习的神经网络模型和预先获取的指定的特征信息,对所述用户画像的多个属性标签进行预测生成多个所述属性标签的预测结果。
在一些实施例中,还包括:
设定所述用户画像的多个属性标签;
获取与多个属性标签关联的特征信息;
根据多个属性标签和与多个属性标签关联的特征信息,构建所述多任务学习的神经网络结构;
基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型。
在一些实施例中,所述设定所述用户画像的多个属性标签包括:
从所述用户画像的多个属性中选定多个待预测的属性;
为每个待预测的属性设定所述属性标签。
在一些实施例中,所述基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型包括:
通过多个属性标签和多个特征信息对预先定义的联合损失函数进行优化得出所述多任务学习的神经网络结构的最优节点参数,所述联合损失函数包括多个属性的损失函数之和;
根据所述多任务学习的神经网络结构和所述最优节点参数,得出所述多任务学习的神经网络模型。
在一些实施例中,所述多任务学习的神经网络结构包括输入层、隐层、特定任务层和特定任务输出层;
所述输入层用于输入用户画像的多个所述属性标签和与多个属性标签关联的特征信息;
所述隐层用于实现多任务学习的特征信息共享;
所述特定任务层中特定的神经网络用于学习特定任务的信息;
所述特定任务输出层中的每个节点基于特定任务层的执行结果输出不同的预测结果。
在一些实施例中,所述指定的特征信息和与多个属性标签关联的特征信息相同。
第二方面,本公开实施例提供了一种用户画像的属性预测装置,包括:
第一生成模块,用于基于预先生成的多任务学习的神经网络模型和预先获取的指定的特征信息,对所述用户画像的多个属性标签进行预测生成多个所述属性标签的预测结果。
在一些实施例中,还包括:
设定模块,用于设定所述用户画像的多个属性标签;
获取模块,用于获取与多个属性标签关联的特征信息;
构建模块,用于根据多个属性标签和与多个属性标签关联的特征信息,构建所述多任务学习的神经网络结构;
第二生成模块,用于基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型。
在一些实施例中,所述设定模块包括:
选定子模块,用于从所述用户画像的多个属性中选定多个待预测的属性;
设定子模块,用于为每个待预测的属性设定所述属性标签。
在一些实施例中,所述第二生成模块包括:
优化子模块,用于通过多个属性标签和多个特征信息对预先定义的联合损失函数进行优化得出所述多任务学习的神经网络结构的最优节点参数,所述联合损失函数包括多个属性的损失函数之和;
生成子模块,用于根据所述多任务学习的神经网络结构和所述最优节点参数,得出所述多任务学习的神经网络模型。
在一些实施例中,所述指定的特征信息和与多个属性标签关联的特征信息相同。
第三方面,本公开实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面中任一实现方法描述的用户画像的属性预测方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,所述程序被执行时实现如第一方面中任一实现方法描述的用户画像的属性预测方法。
本公开实施例提供的用户画像的属性预测方法、装置、服务器和计算机可读介质的技术方案中,基于预先生成的多任务学习的神经网络模型和预先获取的指定的特征信息,对用户画像的多个属性标签进行预测生成多个属性标签的预测结果,从而提高了开发及线上预测效率,提高了预测结果的准确率,降低了预测资源开销,提高了关联的特征信息的使用效果。
附图说明
附图用来提供对本公开的实施例作进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
图1为本公开实施例提供的另一种用户画像的属性预测方法的流程图;
图2为本公开实施例中步骤201的流程图;
图3为本公开实施例中多任务学习的神经网络结构的示意图;
图4为本公开实施例中步骤204的流程图;
图5为本公开实施例提供的另一种用户画像的属性预测方法的流程图;
图6为本公开实施例提供的一种用户画像的属性预测装置的结构示意图;
图7为本公开实施例提供的另一种用户画像的属性预测装置的结构示意图;
图8为本公开实施例中设定模块的结构示意图;
图9为本公开实施例中第二生成模块的结构示意图。
具体实施方式
为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的用户画像的属性预测方法进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。
除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
本公开实施例提供了一种用户画像的属性预测方法该方法包括:基于预先生成的多任务学习的神经网络模型和预先获取的指定的特征信息,对所述用户画像的多个属性标签进行预测生成多个所述属性标签的预测结果。
本公开实施例提供的属性预测方法中,基于预先生成的多任务学习的神经网络模型和预先获取的指定的特征信息,对用户画像的多个属性标签进行预测生成多个属性标签的预测结果,从而提高了开发及线上预测效率,提高了预测结果的准确率,降低了预测资源开销,提高了关联的特征信息的使用效果。
图1为本公开实施例提供的另一种用户画像的属性预测方法的流程图,如图1所示,该方法包括:
步骤201、设定用户画像的多个属性标签。
本公开实施例的执行主体可以为用户画像的属性预测装置,该用户画像的属性预测装置可设置在服务器中。
本公开实施例中,用户画像可包括人口社会属性、长期兴趣爱好、短期意图、应用程序(app)及设备属性和地理位置属性中之一或其任意组合。其中,人口社会属性可包括性别、年龄、婚姻状态、收入水平、消费水平、教育水平、人生阶段(例如:学生、母婴、家有学生)和资产状况中之一或其任意组合。人口社会属性中的属性之间相互关联,不同属性之间存在属性关联及特征共享情况,例如:在大中城市,对于一个家里有新生儿的用户,通常年龄为25-34岁,婚姻状态为已婚,消费水平相对较高;且较强的特征主要为母婴特征,同时因男女性别的不同母婴特征强弱也不相同。由于人口社会属性是用户画像的重要组成部分,且是用户画像建设的重点,因此本公开实施例仅以人口社会属性对用户画像进行描述,但是本公开的用户画像不限于此。
图2为本公开实施例中步骤201的流程图,如图2所示,步骤201具体可包括:
步骤2011、从用户画像的多个属性中选定多个待预测的属性。
具体地,可从人口社会属性的多个属性中选定多个待预测的属性。例如:选定的待预测的属性的数量为3个,则选定的3个待预测的属性包括性别、年龄和婚姻状态。需要说明的是:本公开实施例仅以性别、年龄和婚姻状态作为示例进行描述,但是本公开中待预测的属性不限于此。
步骤2012、为每个待预测的属性设定属性标签。
例如:当待预测的属性包括性别时,设定的属性标签包括性别属性标签;当待预测的属性包括年龄时,设定的属性标签包括年龄属性标签;当待预测的属性包括婚姻状态时,设定的属性标签包括婚姻状态属性标签。因此设定的属性标签可包括性别属性标签、年龄属性标签和婚姻状态属性标签。
其中,性别属性标签可包括男和女;年龄属性标签可包括18岁以下、18-24岁、25-34岁、35-44岁、45-54岁和55岁以上;婚姻状态标签可包括已婚和未婚。
本公开实施例中设定的多个属性标签可作为预测样本,例如,预测样本的输出格式为:用户id、性别属性标签、年龄属性标签和婚姻状态属性标签。其中,用户id可用于标识各个属性标签属于哪个用户。
步骤202、获取与多个属性标签关联的特征信息。
本公开实施例中,特征信息可包括全网搜索信息、app使用信息、地理位置信息、兴趣信息等信息。特征信息的维度为f,优选地,f为大于1的整数,例如f为2000或5000。关联了特征信息的属性标签的输出格式为:用户id、性别属性标签、年龄属性标签、婚姻状态属性标签和特征信息。其中,用户id还可用于标识各个特征信息属于哪个用户。
本步骤中,具体地,可获取用户的设定时间段内的特征信息,例如:一年或者三个月;或者可获取用户的历史所有的特征信息。
步骤203、根据多个属性标签和与多个属性标签关联的特征信息,构建多任务学习的神经网络结构。
图3为本公开实施例中多任务学习的神经网络结构的示意图,如图3所示,本公开实施例中,可根据属性标签和特征信息构建出神经网络结构,以实现多任务学习目标,即实现同时学习一个用户的多个属性任务。每个属性标签对应于一个属性任务,例如,性别属性标签对应于性别任务,年龄属性标签对应于年龄任务,婚姻状态属性标签对应于婚姻状态任务。
多任务学习的神经网络结构包括输入层、隐层、特定任务层和特定任务输出层。图3中的圆圈表示节点,输入层包括一个节点,隐层包括十一个节点,特定任务层包括六个节点,特定任务输出层包括三个节点。
其中,输入层用于输入用户画像的多个属性标签和与多个属性标签关联的特征信息。
其中,隐层即信息共享层,隐层是各个特定任务的通用处理层,用于实现多任务学习的特征信息共享,隐层中的各层之间参数是共享的,主要任务是对用户通用高维特征进行降维压缩,用于在特定任务层发现属性任务间的约束。本公开实施例中,隐层包括m个层,m为大于或等于1的整数,如图3所示,优选地,m=2。
其中,特定任务层中特定的神经网络用于学习特定任务的信息,而不互相共享参数。本公开实施例中,特定任务层即包括s个节点,s为大于1的整数,如图3所示,优选地,s=2。例如对于性别任务,特定任务层中的性别任务对应的节点抽取隐层中共享的特征信息,在共享的特征信息及属性约束基础上,学习性别属性独有的信息。
其中,特定任务输出层中的每个节点基于特定任务层的执行结果输出不同的预测结果。例如:这里的三个节点分别预测用户的性别、年龄及婚姻状态。
步骤204、基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型。
图4为本公开实施例中步骤204的流程图,如图4所示,步骤204包括:
步骤2041、通过多个属性标签和多个特征信息对预先定义的联合损失函数进行优化得出多任务学习的神经网络结构的最优节点参数,联合损失函数包括多个属性的损失函数之和。
本公开实施例中,联合损失函数total_loss_fun=loss_fun(性别)+loss_fun(年龄)+loss_fun(婚姻状态),其中,loss_fun(性别)为性别的损失函数,loss_fun(年龄)为年龄的损失函数,loss_fun(婚姻状态)为婚姻状态的损失函数。
本公开实施例中,优选地,属性的损失函数可以为交叉熵损失函数。例如:loss_fun(性别)为经softmax函数激活之后的交叉熵,则loss_fun(性别)=Softmax(cross_entropy(predicted_gender,label_gender)),其中,“cross_entropy”为交叉熵,“predicted_gender”为预测性别,“label_gender”为性别标签。其中,可根据特征信息和多任务学习的神经网络结构的节点参数生成预测性别。
优选地,本步骤包括:通过多个属性标签和多个特征信息最小化联合损失函数以得出多任务学习的神经网络结构的最优节点参数。具体地,通过多个属性标签和多个特征信息采用梯度下降法对联合损失函数进行优化求解,以得出多任务学习的神经网络结构的最优节点参数。此方法可通过多个属性的损失函数定义一个联合损失函数,通过优化联合损失函数来达到同时优化多个属性的损失函数的目的,减小了属性预测模型陷入局部最优的倾向,在建立属性联系的同时增强模型泛化能力。
步骤2042、根据多任务学习的神经网络结构和最优节点参数,得出多任务学习的神经网络模型。
步骤205、基于多任务学习的神经网络模型和预先获取的指定的特征信息,对用户画像的多个属性标签进行预测得出多个属性标签的预测结果。
具体地,将指定的特征信息输入多任务学习的神经网络模型,以输出多个属性标签的预测结果。
本公开实施例中,例如:性别标签的预测结果为男,年龄标签的预测结果为18岁以下,婚姻状态的预测结果为未婚;又例如:性别标签的预测结果为女,年龄标签的预测结果为35-44岁,婚姻状态的预测结果为已婚。
本公开实施例中,指定的特征信息与步骤202中获取的与多个属性标签关联的特征信息相同或者不同。
当指定的特征信息和获取的与多个属性标签关联的特征信息不同时,例如,与多个属性标签关联的特征信息可以包括一年内的特征信息,而指定的特征信息可以为六个月内的特征信息,此种情况下指定的特征信息为与多个属性标签关联的特征信息的一部分,因此在步骤205之前可从步骤202中获取到的与多个属性标签关联的特征信息中获取指定的特征信息;又例如,与多个属性标签关联的特征信息与指定的特征信息不完全相同或者完全不同时,在步骤205之前需获取指定的特征信息。
优选地,当指定的特征信息和获取的与多个属性标签关联的特征信息相同时,步骤202中获取与多个属性标签关联的特征信息,即获取到指定的特征信息,此种情况提高了属性标签的预测结果的准确率。
本公开实施例提供的属性预测方法中,基于多任务学习的神经网络模型和获取的指定的特征信息,对用户画像的多个属性标签进行预测生成多个属性标签的预测结果,实现了针对多个属性标签进行属性预测,提高了开发及线上预测效率。
本公开实施例提供的属性预测方法中,基于多任务学习的神经网络结构进行预测,关联的特征信息可以共享,提高了预测结果的准确率;同时减小了数据循环引用,降低了预测资源开销;基于多任务学习的神经网络结构进行预测时可引入较高维度的特征信息,从而提高了关联的特征信息的使用效果。
本公开实施例提供的属性预测方法中,基于多任务学习的神经网络结构且关联不同的特征信息,可以学习到更多的隐含信息,减少了各属性输出的冲突,避免人为引入更多的约束规则,从而最大化挖掘用户属性关联的特征信息。
本公开实施例提供的属性预测方法中,通过定义联合损失函数,可以更高效且方便的完成建模过程。
图5为本公开实施例提供的另一种用户画像的属性预测方法的流程图,如图5所示,在图1提供的实施例的基础上,本实施例的方法还包括:
步骤206、根据预先设定的关键属性对发生冲突的预测结果进行校正,得出校正后的预测结果。
例如:性别标签的预测结果为男,年龄标签的预测结果为18岁以下,婚姻状态的预测结果为已婚,年龄标签的预测结果与婚姻状态的预测结果发生了冲突,则需要对年龄标签的预测结果或者婚姻状态的预测结果进行校正。本公开实施例中,关键属性为年龄,则可通过人工方式将婚姻状态的预测结果修改为未婚,此时校正后的预测结果包括:婚姻状态的预测结果为未婚。
本公开实施例提供的属性预测方法中,根据预先设定的关键属性对发生冲突的预测结果进行校正,从而进一步提高了挖掘结果的准确性。
图6为本公开实施例提供的一种用户画像的属性预测装置的结构示意图,如图6所示,该用户画像的预测装置1包括:第一生成模块11。
第一生成模块11用于基于预先生成的多任务学习的神经网络模型和获取的指定的特征信息,对所述用户画像的多个属性标签进行预测生成多个所述属性标签的预测结果。
本公开实施例提供的属性预测装置中,基于多任务学习的神经网络模型和获取的指定的特征信息,对用户画像的多个属性标签进行预测生成多个属性标签的预测结果,实现了针对多个属性标签进行属性预测,提高了开发及线上预测效率。
本公开实施例提供的属性预测装置中,基于多任务学习的神经网络结构进行预测,关联的特征信息可以共享,提高了预测结果的准确率;同时减小了数据循环引用,降低了预测资源开销;基于多任务学习的神经网络结构进行预测时可引入较高维度的特征信息,从而提高了关联的特征信息的使用效果。
本公开实施例提供的属性预测装置中,基于多任务学习的神经网络结构且关联不同的特征信息,可以学习到更多的隐含信息,减少了各属性输出的冲突,避免人为引入更多的约束规则,从而最大化挖掘用户属性关联的特征信息。
图7为本公开实施例提供的另一种用户画像的属性预测装置的结构示意图,如图7所示,在图6提供的实施例的基础上本实施例提供的用户画像的属性预测装置1还包括:设定模块12、获取模块13、构建模块14和第二生成模块15。
设定模块12用于设定所述用户画像的多个属性标签;获取模块13用于获取与多个属性标签关联的特征信息;构建模块14用于根据多个属性标签和与多个属性标签关联的特征信息,构建所述多任务学习的神经网络结构;第二生成模块15用于基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型。
图8为本公开实施例中设定模块的结构示意图,如图8所示,设定模块12包括:选定子模块121和设定子模块122。
选定子模块121用于从所述用户画像的多个属性中选定多个待预测的属性;设定子模块122用于为每个待预测的属性设定所述属性标签。
图9为本公开实施例中第二生成模块的结构示意图,如图9所示,第二生成模块15包括:优化子模块151和生成子模块152。
优化子模块151用于通过多个属性标签和多个特征信息对预先定义的联合损失函数进行优化得出所述多任务学习的神经网络结构的最优节点参数,所述联合损失函数包括多个属性的损失函数之和;生成子模块152用于根据所述多任务学习的神经网络结构和所述最优节点参数,得出所述多任务学习的神经网络模型。
本公开实施例中,优选地,指定的特征信息和与多个属性标签关联的特征信息相同。此时,获取模块13获取与多个属性标签关联的特征信息,即获取模块13获取指定的特征信息。
本公开实施例中,可选地,指定的特征信息和与多个属性标签关联的特征信息不同。此时,获取模块13还用于获取指定的特征信息。
需要说明的是,对于上述各模块的实现细节和技术效果的描述,可以参见前述方法实施例的说明,此处不再赘述。
本公开实施例还提供了一种服务器,该服务器包括:一个或多个处理器以及存储装置;其中,存储装置上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如前述各实施例所提供的用户画像的属性预测方法。
本公开实施例还提供了一计算机可读介质,其上存储有计算机程序,其中,该计算机程序被执行时实现如前述各实施例所提供的用户画像的属性预测方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

Claims (9)

1.一种用户画像的属性预测方法,包括:
设定用户画像的多个属性标签;获取与多个属性标签关联的特征信息;根据多个属性标签和与多个属性标签关联的特征信息,构建多任务学习的神经网络结构;基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型;
基于所述多任务学习的神经网络模型和预先获取的指定的特征信息,对所述用户画像的多个属性标签进行预测生成多个所述属性标签的预测结果;
其中,所述基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型包括:通过多个属性标签和多个特征信息对预先定义的联合损失函数进行优化得出所述多任务学习的神经网络结构的最优节点参数,所述联合损失函数包括多个属性的损失函数之和;根据所述多任务学习的神经网络结构和所述最优节点参数,得出所述多任务学习的神经网络模型。
2.根据权利要求1所述的用户画像的属性预测方法,其中,所述设定用户画像的多个属性标签包括:
从所述用户画像的多个属性中选定多个待预测的属性;
为每个待预测的属性设定所述属性标签。
3.根据权利要求1所述的用户画像的属性预测方法,其中,所述多任务学习的神经网络结构包括输入层、隐层、特定任务层和特定任务输出层;
所述输入层用于输入用户画像的多个所述属性标签和与多个属性标签关联的特征信息;
所述隐层用于实现多任务学习的特征信息共享;
所述特定任务层中特定的神经网络用于学习特定任务的信息;
所述特定任务输出层中的每个节点基于特定任务层的执行结果输出不同的预测结果。
4.根据权利要求1所述的用户画像的属性预测方法,其中,所述指定的特征信息和与多个属性标签关联的特征信息相同。
5.一种用户画像的属性预测装置,包括:
设定模块,用于设定用户画像的多个属性标签;
获取模块,用于获取与多个属性标签关联的特征信息;
构建模块,用于根据多个属性标签和与多个属性标签关联的特征信息,构建多任务学习的神经网络结构;
第二生成模块,用于基于多个属性标签、多个特征信息以及多任务学习的神经网络结构进行多任务学习,生成多任务学习的神经网络模型;
第一生成模块,用于基于预先生成的多任务学习的神经网络模型和预先获取的指定的特征信息,对所述用户画像的多个属性标签进行预测生成多个所述属性标签的预测结果;
其中,所述第二生成模块包括:
优化子模块,用于通过多个属性标签和多个特征信息对预先定义的联合损失函数进行优化得出所述多任务学习的神经网络结构的最优节点参数,所述联合损失函数包括多个属性的损失函数之和;
生成子模块,用于根据所述多任务学习的神经网络结构和所述最优节点参数,得出所述多任务学习的神经网络模型。
6.根据权利要求5所述的用户画像的属性预测装置,其中,所述设定模块包括:
选定子模块,用于从所述用户画像的多个属性中选定多个待预测的属性;
设定子模块,用于为每个待预测的属性设定所述属性标签。
7.根据权利要求5所述的用户画像的属性预测装置,其中,所述指定的特征信息和与多个属性标签关联的特征信息相同。
8.一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-4中任一所述的用户画像的属性预测方法。
9.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被执行时实现如权利要求1-4中任一所述的用户画像的属性预测方法。
CN201811334383.0A 2018-11-09 2018-11-09 用户画像的属性预测方法、装置、服务器和计算机可读介质 Active CN111178925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811334383.0A CN111178925B (zh) 2018-11-09 2018-11-09 用户画像的属性预测方法、装置、服务器和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811334383.0A CN111178925B (zh) 2018-11-09 2018-11-09 用户画像的属性预测方法、装置、服务器和计算机可读介质

Publications (2)

Publication Number Publication Date
CN111178925A CN111178925A (zh) 2020-05-19
CN111178925B true CN111178925B (zh) 2023-07-25

Family

ID=70656956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811334383.0A Active CN111178925B (zh) 2018-11-09 2018-11-09 用户画像的属性预测方法、装置、服务器和计算机可读介质

Country Status (1)

Country Link
CN (1) CN111178925B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380104A (zh) * 2020-11-19 2021-02-19 北京百度网讯科技有限公司 用户属性识别方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016206196A1 (zh) * 2015-06-26 2016-12-29 百度在线网络技术(北京)有限公司 用于获取用户属性信息的方法、装置及服务器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170357890A1 (en) * 2016-06-09 2017-12-14 Sysomos L.P. Computing System for Inferring Demographics Using Deep Learning Computations and Social Proximity on a Social Data Network
CN106850314B (zh) * 2016-12-20 2021-06-15 上海掌门科技有限公司 一种用于确定用户属性模型及用户属性信息的方法与设备
CN107908740B (zh) * 2017-11-15 2022-11-22 百度在线网络技术(北京)有限公司 信息输出方法和装置
CN108062375B (zh) * 2017-12-12 2021-12-10 百度在线网络技术(北京)有限公司 一种用户画像的处理方法、装置、终端和存储介质
CN108182389B (zh) * 2017-12-14 2021-07-30 华南师范大学 基于大数据与深度学习的用户数据处理方法、机器人系统
CN108521439B (zh) * 2018-03-08 2022-01-21 北京三快在线科技有限公司 一种消息推送的方法和装置
CN108596679B (zh) * 2018-04-27 2022-05-03 中国联合网络通信集团有限公司 用户画像的构建方法、装置、终端及计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016206196A1 (zh) * 2015-06-26 2016-12-29 百度在线网络技术(北京)有限公司 用于获取用户属性信息的方法、装置及服务器

Also Published As

Publication number Publication date
CN111178925A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
US10936963B2 (en) Systems and methods for content response prediction
CA3007853C (en) End-to-end deep collaborative filtering
CN110781321B (zh) 一种多媒体内容推荐方法及装置
Villéger et al. New multidimensional functional diversity indices for a multifaceted framework in functional ecology
US11551290B2 (en) Systems and methods for machine-based matching of lodging inventory from disparate reservation provider systems
CN109213802B (zh) 用户画像构建方法、装置、终端和计算机可读存储介质
JP2016004549A (ja) 特定装置、特定方法及び特定プログラム
CN111046188A (zh) 用户偏好度确定方法、装置、电子设备及可读存储介质
WO2018082531A1 (en) Apparatus and method for ranking content categories
US20160328466A1 (en) Label filters for large scale multi-label classification
CN110909258B (zh) 一种信息推荐方法、装置、设备及存储介质
CN112015896A (zh) 基于人工智能的情感分类方法、以及装置
CN115867919A (zh) 用于推荐系统的图结构感知增量学习
US20210150484A1 (en) Machine-learning creation of job posting content
CN111178925B (zh) 用户画像的属性预测方法、装置、服务器和计算机可读介质
AU2024200940A1 (en) Method and system for determining collaboration between employees using artificial intelligence (ai)
CN108550019A (zh) 一种简历筛选方法及装置
CN110969549B (zh) 一种司法数据处理方法及系统
CN116662527A (zh) 用于生成学习资源的方法及相关产品
Cugmas et al. Symmetric core-cohesive blockmodel in preschool children’s interaction networks
CN115017362A (zh) 数据处理方法、电子设备及存储介质
CN115809339A (zh) 跨领域推荐方法、系统、设备及存储介质
WO2021071428A1 (en) System and method for innovation, creativity, and learning as a service
US11762928B2 (en) Feature recommendation based on user-generated content
CN112379919B (zh) 一种服务定制方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant