CN106228453A - 一种获得用户职业信息的方法和装置 - Google Patents

一种获得用户职业信息的方法和装置 Download PDF

Info

Publication number
CN106228453A
CN106228453A CN201610643548.7A CN201610643548A CN106228453A CN 106228453 A CN106228453 A CN 106228453A CN 201610643548 A CN201610643548 A CN 201610643548A CN 106228453 A CN106228453 A CN 106228453A
Authority
CN
China
Prior art keywords
group
user
analyzed
information
social
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610643548.7A
Other languages
English (en)
Inventor
张惠亮
刘胜
吴锋海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Union Mobile Pay Co Ltd
Original Assignee
Union Mobile Pay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Union Mobile Pay Co Ltd filed Critical Union Mobile Pay Co Ltd
Priority to CN201610643548.7A priority Critical patent/CN106228453A/zh
Publication of CN106228453A publication Critical patent/CN106228453A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明实施例涉及互联网领域,尤其涉及一种获得用户职业信息的方法和装置,用于社交应用获取待分析用户的职业信息。本发明实施例中,社交应用获取待分析用户在社交应用中的所有社交群组名称;根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。社交应用可以在用户已有的社交群组名称中获得用户职业信息,而不用依赖用户在社交应用的注册验证页面和个人信息页面上输入的职业信息,一方面避免了因用户不愿意填写而带来信息不全面的问题,另一方面也减少了社交应用对待分析用户自己输入的信息的真实性进行验证的步骤。

Description

一种获得用户职业信息的方法和装置
技术领域
本发明实施例涉及互联网领域,尤其涉及一种获得用户职业信息的方法和装置。
背景技术
随着互联网、移动互联网等技术的不断发展,越来越多的人已经习惯使用社交网络和家人、同事、朋友进行沟通交流,社交工具已经成为人们生活中不可分割的一部分。对于很多社交应用,需要了解用户的职业信息,从而可以对用户进行更细颗粒度的分类,应用于用户画像、精准营销、好友推荐等增值服务,也可以用于防范社交网络中欺诈事情的发生。因此,如何有效获得用户的职业信息,是社交应用必须考虑的问题。
现有技术中,社交应用主要通过用户输入自己的职业信息来获得用户的职业信息。社交应用会在用户注册验证页面和个人信息修改页面增加单位、部门输入项,但是一般这些都不属于必填项,而且用户自己输入信息的真实性仍然需要进一步验证。因此,目前获取用户的职业信息的方法仍然具有一定的局限性。
发明内容
本发明实施例提供一种获得用户职业信息的方法和装置,用以解决现有技术中获取用户职业信息的方法具有一定局限性的问题,从而可以帮助社交应用为用户提供更好的服务。
本发明实施例提供一种获得用户职业信息的方法,包括:
从社交应用中获取待分析用户在社交应用中的所有社交群组名称;
根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;
根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。
可选地,根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组,包括:
针对每个社交群组名称,查询社交群组名称是否包含预存的字典表中的职业信息;
若是,则将社交群组名称对应的群组确定为待分析用户的备选工作群组。
可选地,根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组,还包括:
若社交群组名称不包含字典表中的职业信息,则用机器学习中文语义分析的方法对社交群组名称进行分割,得到多个语义块;
将确定为职业信息的语义块补充到字典表中,并将社交群组名称对应的群组确定为待分析用户的备选工作群组。
可选地,根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息,包括:
针对每个备选工作群组,从备选工作群组的社交群组名称中提取备选工作群组的职业信息,并至少根据待分析用户在备选工作群组中的活跃程度和加入备选工作群组的时间对备选工作群组进行打分;
将职业信息相同的备选工作群组的得分进行累加得到职业信息的综合评分;
将综合评分最高且高于最低分数线的职业信息确定为待分析用户的第一职业信息。
可选地,至少根据用户在备选工作群组中的活跃程度和加入备选工作群组的时间对备选工作群组进行打分,包括:
在备选工作群组里的活跃程度越高,打分越高;且,加入备选工作群组的时间越短,打分越高。
可选地,根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息之后,还包括:
获取待分析用户在上一统计周期中的第二职业信息的综合评分和第三职业的综合评分,其中所述第二职业信息为所述待分析用户在所述上一统计周期中综合评分最高且高于所述最低分数线的职业信息;所述第三职业信息为所述待分析用户的各职业信息中的任一个;当所述第三职业信息在当前统计周期的综合评分比所述第三职业信息在所述上一统计周期的综合评分上涨超过第一阈值,且所述第二职业信息在所述上一统计周期中的综合评分比所述第二职业信息在所述当前统计周期中的综合评分下降超过第二阈值,则将所述待分析用户作为职业发展趋势的关注用户。
本发明实施例提供一种获得用户职业信息的装置,包括:
获取模块,用于从社交应用中获取待分析用户在社交应用中的所有社交群组名称;
筛选模块,用于根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;
确定模块,用于根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。
可选地,筛选模块具体用于:
针对每个社交群组名称,查询社交群组名称是否包含预存的字典表中的职业信息;
若是,则将社交群组名称对应的群组确定为待分析用户的备选工作群组。
可选地,筛选模块还用于:
若社交群组名称不包含字典表中的职业信息,则用机器学习中文语义分析的方法对社交群组名称进行分割,得到多个语义块;
将确定为职业信息的语义块补充到所述字典表中,并将所述社交群组名称对应的群组确定为待分析用户的备选工作群组。
可选地,确定模块具体用于:
针对每个备选工作群组,从备选工作群组的社交群组名称中提取备选工作群组的职业信息,并至少根据待分析用户在备选工作群组中的活跃程度和加入备选工作群组的时间对备选工作群组进行打分;
将职业信息相同的备选工作群组的得分进行累加得到职业信息的综合评分;
将综合评分最高且高于最低分数线的职业信息确定为待分析用户的第一职业信息。
可选地,确定模块具体用于:
在备选工作群组里的活跃程度越高,打分越高;且,加入备选工作群组的时间越短,打分越高。
可选地,还包括:
趋势分析模块,用于获取待分析用户在上一统计周期中的第二职业信息的综合评分和第三职业的综合评分,其中所述第二职业信息为所述待分析用户在所述上一统计周期中综合评分最高且高于所述最低分数线的职业信息;所述第三职业信息为所述待分析用户的各职业信息中的任一个;当所述第三职业信息在当前统计周期的综合评分比所述第三职业信息在所述上一统计周期的综合评分上涨超过第一阈值,且所述第二职业信息在所述上一统计周期中的综合评分比所述第二职业信息在所述当前统计周期中的综合评分下降超过第二阈值,则将所述待分析用户作为职业发展趋势的关注用户。
本发明实施例中提供一种获得用户职业信息的方法和装置,从社交应用中获取待分析用户在社交应用中的所有社交群组名称;根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。本发明实施例中通过社交应用获取待分析用户在社交应用中的社交群组名称,由于社交群组名称中通常根据群组内人员的共性来设定名称,因而待分析用户的社交群组中可能会存在工作群组,故根据社交群组名称获得备选工作群组,由于工作群组可能有多个,比如前公司的工作群组和当前公司的工作群组,故分析用户在备选工作群组中的使用属性得到第一职业信息,从而社交应用可以在用户已有的社交群组名称中获得用户职业信息,而不用依赖用户在社交应用的注册验证页面和个人信息页面上输入的职业信息,一方面避免了因用户不愿意填写而带来信息不全面的问题,另一方面,也减少了社交应用对待分析用户自己输入的信息的真实性进行验证的步骤。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例提供的一种获取用户职业信息的方法流程示意图;
图2为本发明实施例提供的一种获取用户职业信息的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示例性示出了本发明实施例提供的一种获取用户职业信息的方法流程示意图,如图1所示,包括以下步骤:
步骤101,从社交应用中获取待分析用户在社交应用中的所有社交群组名称;
步骤102,根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;
步骤103,根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。
具体实施中,社交应用可以是基于互联网的即时通讯工具,如微信、QQ等;社交群组为在社交应用中设定的通讯组,通讯组内的联系人可在通讯组内进行通讯,社交群组名称在实际应用中多为组内联系人的共同属性,如同学组、朋友组、工作组等。本发明实施例提供一种社交群组名称的示例,例如,设定社交应用微信的待分析用户总共加入了五个社交群组:社交群组1、社交群组2、社交群组3、社交群组4、社交群组5,五个社交群组对应的社交群组名称都不一样,表1示例性示出了社交群组名称的示例。
表1社交群组名称示例
社交群组 社交应用 社交群组名称
社交群组1 微信 **大学电子系2012级
社交群组2 微信 老李家
社交群组3 微信 代理一部
社交群组4 微信 **公司2016第一批新员工
社交群组5 微信 **公司-**公司项目合作群
如表1所示,待分析用户总共加入了五个群组,五个社交群组对应的社交群组名称都不一样,本发明实施例中各社交群组对应的社交群组名称如下所示:
社交群组1对应的群组名称是**大学电子系2012级;
社交群组2对应的群组名称是老李家;
社交群组3对应的群组名称是代理一部;
社交群组4对应的群组名称是**公司2016第一批新员工;
社交群组5对应的群组名称是**公司-**公司项目合作群。
从社交应用中获取待分析用户在社交应用中的所有社交群组名称,可选地,从社交应用中获取待分析用户在社交应用中的所有社交群组名称,社交应用可以一旦监测到待分析用户加入到新的社交群组,即获取待分析用户加入的新的社交群组的名称;也可以周期性地获取待分析用户新加入的社交群组的名称。比如社交应用每一周获取一次待分析用户的新加入的社交群组的名称。
根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;具体说来,不同社交群组名称反应了社交群组不同的类型,比如社交群组可能是教育类群组、家庭类群组、工作类群组等。本发明实施例中社交群组名称为表1中所示的内容为例进行介绍。
表2示出了根据表1所示的社交群组名称得到的社交群组分类的示例。如表2所示,根据社交群组的名称对待分析用户的社交群组进行了分类,也就是说,社交应用可以通过社交群组的名称得到待分析用户的工作类群组。
表2根据表1所示的社交群组名称得到的社交群组分类的示例
根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。具体说来,待分析用户对各个备选工作群组的使用属性可以是待分析用户在群里发言的次数、发言的频率、加入群组的时间等,社交应用在一定的统计周期内统计并分析用户在备选工作群组的使用属性,统计周期可以是一天、一周或者一个月等等。
通过上述方法,社交应用可以不用依赖待分析用户在社交应用的注册验证页面和个人信息页面上输入的职业信息,而是直接获取待分析用户已有的社交群组的名称,通过分析社交群组名称来了解待分析用户的职业信息,这样不仅使社交应用获得的职业信息更加全面,同时获取的职业信息的真实性也更高,便于社交应用根据待分析用户的职业信息给待分析用户提供更好的服务。
可选地,针对每个社交群组名称,查询社交群组名称是否包含预存的字典表中的职业信息;若是,则将社交群组名称对应的群组确定为待分析用户的备选工作群组。可选地,方法还包括:若社交群组名称不包含所述字典表中的职业信息,则用机器学习中文语义分析的方法对社交群组名称进行分割,得到多个语义块;将确定为职业信息的语义块补充到字典表中,并将社交群组名称对应的群组确定为待分析用户的备选工作群组。
具体实施中,系统首先会有一份常用的包含职业信息的字典表,字典表中包含的职业信息包括单位名字、部门名字等;字典表中的职业信息可以通过网上爬取获得,社交应用也可以分析所有用户的群组名词中新出现的具有共性的名称,通过人工判断新出现的具有共性的名称是否包括职业信息,也可以通过爬虫接口访问全国企业信息信用网站查看新出现的具有共性的名称是否包括职业信息,将包含职业信息的名称加入到字典表中。为了更清楚地介绍判断社交群组是否是备选工作群组的过程,本发明实施例中以社交群组名称为表1中所示的内容为例进行介绍,至少会出现以下几种情况:
情况一,待分析用户的社交群组名称是老李家,查询社交群组名称老李家是否包含预存的字典表中的信息,结果表明社交群组名称老李家不包含预存的字典表中的信息,则用机器学习中文语义分析的方法对社交群组名称老李家进行分割,分割后得到老李和家两个词,通过人工标记或者通过爬虫接口访问全国企业信息信用网站查看是否有和分割后的名词对应职业信息,结果表明分割后的名词不包括职业信息,因此说明老李家对应的群组不是备选工作群组。
情况二,待分析用户的社交群组名称是**公司2016第一批新员工,查询社交群组名称**公司2016第一批新员工是否包含预存的字典表中的信息,结果表明社交群组名称**公司2016第一批新员工包含预存的字典表中的信息,则将社交群组名称**公司2016第一批新员工对应的群组确定为备选工作群组。在查询字典表之前,通常会对待分析用户的社交群组名称进行分词,如将**公司2016第一批新员工分词为**公司/2016/第一批新员工三个部分,然后判断每一部分是否包含预存的字典表的信息。
情况三,待分析用户的社交群组名称是代理一部,查询社交群组名称代理一部是否包含预存的字典表中的信息,结果表明社交群组代理一部不包含预存的字典表中的信息,则用机器学习中文语义分析的方法对代理一部进行分割,分割后代理和一部两个词,通过人工标记或者通过爬虫接口访问全国企业信息信用网站查看是否有和分割后的名词对应职业信息,结果表明分割后的名词代理包括职业信息,则将社交群组名称代理一部对应的群组确定为备选工作群组,并将代理这个词补充到字典表中。
上述实施例中,通过预设的字典表及机器学习中文语义分析法可以快速的确定备选工作群组,如此,社交应用可以在待分析用户没有在社交应用的注册验证页面和个人信息页面上输入的职业信息时,仍旧能获得与待分析用户职业相关的备选工作群组,得到与待分析用户职业相关的信息。
可选地,根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息,包括:
针对每个备选工作群组,从备选工作群组的社交群组名称中提取备选工作群组的职业信息,并至少根据待分析用户在备选工作群组中的活跃程度和加入备选工作群组的时间对备选工作群组进行打分;将职业信息相同的备选工作群组的得分进行累加得到职业信息的综合评分;将综合评分最高且高于最低分数线的职业信息确定为待分析用户的第一职业信息。
可选地,至少根据用户在备选工作群组中的活跃程度和加入备选工作群组的时间对备选工作群组进行打分,包括:在备选工作群组里的活跃程度越高,打分越高;且,加入备选工作群组的时间越短,打分越高。
具体实施中,备选工作群组的社交群组名称中包含的职业信息有多种,比如单位信息、部门信息等。社交应用若想获取待分析用户的第一单位信息,则可以先从备选工作群组中将包含单位信息的备选工作群组提取出来。为了更清楚的介绍社交应用获取待分析用户的第一单位信息的过程,本发明实施例中提供了一种社交应用获取待分析用户的第一单位信息的示例,比如,设定社交应用的待分析用户总共加入了有四个备选工作群组:备选工作群组1、备选工作群组2、备选工作群组3、备选工作群组4,其中备选工作群组1的名称、备选工作群组2的名称和备选工作群组3的名称包含单位信息,备选工作群组1、备选工作群组2包含的职业信息都是单位信息1,备选工作群组3包含的职业信息是单位信息2,表3示例性示出了社交应用获取待分析用户的第一单位信息的示例。
表3社交应用获取待分析用户的第一单位信息的示例
如表3所示,至少根据用户在备选工作群组1、备选工作群组2和备选工作群组3中的活跃程度和加入备选工作群组1、备选工作群组2和备选工作群组3的时间对各备选工作群组进行评分。在备选工作群组里的活跃程度越高,打分越高;且,加入备选工作群组的时间越短,打分越高。备选工作群组1的评分是50分,备选工作群组2的评分是60分,备选工作群组3的评分是50分。将备选工作群组1、备选工作群组2的评分相加得到单位信息1的综合评分,单位信息1的综合评分为110分;备选工作群组3的评分是单位信息2的综合评分,单位信息2的综合评分是50分;设定综合评分的最低分数线为60分,单位信息1的综合评分高于单位信息2的评分,同时单位信息1的评分高于综合评分的最低分,则将单位信息1确定为待分析用户的第一单位信息。
如此,社交应用根据待分析用户在备选工作群组中的活跃程度以及加入备选工作群组的时间对备选工作群组名称进行评分,其中待分析用户在备选工作群组中的活跃程度以及加入备选工作群组中的时间是社交应用直接可以从应用软件中获取的,不需要待分析用户提交或告知,并且待分析用户在备选工作群组中的活跃程度以及加入备选工作群组中的时间能真实并且客观地反应用户在备选工作群组中的使用属性,因此利用待分析用户在备选工作群组中的活跃程度以及加入备选工作群组中的时间对备选工作群组名称进行评分,得到待分析用户的第一职业信息的的结果是客观可靠的。
可选地,根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息之后,还包括:
获取待分析用户在上一统计周期中的第二职业信息的综合评分和第三职业的综合评分,其中所述第二职业信息为所述待分析用户在所述上一统计周期中综合评分最高且高于所述最低分数线的职业信息;所述第三职业信息为所述待分析用户的各职业信息中的任一个;当所述第三职业信息在当前统计周期的综合评分比所述第三职业信息在所述上一统计周期的综合评分上涨超过第一阈值,且所述第二职业信息在所述上一统计周期中的综合评分比所述第二职业信息在所述当前统计周期中的综合评分下降超过第二阈值,则将所述待分析用户作为职业发展趋势的关注用户。
具体实施中,社交应用会每隔一定的统计周期会分析待分析用户在备选工作群组中的使用属性,确定待分析用户的第一职业信息;统计周期的时间可以根据实际情况人为确定,可以是一天、一周、一个月等等。社交应用在根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息之后,会将本统计周期内得到的职业信息与上一统计周期得到的职业信息进行比较,判断待分析用户的职业趋势;根据上一统计周期待分析用户的第二职业信息和本统计周期待分析用户的第一职业信息是否是相同的职业信息,判断的过程会出现多种情况,下面举例说明其中两种情况,其中第二职业信息是上一统计周期中综合评分最高且高于所述最低分数线的职业信息,待分析用户的职业信息包括单位信息、部门信息等。
情况一,上一统计周期待分析用户的第二职业信息和本统计周期待分析用户的第一职业信息不是相同的职业信息。
本发明实施例中以备选工作群组为表3中所示的内容为例进行介绍。表4示出了根据表3所示的备选工作群组得到的待分析用户职业趋势的示例。
表4根据表3所示的备选工作群组得到的待分析用户职业趋势的示例
如表4所示,在本统计周期内,单位信息1的综合评分最高且高于综合评分的最低分,则单位信息1确定为待分析用户在本统计周期的第一单位信息。在上一统计周期内,至少根据待分析用户在备选工作群组1、备选工作群组2和备选工作群组3中的活跃程度和加入备选工作群组1、备选工作群组2和备选工作群组3的时间对各备选工作群组名称进行评分,在备选工作群组里的活跃程度越高,打分越高;且,加入备选工作群组的时间越短,打分越高。备选工作群组1的评分是20分,备选工作群组2的评分是30分,备选工作群组3的评分是80分。将备选工作群组1、备选工作群组2的评分相加得到单位信息1的综合评分,单位信息1的综合评分为50分;备选工作群组3的评分是单位信息2的综合评分,单位信息2的综合评分是80分,单位信息2的综合评分高于单位信息1的综合评分,且单位信息2的综合评分高于综合评分的最低分,则单位信息2确定为待分析用户在上一统计周期内的第二单位信息,其中第二单位信息为上一统计周期中综合评分最高的且高于最低分数线的职业信息。上一统计周期待分析用户的第二单位信息和本统计周期待分析用户的第一单位信息不是相同的单位信息。
在本统计周期内,第一单位信息综合评分最高,且,综合评分从上一统计周期的50分上涨到本统计周期的110分,上涨了50分;第二位单位信息从上一统计周期的80分下降到本统计周期的50分,下降了30分;此时社交应用可将当前待分析用户作为职业发展趋势的关注用户,当前待分析用户的单位从第二单位信息对应的单位转变到了第一单位信息对应的单位。
情况二,上一统计周期待分析用户的第二职业信息和本统计周期待分析用户的第一职业信息是相同的职业信息。
本发明实施例中以备选工作群组为表4中所示的内容为例进行介绍。表5示出了根据表4所示的备选工作群组得到的待分析用户职业趋势的示例
表5根据表4所示的备选工作群组得到的待分析用户职业趋势的示例
如表5所示,在本统计周期内,单位信息1为待分析用户的第一单位信息;在上一统计周期内,至少根据待分析用户在备选工作群组1、备选工作群组2和备选工作群组3中的活跃程度和加入备选工作群组1、备选工作群组2和备选工作群组3的时间对各备选工作群组名称进行评分,在备选工作群组里的活跃程度越高,打分越高;且,加入备选工作群组的时间越短,打分越高。备选工作群组1的评分是70分,备选工作群组2的评分是70分,备选工作群组3的评分是20分。将备选工作群组1、备选工作群组2的评分相加得到单位信息1的综合评分,单位信息1的综合评分为140分;备选工作群组3的评分是单位信息2的综合评分,单位信息2的综合评分是20分,单位信息1的综合评分高于单位信息2的综合评分,且单位信息1的综合评分高于综合评分的最低分,则单位信息1确定为待分析用户在上一统计周期内的第二单位信息,其中第二单位信息为上一统计周期中综合评分最高的且高于最低分数线的单位信息,上一统计周期待分析用户的第二单位信息和本统计周期待分析用户的第一单位信息是相同的单位信息,即单位信息1。
在本统计周期内,第一单位信息综合评分最高,且,综合评分从上一统计周期的140分下降到本统计周期的110分,下降了30分;第二位单位信息从上一统计周期的20分上涨到本统计周期的50分,上涨了30分;此时社交应用可将当前待分析用户作为职业发展趋势的关注用户,当前待分析用户的单位可能从第二单位信息对应的单位转变到第一单位信息对应的单位。
如此,社交应用每隔一定的统计周期分析待分析用户在备选工作群组中的使用属性,确定待分析用户的职业信息,并将本统计周期内得到的职业信息与上一统计周期得到的职业信息进行比较,通过比较观察待分析用户的职业是否有变化趋势,有助于社交应用及时跟踪用户的职业变化。
从上述内容可看出:本发明实施例中提供一种获得用户职业信息的方法和装置,从社交应用中获取待分析用户在社交应用中的所有社交群组名称;根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。本发明实施例中通过社交应用获取待分析用户在社交应用中的社交群组名称,由于社交群组名称中通常根据群组内人员的共性来设定名称,因而待分析用户的社交群组中可能会存在工作群组,故根据社交群组名称获得备选工作群组,由于工作群组可能有多个,比如前公司的工作群组和当前公司的工作群组,故分析用户在备选工作群组中的使用属性得到第一职业信息,从而社交应用可以在用户已有的社交群组名称中获得用户职业信息,而不用依赖用户在社交应用的注册验证页面和个人信息页面上输入的职业信息,一方面避免了因用户不愿意填写而带来信息不全面的问题,另一方面,也减少了社交应用对待分析用户自己输入的信息的真实性进行验证的步骤。
图2示例性示出了本发明实施例提供的一种获取用户职业信息的装置的结构示意图。
基于相同构思,本发明实施例提供的一种获取用户职业信息的装置,如图2所示,该装置包括获取模块201、筛选模块202、确定模块203和趋势分析模块204;其中:
获取模块201,用于从社交应用中获取待分析用户在社交应用中的所有社交群组名称;
筛选模块202,用于根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;
确定模块203,用于根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。
可选地,筛选模块202具体用于:
针对每个社交群组名称,查询社交群组名称是否包含预存的字典表中的职业信息;
若是,则将社交群组名称对应的群组确定为待分析用户的备选工作群组。
可选地,筛选模块202还用于:
若社交群组名称不包含字典表中的职业信息,则用机器学习中文语义分析的方法对社交群组名称进行分割,得到多个语义块;
将确定为职业信息的语义块补充到所述字典表中,并将所述社交群组名称对应的群组确定为待分析用户的备选工作群组。
可选地,确定模块203具体用于:
针对每个备选工作群组,从备选工作群组的社交群组名称中提取备选工作群组的职业信息,并至少根据待分析用户在备选工作群组中的活跃程度和加入备选工作群组的时间对备选工作群组进行打分;
将职业信息相同的备选工作群组的得分进行累加得到职业信息的综合评分;
将综合评分最高且高于最低分数线的职业信息确定为待分析用户的第一职业信息。
可选地,确定模块203具体用于:
在备选工作群组里的活跃程度越高,打分越高;且,加入备选工作群组的时间越短,打分越高。
可选地,还包括:
趋势分析模块204,用于获取待分析用户在上一统计周期中的第二职业信息的综合评分和第三职业的综合评分,其中所述第二职业信息为所述待分析用户在所述上一统计周期中综合评分最高且高于所述最低分数线的职业信息;所述第三职业信息为所述待分析用户的各职业信息中的任一个;当所述第三职业信息在当前统计周期的综合评分比所述第三职业信息在所述上一统计周期的综合评分上涨超过第一阈值,且所述第二职业信息在所述上一统计周期中的综合评分比所述第二职业信息在所述当前统计周期中的综合评分下降超过第二阈值,则将所述待分析用户作为职业发展趋势的关注用户。
从上述内容可以看出:本发明实施例中提供一种获得用户职业信息的方法和装置,从社交应用中获取待分析用户在社交应用中的所有社交群组名称;根据社交群组名称,从所有社交群组名称中确定待分析用户的备选工作群组;根据待分析用户在各备选工作群组中的使用属性,确定待分析用户的第一职业信息。本发明实施例中通过社交应用获取待分析用户在社交应用中的社交群组名称,由于社交群组名称中通常根据群组内人员的共性来设定名称,因而待分析用户的社交群组中可能会存在工作群组,故根据社交群组名称获得备选工作群组,由于工作群组可能有多个,比如前公司的工作群组和当前公司的工作群组,故分析用户在备选工作群组中的使用属性得到第一职业信息,从而社交应用可以在用户已有的社交群组名称中获得用户职业信息,而不用依赖用户在社交应用的注册验证页面和个人信息页面上输入的职业信息,一方面避免了因用户不愿意填写而带来信息不全面的问题,另一方面,也减少了社交应用对待分析用户自己输入的信息的真实性进行验证的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种获得用户职业信息的方法,其特征在于,包括:
从社交应用中获取待分析用户在所述社交应用中的所有社交群组名称;
根据社交群组名称,从所述所有社交群组名称中确定所述待分析用户的备选工作群组;
根据所述待分析用户在各备选工作群组中的使用属性,确定所述待分析用户的第一职业信息。
2.如权利要求1所述的方法,其特征在于,所述根据社交群组名称,从所述所有社交群组名称中确定所述待分析用户的备选工作群组,包括:
针对每个社交群组名称,查询所述社交群组名称是否包含预存的字典表中的职业信息;
若是,则将所述社交群组名称对应的群组确定为所述待分析用户的备选工作群组。
3.如权利要求2所述的方法,其特征在于,还包括:
若所述社交群组名称不包含所述字典表中的职业信息,则用机器学习中文语义分析的方法对所述社交群组名称进行分割,得到多个语义块;
将确定为职业信息的语义块补充到所述字典表中,并将所述社交群组名称对应的群组确定为所述待分析用户的备选工作群组。
4.如权利要求1至3任一项所述的方法,其特征在于,所述根据所述待分析用户在各备选工作群组中的使用属性,确定所述待分析用户的第一职业信息,包括:
针对每个备选工作群组,从所述备选工作群组的社交群组名称中提取所述备选工作群组的职业信息,并至少根据所述待分析用户在所述备选工作群组中的活跃程度和加入所述备选工作群组的时间对所述备选工作群组进行打分;
将职业信息相同的备选工作群组的得分进行累加得到所述职业信息的综合评分;
将综合评分最高且高于最低分数线的职业信息确定为所述待分析用户的第一职业信息。
5.如权利要求4所述的方法,其特征在于,所述至少根据用户在所述备选工作群组中的活跃程度和加入所述备选工作群组的时间对所述备选工作群组进行打分,包括:
在所述备选工作群组里的活跃程度越高,打分越高;且,加入所述备选工作群组的时间越短,打分越高。
6.如权利要求4所述的方法,其特征在于,所述根据所述待分析用户在各备选工作群组中的使用属性,确定所述待分析用户的第一职业信息之后,还包括:
获取待分析用户在上一统计周期中的第二职业信息的综合评分和第三职业的综合评分,其中所述第二职业信息为所述待分析用户在所述上一统计周期中综合评分最高且高于所述最低分数线的职业信息;所述第三职业信息为所述待分析用户的各职业信息中的任一个;当所述第三职业信息在当前统计周期的综合评分比所述第三职业信息在所述上一统计周期的综合评分上涨超过第一阈值,且所述第二职业信息在所述上一统计周期中的综合评分比所述第二职业信息在所述当前统计周期中的综合评分下降超过第二阈值,则将所述待分析用户作为职业发展趋势的关注用户。
7.一种获得用户职业信息的装置,其特征在于,包括:
获取模块,用于从社交应用中获取待分析用户在所述社交应用中的所有社交群组名称;
筛选模块,用于根据社交群组名称,从所述所有社交群组名称中确定所述待分析用户的备选工作群组;
确定模块,用于根据所述待分析用户在各备选工作群组中的使用属性,确定所述待分析用户的第一职业信息。
8.如权利要求7所述的装置,其特征在于,所述筛选模块具体用于:
针对每个社交群组名称,查询所述社交群组名称是否包含预存的字典表中的职业信息;
若是,则将所述社交群组名称对应的群组确定为所述待分析用户的备选工作群组。
9.如权利要求8所述的装置,其特征在于,所述筛选模块还用于:
若所述社交群组名称不包含所述字典表中的职业信息,则用机器学习中文语义分析的方法对所述社交群组名称进行分割,得到多个语义块;
将确定为职业信息的语义块补充到所述字典表中,并将所述社交群组名称对应的群组确定为所述待分析用户的备选工作群组。
10.如权利要求7至9任一所述的装置,其特征在于,所述确定模块具体用于:
针对每个备选工作群组,从所述备选工作群组的社交群组名称中提取所述备选工作群组的职业信息,并至少根据所述待分析用户在所述备选工作群组中的活跃程度和加入所述备选工作群组的时间对所述备选工作群组进行打分;
将职业信息相同的备选工作群组的得分进行累加得到所述职业信息的综合评分;
将综合评分最高且高于最低分数线的职业信息确定为所述待分析用户的第一职业信息。
11.如权利要求10所述的装置,其特征在于,所述确定模块具体用于:
在所述备选工作群组里的活跃程度越高,打分越高;且,加入所述备选工作群组的时间越短,打分越高。
12.如权利要求10所述的装置,其特征在于,还包括:
趋势分析模块,用于获取待分析用户在上一统计周期中的第二职业信息的综合评分和第三职业的综合评分,其中所述第二职业信息为所述待分析用户在所述上一统计周期中综合评分最高且高于所述最低分数线的职业信息;所述第三职业信息为所述待分析用户的各职业信息中的任一个;当所述第三职业信息在当前统计周期的综合评分比所述第三职业信息在所述上一统计周期的综合评分上涨超过第一阈值,且所述第二职业信息在所述上一统计周期中的综合评分比所述第二职业信息在所述当前统计周期中的综合评分下降超过第二阈值,则将所述待分析用户作为职业发展趋势的关注用户。
CN201610643548.7A 2016-08-08 2016-08-08 一种获得用户职业信息的方法和装置 Pending CN106228453A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610643548.7A CN106228453A (zh) 2016-08-08 2016-08-08 一种获得用户职业信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610643548.7A CN106228453A (zh) 2016-08-08 2016-08-08 一种获得用户职业信息的方法和装置

Publications (1)

Publication Number Publication Date
CN106228453A true CN106228453A (zh) 2016-12-14

Family

ID=57548298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610643548.7A Pending CN106228453A (zh) 2016-08-08 2016-08-08 一种获得用户职业信息的方法和装置

Country Status (1)

Country Link
CN (1) CN106228453A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145591A1 (zh) * 2017-02-10 2018-08-16 腾讯科技(深圳)有限公司 兴趣标签确定方法、计算机设备和存储介质
CN108648093A (zh) * 2018-04-23 2018-10-12 腾讯科技(深圳)有限公司 数据处理方法、装置及设备
CN112785163A (zh) * 2021-01-26 2021-05-11 维沃移动通信有限公司 职业识别方法、装置、设备及介质
CN115499395A (zh) * 2018-09-29 2022-12-20 创新先进技术有限公司 社交方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778283A (zh) * 2015-05-11 2015-07-15 苏州大学 一种基于微博的用户职业分类方法及系统
CN105045847A (zh) * 2015-07-01 2015-11-11 广州市万隆证券咨询顾问有限公司 一种从文本信息中提取中文机构单位名称的方法
CN105678129A (zh) * 2015-12-29 2016-06-15 联动优势科技有限公司 一种确定用户身份信息的方法及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778283A (zh) * 2015-05-11 2015-07-15 苏州大学 一种基于微博的用户职业分类方法及系统
CN105045847A (zh) * 2015-07-01 2015-11-11 广州市万隆证券咨询顾问有限公司 一种从文本信息中提取中文机构单位名称的方法
CN105678129A (zh) * 2015-12-29 2016-06-15 联动优势科技有限公司 一种确定用户身份信息的方法及设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145591A1 (zh) * 2017-02-10 2018-08-16 腾讯科技(深圳)有限公司 兴趣标签确定方法、计算机设备和存储介质
US11226991B2 (en) 2017-02-10 2022-01-18 Tencent Technology (Shenzhen) Company Limited Interest tag determining method, computer device, and storage medium
CN108648093A (zh) * 2018-04-23 2018-10-12 腾讯科技(深圳)有限公司 数据处理方法、装置及设备
CN108648093B (zh) * 2018-04-23 2021-11-09 腾讯科技(深圳)有限公司 数据处理方法、装置及设备
CN115499395A (zh) * 2018-09-29 2022-12-20 创新先进技术有限公司 社交方法、装置及设备
CN115499395B (zh) * 2018-09-29 2024-01-16 创新先进技术有限公司 社交方法、装置及设备
CN112785163A (zh) * 2021-01-26 2021-05-11 维沃移动通信有限公司 职业识别方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
Zaeem et al. The effect of the GDPR on privacy policies: Recent progress and future promise
Lee et al. Comparative study of BIM acceptance between Korea and the United States
CN106228453A (zh) 一种获得用户职业信息的方法和装置
CN105677831A (zh) 一种确定推荐商户的方法及装置
CN106709024A (zh) 基于血缘分析进行数据表溯源的方法及装置
CN107436875A (zh) 文本分类方法及装置
CN103455596B (zh) 一种基于大数据的科技项目立项评估的方法
CN107633380A (zh) 一种数据防泄漏系统的任务审批方法和系统
US10387805B2 (en) System and method for ranking news feeds
CN105678129B (zh) 一种确定用户身份信息的方法及设备
Rodriguez et al. Feature selection for job matching application using profile matching model
CN106776642A (zh) 一种信息显示方法及装置
Suzuki Quality assessment of Wikipedia articles using h-index
Paruma-Pabón et al. Finding relationships between socio-technical aspects and personality traits by mining developer e-mails
CN106845220A (zh) 一种Android恶意软件检测系统及方法
JP6884435B2 (ja) 協力会社サプライチェーンリスク分析方法
Laitinen et al. Revisiting weak ties
McClure et al. Green collar workers: an emerging workforce in the environmental sector
CN108537291A (zh) 一种样本分类方法和装置
Fischer et al. The impact of mobile computing on individuals, organizations, and society-synthesis of existing literature and directions for future research
Zimmermann et al. Systematic literature review of safety management systems in aviation maintenance operations
CN102937973A (zh) 一种生成用于信息呈现的呈现配置信息的方法和设备
CN106997340A (zh) 词库的生成以及利用词库的文档分类方法及装置
Granell et al. A scoping review on the use, processing and fusion of geographic data in virtual assistants
CN105786929A (zh) 一种信息监测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161214

RJ01 Rejection of invention patent application after publication