CN109816520A - 职业属性预测方法、装置、设备及存储介质 - Google Patents
职业属性预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109816520A CN109816520A CN201910081059.0A CN201910081059A CN109816520A CN 109816520 A CN109816520 A CN 109816520A CN 201910081059 A CN201910081059 A CN 201910081059A CN 109816520 A CN109816520 A CN 109816520A
- Authority
- CN
- China
- Prior art keywords
- information
- professional
- user
- geographical environment
- attribute forecast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开涉及一种职业属性预测方法。该方法包括:获取用户的多重地理环境信息;将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合;将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。根据本公开实施例提供的技术方案,该方案能以很低的成本,很高的准确率,在不打扰用户要求其主动告知的情况下,获得用户的职业属性,并为这些用户设计和提供定制的服务,尤其是互联网金融服务。
Description
技术领域
本公开涉及信息分析领域,具体而言,涉及一种职业属性预测方法、装置、计算设备及存储介质。
背景技术
金融场景中常使用用户的职业/职位属性作为风险定价和授信的依据。在传统金融行业,银行一般要求用户主动提交证明材料,以此来获取用户的职业、行业信息,并通过人工核查校验这些信息,作为用户的信用水平、收入水平的重要考量的依据。通过用户主动提供线下审核校验的方式获取职业信息的方式,在银行这类传统金融的场景下可以执行,但是却会耗费相当大的人力成本。
在互联网场景中,要求用户主动告知这些信息是比较困难的,要求用户主动上传如学生证、教师证、医师证等职业证明材料,这对用户体验影响较大,平台需要付出的成本也过高。而互联网金融极需在用户提出服务申请前,以较低的成本准确地提前获知用户的职业属性。当然也有一些方法是通过从用户的交易行为和场景偏好中找寻答案,但这类尝试一般受限于结果的准确率,无法作为依据为用户提供精准的定制服务。因此上述种种原因都严重影响用户职业的判断。
因此,需要一种新的职业属性预测方法、装置以及计算机设备。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的是解决现有技术的不足,提供职业属性预测方法、装置和计算设备,能够获得提高预测用户职业准确率的效果。
为了实现上述目的,本发明采用以下的技术方案。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一方面,提出一种职业属性预测方法,该方法包括:获取用户的多重地理环境信息;将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合;将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。
根据本公开实施例的另一个方面,提供一种职业属性预测的装置,所述装置包括:信息获取模块,设置为获取用户的多重地理环境信息;关联匹配模块,设置为将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合;职业预测模块,设置为将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。
根据本公开实施例的一个方面,提供一种存储有计算机程序的存储介质,所述计算机程序在由计算机的处理器运行时,使所述计算机执行如以上任一实施例所述的方法。
根据本公开实施例的一个方面,提供一种计算设备,包括:处理器;存储器,存储有可由所述处理器执行的指令;其中所述处理器被配置为执行如以上任一实施例所述的方法。
根据本公开实施例提供的技术方案,该方案能以很低的成本,很高的准确率,在不打扰用户要求其主动告知的情况下,获得用户的职业属性,并为这些用户设计和提供定制的服务,尤其是互联网金融服务。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本公开一实施例职业属性预测方法的流程图。
图2为根据本公开一实施例构建多重地理环境知识库的流程图。
图3为根据本公开一实施例单职业二分类模型的流程框图。
图4为根据本公开一实施例职业属性预测方法的流程图。
图5为根据本公开一实施例职业属性预测装置的框图。
图6为根据本公开一实施例的计算设备的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。
根据本发明的实施方式,提出了一种职业属性预测方法和装置以及介质和计算设备。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
图1为根据本公开一实施例职业属性预测方法的流程图,如图所示,本实施例的方法包括以下步骤S101-S103。
在步骤S101中,获取用户的多重地理环境信息。
用户访问互联网平台的频率很高,用户在访问互联网平台获取服务的同时,也授权给平台一系列访问时所处的地理环境信息。
多重地理环境信息包括所述用户的定位信息、履约地址信息和网络连接信息;所述网络连接信息包括服务集标识SSID信息和网际协议IP信息。
收集用户的地理环境信息可以包括但不限于,用户的定位坐标例如坐标点,经纬度等信息,履约地址例如可以是收货地址,服务集标识SSID信息例如可以是用户访问时连接的WI-FI中的相关信息,IP信息例如可以是用户访问的出口IP。
在步骤S102中,将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合。
在本公开一个示例性实施例中,将所述用户的定位信息、履约地址信息和网络连接信息,分别与所述多重地理环境知识库中的所述地理围栏信息以及从历史用户数据收集的履约地址信息和网络连接信息进行匹配,得到所述匹配特征集合。
历史用户数据指的是用户在过去使用网络服务平台时,网络服务平台会记录用户的个人信息,例如登记的履约地址信息,或者访问网络服务平台时连接的网络连接信息。
用户的多重地理信息与多重地理环境知识库进行关联时,用户的定位信息、履约地址信息、服务集标识SSID信息和网际协议IP信息同时进行匹配,例如,用户多次访问时多次定位在XX校区的地理多边形范围内,那么用户的定位坐标例如坐标点,经纬度等信息,可以通过定位在地理围栏解析为XX校区,履约地址信息(例如收货地址)通过文本解析为高校,访问时连接的WI-FI信息解析为XX学校,用户访问的出口IP解析为XX教育网出口IP,得到匹配特征集合。
在步骤S103中,将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。
在本公开一个示例性实施例中,将匹配特征集合分别输入多个单职业二分类模型,分别得到用户属于各个单职业的置信概率,并基于所述置信概率得到所述职业属性预测结果。
基于经过标注的样本集训练所述单职业二分类模型,所述样本集包括样本用户的匹配特征集合和职业属性信息。
所述单职业二分类模型通过主动学习训练得到,逻辑回归作为主动学习中的驱动算法。在职业属性预测的时候,将匹配特征集合作为输入特征,遍历多个单职业二分类模型,输出分类结果。
单职业二分类模型例如可以是学生二分类模型,医生二分类模型,企业员工二分类,公务员二分类等,本公开对此不做限定。将匹配特征集合输入学生二分类模型的分类结果是(学生,置信概率)例如可以是(大学生,0.98)。
基于所述置信概率得到所述职业属性预测结果包括:对于所述置信概率满足预设条件(例如高于预设阈值或排名靠前)的一个或多个单职业,生成相应的身份确认请求;以及基于所述用户对所述身份确认请求的响应,得到经过干预的职业属性预测结果。
将匹配特征集合输入多个单职业二分类模型,得到属于各个单职业的置信概率。根据置信概率的高低推测出用户的职业属性。
例如职业属性预测结果为(学生:0.98,医生:0.12,企业员工:0.07,公务员:0.05),根据置信概率排名最高的前三个的分类结果,推测出用户职业属性的3个可能,然后给用户推荐3种不同类型、适用于不同职业身份的优惠券,让用户从中选择,依据用户的选择结果得到经过干预的职业属性结果判定。
通过用户的地理信息与多重地理环境知识库的匹配,利用模型预测用户在不同职业的概率,提高了用户职业判断的准确率。相比用户提供和人工核准的方法,除去了较重的人力成本,同时在互联网场景中减少了对用户的打扰。能够在用户申请服务之前,就了解用户的职业特质,提供了为用户定制服务和产品,尤其是互联网金融产品的可能。
图2为根据本公开一实施例构建多重地理环境知识库的流程图,如图2所示,构建多重地理环境知识库包括步骤S201-S204。
步骤S201,基于地图获取与职业场所关联的地理围栏信息。
地理围栏信息包括但不限于:虚拟圈定的地理范围,包含虚拟的空间、虚拟的面积范围或虚拟的面积范围中带有最小和最大高度范围;一个多边形的GPS、GIS或地图区域;以基本单位为地理标识的范围,包含例如小区、街道、乡镇、县、辖区、学校、机关、商场、机场、公园、步行街、美食街、专业市场、公司、店铺、车站、收费站、大楼、场地、水域或山峰的面积内、短程辐射范围、有界地理范围或坐标点半径范围,以及该面积带有的最小和最大高度范围。
基于地图的位置信息定位到地图上对应的地理多边形边界围成的区域,获取与职业场所关联的地理围栏信息。例如虚拟的地理围栏发布范围可为某大厦的某一楼层的部分区域,相对应的职位场所可为某公司的企业地址,那么该地理围栏信息相对应的职业场所标签为企业。
步骤S202,获取与职业场所对应的IP网段信息。
基于IP区段的区域划分范围获取相对应的职业场所信息,例如166.111.0.0到166.111.255.255所处的IP地址段范围属于清华大学校区的IP网段信息,那么此IP网段信息对应的职业场所标签为高校。
步骤S203,对收集的履约地址信息进行文本分类标注,获取相应的职业场所标签。
例如,用户的收货地址为某市某区去某某企业,利用文本分类算法,例如自然语言处理算法(Natural Language Processing,NLP),对收货地址进行分类标注,那么该收货地址相对应的职业场所标签为企业。
步骤S204,基于所述地理围栏信息和所述履约地址信息,将所述职业场所标签扩散至收集的SSID信息。
根据定位信息、履约地址与SSID信息之间的对应关系,将地理围栏信息和所述履约地址信息所对应的标签扩散到相应的SSID信息上。
这里的扩散是指,通过SSID信息进行定位,若是定位的位置处于地理围栏的区域内,或者与履约地址信息相同或者相似,则可将SSID信息的标签设置成与地理围栏或者履约地址对应的职业场所标签相同。
多重地理环境知识库利用地理环境信息获取对应的职业场所信息,提高了职业信息判断的准确率和覆盖率。
图3为根据本公开一实施例单职业二分类模型的流程框图。如图3所示,所述逻辑回归算法模型的训练过程如下:
获取人工标注的样本集和待验证的匹配特征集合。
根据样本集,确定函数形式并训练逻辑回归算法模型,得到回归系数。
检验得到的回归系数,若检验结果表明逻辑回归算法模型显著则继续往下进行,否则则继续训练。
使用逻辑回归算法模型对待验证的匹配特征集合进行分析,得到相应的分类结果。
逻辑回归算法是一种机器学习中的经典分类器算法。该算法对于给定的输入样本可以给出该样本属于0类或1类的概率,得出来的结果实际是输入样本属于子类的概率值,因此可以将概率值大于0.5的划分成1类,概率值小于0.5的划分成0类,该算法没有其他复杂的可调参数,只需在应用该模型前训练好一个回归系数,因此应用较为简便和广泛。
单职业二分类模型经过主动学习,通过多轮迭代,从前一轮的分结果中获取下一轮的分类结果。由于初始样本需要人工进行特征标注,数量较少。因此需要利用初始样本和匹配特征集合作为输入特征,通过逻辑回归算法训练此单职业二分类模型,对更多的未知分类的样本进行预测,从这些预测结果中挑选出按照置信概率从高到底排序前N个的样本加入样本集,重复上述过程,扩大样本集的规模,更利于样本的生成,解决了样本少,标注成本高,获取困难的问题,解决样本稀疏的问题。
基于经过干预的职业属性预测结果更新所述样本集,并更新训练所述单职业二分类模型。
图4为根据本公开一实施例职业属性预测方法的流程图。如果以本公开实施例中结合图4所示的职业属性预测方法的流程图为例,利用图2所示的构建多重地理环境知识库的流程图来构建多重地理环境知识库,以及利用图3所示的单职业二分类模型的流程框图来进行职业属性预测模型训练。
如图4所示,本实施例的方法包括以下步骤S401-S405。
在步骤S401中,构建多重地理环境知识库。
步骤S401可参照图2实施例中的详细内容,此处不再赘述。
在步骤S402中,训练职业属性预测模型。
通过人工标注的样本集,利用图3实施例中关于单职业二分类模型训练过程对多个单职业二分类模型进行训练,训练多个关于不同职业的单职业二分类模型构成了职业属性预测模型。
在步骤S403中,获取用户的多重地理环境信息。
在一个示例性实施例中,所述多重地理环境信息包括所述用户的定位信息、履约地址信息和网络连接信息。
具体可参照图1实施例步骤S101的详细内容,此处不再赘述。
在步骤S404中,将所述多重地理环境信息与所述多重地理环境知识库进行关联,得到匹配特征集合。
在一个示例性实施例中,将所述用户的定位信息、履约地址信息和网络连接信息,分别与所述多重地理环境知识库中的所述地理围栏信息以及从历史用户数据收集的履约地址信息和网络连接信息进行匹配,得到所述匹配特征集合。
在步骤S405中,将所述匹配特征集合输入所述职业属性预测模型,得到所述用户的职业属性预测结果。
在一个示例性实施例中,将匹配特征集合分别输入多个单职业二分类模型,分别得到用户属于各个单职业的置信概率,并基于所述置信概率得到所述职业属性预测结果。
上述实施例中,通过构建多重地理环境知识库和训练职业属性预测模型对用户的职业属性进行预测判断。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图5是根据本公开一实施例职业属性预测装置的框图。本公开实施例提供的职业属性预测装置可以包括信息获取模块501、关联匹配模块502、职业预测模块503。
信息获取模块501,设置为获取用户的多重地理环境信息;
关联匹配模块502,设置为将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合;
职业预测模块503,设置为将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。
职业属性预测装置还可以包括多重地理环境知识库构建模块,设置为基于地理围栏信息以及从历史用户数据收集的履约地址信息和网络连接信息,构建所述多重地理环境知识库。所述网络连接信息包括服务集标识SSID信息和网际协议IP信息。
多重地理环境知识库构建模块还被设置为基于地图获取与职业场所关联的地理围栏信息;获取与职业场所对应的IP网段信息;对收集的履约地址信息进行文本分类标注,获取相应的职业场所标签;基于所述地理围栏信息和所述履约地址信息,将所述职业场所标签扩散至收集的SSID信息。
关联匹配模块502还被设置为将所述用户的定位信息、履约地址信息和网络连接信息,分别与所述多重地理环境知识库中的所述地理围栏信息以及从历史用户数据收集的履约地址信息和网络连接信息进行匹配,得到所述匹配特征集合。
职业属性预测装置还可以包括单职业二分类模型训练模块。
职业预测模块503可以包括多个单职业二分类模型,职业预测模块503还被设置为将所述匹配特征集合分别输入所述多个单职业二分类模型,分别得到所述用户属于各个单职业的置信概率,并基于所述置信概率得到所述职业属性预测结果。单职业二分类模型训练模块被设置为基于经过标注的样本集训练所述单职业二分类模型,所述样本集包括样本用户的匹配特征集合和职业属性信息;以及单职业二分类模型训练模块还被设置为基于经过干预的职业属性预测结果更新所述样本集,并更新训练所述单职业二分类模型。
职业预测模块503包括:对于所述置信概率满足预设条件的一个或多个单职业,职业预测模块503生成相应的身份确认请求;以及基于所述用户对所述身份确认请求的响应,职业预测模块503得到经过干预的职业属性预测结果。
根据多重地理环境信息的职业属性预测装置提高了用户职业判断的准确率。相比用户提供和人工核准的方法,除去了较重的人力成本,同时在互联网场景中减少了对用户的打扰。
本实施例基于与上述方法实施例同样的发明构思,提供了一种职业属性预测装置,本实施例能够用于实现上述实施例中提供的职业属性预测方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。作为模块或单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上实施方式的描述,本领域的技术人员易于理解,上文描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。
在一个示例实施方式中,还提供一种计算设备,该设备可以是手机、平板电脑等移动终端,也可以是台式计算机、服务器等终端设备,本示例实施方式中对此不作限制。图6示出根据本公开示例实施方式中一种计算设备60的示意图。例如,设备60可以被提供为一移动终端。参照图6,设备60包括处理组件61,其进一步包括一个或多个处理器,以及由存储器62所代表的存储器资源,用于存储可由处理组件61的执行的指令,例如应用程序。存储器62中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件61被配置为执行指令,以执行上述职业属性预测方法。
其中,存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端或移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
装置60还可以包括一个电源组件63被配置为执行装置60的电源管理,一个有线或无线网络接口64被配置为将装置60连接到网络,和一个输入输出(I/O)接口65。装置60可以操作基于存储在存储器62的操作系统,例如Android、IOS或类似。
需要说明的是,本发明所示的存储有计算机程序的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的职业属性预测方法。
例如,所述的电子设备可以实现如图1中所示的:步骤S101,获取用户的多重地理环境信息。步骤S102,将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合。步骤S103,将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。
又如,所述的电子设备可以实现如图1、图2、图3和图4中所示的各个步骤。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (11)
1.一种职业属性预测方法,其特征在于,包括:
获取用户的多重地理环境信息;
将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合;
将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。
2.如权利要求1所述的方法,其特征在于,还包括:
基于地理围栏信息以及从历史用户数据收集的履约地址信息和网络连接信息,构建所述多重地理环境知识库。
3.如权利要求2所述的方法,其特征在于,所述网络连接信息包括服务集标识SSID信息和网际协议IP信息,所述的构建所述多重地理环境知识库包括:
基于地图获取与职业场所关联的地理围栏信息;
获取与职业场所对应的IP网段信息;
对收集的履约地址信息进行文本分类标注,获取相应的职业场所标签;
基于所述地理围栏信息和所述履约地址信息,将所述职业场所标签扩散至收集的SSID信息。
4.如权利要求2所述的方法,其特征在于,所述多重地理环境信息包括所述用户的定位信息、履约地址信息和网络连接信息;所述的将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联包括:
将所述用户的定位信息、履约地址信息和网络连接信息,分别与所述多重地理环境知识库中的所述地理围栏信息以及从历史用户数据收集的履约地址信息和网络连接信息进行匹配,得到所述匹配特征集合。
5.如权利要求1所述的方法,其特征在于,所述职业属性预测模型包括多个单职业二分类模型,所述的将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果,包括:
将所述匹配特征集合分别输入所述多个单职业二分类模型,分别得到所述用户属于各个单职业的置信概率,并基于所述置信概率得到所述职业属性预测结果。
6.如权利要求5所述的方法,其特征在于,还包括:
基于经过标注的样本集训练所述单职业二分类模型,所述样本集包括样本用户的匹配特征集合和职业属性信息。
7.如权利要求5所述的方法,其特征在于,还包括:
基于经过干预的职业属性预测结果更新所述样本集,并更新训练所述单职业二分类模型。
8.如权利要求5-7任一所述的方法,其特征在于,所述的基于所述置信概率得到所述职业属性预测结果包括:
对于所述置信概率满足预设条件的一个或多个单职业,生成相应的身份确认请求;以及
基于所述用户对所述身份确认请求的响应,得到经过干预的职业属性预测结果。
9.一种职业属性预测的装置,其特征在于,所述装置包括:
信息获取模块,设置为获取用户的多重地理环境信息;
关联匹配模块,设置为将所述多重地理环境信息与预先构建的多重地理环境知识库进行关联,得到匹配特征集合;
职业预测模块,设置为将所述匹配特征集合输入预先建立的职业属性预测模型,得到所述用户的职业属性预测结果。
10.一种存储有计算机程序的存储介质,所述计算机程序在由计算机的处理器运行时,使所述计算机执行如权利要求1-8中任一项所述的方法。
11.一种计算设备,包括:
处理器;
存储器,存储有可由所述处理器执行的指令;
其中所述处理器被配置为执行如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910081059.0A CN109816520A (zh) | 2019-01-28 | 2019-01-28 | 职业属性预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910081059.0A CN109816520A (zh) | 2019-01-28 | 2019-01-28 | 职业属性预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109816520A true CN109816520A (zh) | 2019-05-28 |
Family
ID=66605406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910081059.0A Pending CN109816520A (zh) | 2019-01-28 | 2019-01-28 | 职业属性预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109816520A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782128A (zh) * | 2019-09-27 | 2020-02-11 | 北京淇瑀信息科技有限公司 | 一种用户职业标签生成方法、装置和电子设备 |
CN111292832A (zh) * | 2020-01-22 | 2020-06-16 | 浙江连信科技有限公司 | 基于智能终端的心理危机人员主动预测方法及装置 |
CN111815436A (zh) * | 2020-07-14 | 2020-10-23 | 深圳市卡牛科技有限公司 | 一种信贷对象的分类方法、装置、终端及存储介质 |
CN112396445A (zh) * | 2019-08-16 | 2021-02-23 | 京东数字科技控股有限公司 | 用于识别用户身份信息的方法和装置 |
CN112785163A (zh) * | 2021-01-26 | 2021-05-11 | 维沃移动通信有限公司 | 职业识别方法、装置、设备及介质 |
CN112836114A (zh) * | 2019-11-22 | 2021-05-25 | 上海哔哩哔哩科技有限公司 | 一种识别用户人群的方法以及装置 |
CN112016855B (zh) * | 2020-10-22 | 2021-09-24 | 北京淇瑀信息科技有限公司 | 基于关系网匹配的用户行业识别方法、装置和电子设备 |
-
2019
- 2019-01-28 CN CN201910081059.0A patent/CN109816520A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396445A (zh) * | 2019-08-16 | 2021-02-23 | 京东数字科技控股有限公司 | 用于识别用户身份信息的方法和装置 |
CN110782128A (zh) * | 2019-09-27 | 2020-02-11 | 北京淇瑀信息科技有限公司 | 一种用户职业标签生成方法、装置和电子设备 |
CN110782128B (zh) * | 2019-09-27 | 2024-03-29 | 北京淇瑀信息科技有限公司 | 一种用户职业标签生成方法、装置和电子设备 |
CN112836114A (zh) * | 2019-11-22 | 2021-05-25 | 上海哔哩哔哩科技有限公司 | 一种识别用户人群的方法以及装置 |
CN111292832A (zh) * | 2020-01-22 | 2020-06-16 | 浙江连信科技有限公司 | 基于智能终端的心理危机人员主动预测方法及装置 |
CN111292832B (zh) * | 2020-01-22 | 2021-09-14 | 浙江连信科技有限公司 | 基于智能终端的心理危机人员主动预测方法及装置 |
CN111815436A (zh) * | 2020-07-14 | 2020-10-23 | 深圳市卡牛科技有限公司 | 一种信贷对象的分类方法、装置、终端及存储介质 |
CN112016855B (zh) * | 2020-10-22 | 2021-09-24 | 北京淇瑀信息科技有限公司 | 基于关系网匹配的用户行业识别方法、装置和电子设备 |
CN112785163A (zh) * | 2021-01-26 | 2021-05-11 | 维沃移动通信有限公司 | 职业识别方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109816520A (zh) | 职业属性预测方法、装置、设备及存储介质 | |
Wörndl et al. | Recommending a sequence of interesting places for tourist trips | |
US20160353240A1 (en) | Clearinghouse System and Method for Enhancing the Quality, Operation and Accessibility of Carrier-Based Networks | |
KR102361721B1 (ko) | 콘텐츠를 제시 및 전달하기 위한 시스템 및 방법 | |
CN107908740A (zh) | 信息输出方法和装置 | |
CN110009379A (zh) | 一种选址模型构建和选址方法、装置及设备 | |
CN107368907A (zh) | 酒店信息展示方法及装置、电子设备、存储介质 | |
Murad | Creating a GIS application for local health care planning in Saudi Arabia | |
Shirzadi Babakan et al. | An agent-based evaluation of impacts of transport developments on the modal shift in Tehran, Iran | |
Shibghatullah et al. | Vehicle tracking application based on real time traffic | |
Pettit et al. | A data-driven approach to exploring future land use and transport scenarios: the online what if? Tool | |
Taplin et al. | Optimizing bus stop locations for walking access: Stops-first design of a feeder route to enhance a residential plan | |
Schlenther et al. | Addressing spatial service provision equity for pooled ride‐hailing services through rebalancing | |
Liu et al. | Urban growth modeling based on a game between farmers and governments: Case study of urban fringe in Wuhan, Hubei Province in China | |
Ngo et al. | House prices, airport location proximity, air traffic volume and the COVID-19 effect | |
Zaferanieh et al. | The minimum information approach to the uncapacitated p-median facility location problem | |
CN110348896A (zh) | 划分地理网格的方法、商圈确定方法及设备 | |
Lotfi et al. | A multi-objective optimization model for school location-allocation coupling demographic changes | |
Zhang et al. | Walking in the cities without ground, how 3d complex network volumetrics improve analysis | |
Wang et al. | Day-to-day route choice in networks with different sets for choice: experimental results | |
Huang | Simulating individual work trips for transit-facilitated accessibility study | |
Correia et al. | Applying a structured simulation-based methodology to assess carpooling time–space potential | |
Li et al. | Multimodal, multicriteria dynamic route choice: A GIS-microscopic traffic simulation approach | |
Hayes | Valuing Broadband Benefits: A selective report on issues and options | |
Jiang et al. | User recruitment algorithm for maximizing quality under limited budget in mobile crowdsensing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |