CN112785163A - 职业识别方法、装置、设备及介质 - Google Patents
职业识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112785163A CN112785163A CN202110102022.9A CN202110102022A CN112785163A CN 112785163 A CN112785163 A CN 112785163A CN 202110102022 A CN202110102022 A CN 202110102022A CN 112785163 A CN112785163 A CN 112785163A
- Authority
- CN
- China
- Prior art keywords
- user
- occupation
- behavior
- information
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 46
- 230000001755 vocal effect Effects 0.000 claims abstract description 31
- 230000006399 behavior Effects 0.000 claims description 149
- 230000003542 behavioural effect Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种职业识别方法、装置、设备及介质,属于电子设备技术领域。职业识别方法包括:获取目标用户的属性特征;将属性特征输入到职业识别模型,得到目标用户的职业信息;其中,职业识别模型是根据目标训练集训练得到的,目标训练集包括多个第一用户的属性特征和职业信息;各个第一用户的职业信息是根据第一用户的第一行为特征和第二行为特征确定的,第一行为特征是用户对与职业相关的应用程序的使用信息,第二行为特征是用户在与职业相关的地理范围内的行为信息。本申请的职业识别方法、装置、设备及介质,能够提高职业识别的准确性。
Description
技术领域
本申请属于电子设备技术领域,具体涉及一种职业识别方法、装置、设 备及介质。
背景技术
职业是用户重要的一个社会属性,准确识别用户的职业不仅可以提升企 业客户精细化的管理水平,也有助于指导营销策略的应用。通过对用户职业 的识别,可以针对不同的用户,实施以客户为中心的个性化服务和专业化营 销。同时,这些职业识别结果也对公共安全和政府制定政策方面都有着积极 的意义。
相关技术中,主要是通过分析用户的位置变化,来进行用户职业的识别。
但是,在实现本申请过程中,发明人发现相关技术中至少存在如下问题: 仅通过用户的位置变化识别用户职业,识别结果不准确。
发明内容
本申请实施例的目的是提供一种职业识别方法、装置、设备及介质,能 够解决用户职业识别不准确的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种职业识别方法,包括:
获取目标用户的属性特征;
将属性特征输入到职业识别模型,得到目标用户的职业信息;
其中,职业识别模型是根据目标训练集训练得到的,目标训练集包括多 个第一用户的属性特征和职业信息;各个第一用户的职业信息是根据第一用 户的第一行为特征和第二行为特征确定的,第一行为特征是用户对与职业相 关的应用程序的使用信息,第二行为特征是用户在与职业相关的地理范围内 的行为信息。
第二方面,本申请实施例提供了一种职业识别装置,包括:
第一获取模块,用于获取目标用户的属性特征;
识别模块,用于将属性特征输入到职业识别模型,得到目标用户的职业 信息;
其中,职业识别模型是根据目标训练集训练得到的,目标训练集包括多 个第一用户的属性特征和职业信息;各个第一用户的职业信息是根据第一用 户的第一行为特征和第二行为特征确定的,第一行为特征是用户对与职业相 关的应用程序的使用信息,第二行为特征是用户在与职业相关的地理范围内 的行为信息。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、 存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被 处理器执行时实现如第一方面的职业识别方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读 存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面的 职业识别方法的步骤。
第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口, 通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的职 业识别方法的步骤。
在本申请实施例中,通过将目标用户的属性特征输入职业识别模型,能 够得到目标用户的职业信息。由于该职业识别模型是根据包括多个第一用户 的属性特征和职业信息的目标训练集训练得到的,而各个第一用户的职业信 息是根据第一用户的第一行为特征和第二行为特征确定的,第一行为特征是 用户对与职业相关的应用程序的使用信息,第二行为特征是用户在与职业相 关的地理范围内的行为信息。因此,利用本申请实施例的职业识别模型进行 用户职业识别时,能够提高职业识别的准确性。
附图说明
图1是本申请实施例提供的职业识别方法的流程示意图;
图2是本申请实施例提供的职业识别装置的结构示意图;
图3是本申请实施例提供的电子设备的结构示意图;
图4是实现本申请实施例的电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是 全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创 造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似 的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在 适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的 那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限 定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以 及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前 后关联对象是一种“或”的关系。
下面结合附图,通过具体地实施例及其应用场景对本申请实施例提供的 职业识别方法、装置、设备及介质进行详细地说明。
图1是本申请实施例提供的职业识别方法的流程示意图。职业识别方法 可以包括:
S101:获取目标用户的属性特征;
S102:将目标用户的属性特征输入到职业识别模型,得到目标用户的职 业信息。
其中,职业识别模型是根据目标训练集训练得到的,目标训练集包括多 个第一用户的属性特征和职业信息;各个第一用户的职业信息是根据第一用 户的第一行为特征和第二行为特征确定的,第一行为特征是用户对与职业相 关的应用程序的使用信息,第二行为特征是用户在与职业相关的地理范围内 的行为信息。
上述各步骤的具体实现方式将在下文中进行详细描述。
在本申请实施例中,通过将目标用户的属性特征输入职业识别模型,能 够得到目标用户的职业信息。由于该职业识别模型是根据包括多个第一用户 的属性特征和职业信息的目标训练集训练得到的,而各个第一用户的职业信 息是根据第一用户的第一行为特征和第二行为特征确定的,第一行为特征是 用户对与职业相关的应用程序的使用信息,第二行为特征是用户在与职业相 关的地理范围内的行为信息。因此,利用本申请实施例的职业识别模型进行 用户职业识别时,能够提高职业识别的准确性。
在本申请实施例的一些可能实现中,S101中的属性特征包括但不限于: 用户自然属性特征(年龄、性别、籍贯等)、社会属性特征(婚姻状况、生 育状况、工作单位等)、消费属性特征(手机价格、手机应用消费情况等)、 资产属性特征(汽车信息、房产信息等)、手机应用偏好特征(应用程序类 型偏好、资讯偏好、搜索偏好、职业类应用程序使用情况等)。
在本申请实施例的一些可能实现中,S102中的职业包括但不限于:网约 车司机、教师、医生、超市收银员等。
在本申请实施例的一些可能实现中,本申请实施例中的与职业相关的应 用程序包括但不限于:网约车司机职业对应的司机端打车应用程序,代驾职 业对应的代驾端应用程序,人事职业对应的人事端应用程序,房屋中介职业 对应的房屋中介端应用程序和汽车中介职业对应的汽车中介端应用程序等等。
在本申请实施例的一些可能实现中,本申请实施例中的用户对与职业相 关的应用程序的使用信息包括但不限于:用户使用与职业相关的应用程序的 次数和使用时长等。
在本申请实施例的一些可能实现中,本申请实施例中的与职业相关的地 理范围包括但不限于:学校、医院、超市等。
在本申请实施例的一些可能实现中,本申请实施例中的用户在与职业相 关的地理范围内的行为信息但不限于:用户去往与职业相关的地理范围内的 次数、用户去往与职业相关的地理范围内的频次等。
在本申请实施例的一些可能实现中,S102可以包括:将目标用户的属性 特征输入到职业识别模型,得到目标用户对应每个职业的概率;将最大概率 对应的职业,确定为目标用户的职业。
示例性地,假设将目标用户的属性特征输入到职业识别模型,得到目标 用户对应医生的概率为0.02%,对应网约车司机的概率为85.4%,对应超市收 银员的概率为1.3%,……。其中,目标用户对应网约车司机的概率最大,则 将网约车司机确定为目标用户的职业。
在本申请实施例的一些可能实现中,在S101之前,本申请实施例提供的 职业识别方法还可以包括:获取多个第二用户的第三行为特征和第四行为特 征,其中,第三行为特征是用户对应用程序的使用信息,第四行为特征是用 户在地理范围内的行为信息;根据多个第二用户的第三行为特征和第四行为 特征,将多个第二用户中,使用过与职业相关的应用程序和/或到访过与职业 相关的地理范围内的用户,确定为第一用户;获取第一用户的属性特征、第 一行为特征和第二行为特征;根据第一用户的第一行为特征和第二行为特征, 确定第一用户的职业信息;根据第一用户的属性特征和职业信息,训练职业 识别模型。
在本申请实施例的一些可能实现中,用户对应用程序的使用信息包括但 不限于用户使用应用程序的使用次数和使用时长等。
在本申请实施例的一些可能实现中,用户在地理范围内的行为信息包括 但不限于用户去往某一地理范围内的次数、用户去往某一地理范围内的频次 等。
具体地,可以构建职业应用程序维表和职业兴趣点(Point of Interesting,POI)维表。
职业应用程序维表用于表征职业与应用程序的关系。职业应用程序维表 可以选取应用商店上的与职业相关的应用程序,当然,职业应用程序维表还 可以选取应用商店上的较多用户下载的与职业相关的应用程序。当选出与职 业相关的应用程序后,可以建立与职业相关的应用程序与职业的映射关系, 进而生成职业应用程序维表。示例性地,职业应用程序维表如表1所示。
表1
与职业相关的应用程序的名称 | 职业 |
某打车应用程序司机端 | 网约车司机 |
某房屋租赁销售应用程序中介端 | 房屋中介 |
某代驾应用程序代驾端 | 代驾 |
职业兴趣点用于表示与职业相关的地理范围,职业兴趣点维表用于表征 职业与地理范围的关系。职业兴趣点维表可以爬取某地图服务商提供的POI 信息(包括但不限于:POI名称、POI围栏地址经纬度坐标和POI类别等), 然后,利用正则匹配,对POI匹配相应的职业,比如,某某医院POI对应职 业:医生。示例性地,职业兴趣点维表如表2所示。
表2
职业兴趣点名称 | 职业 |
某医院 | 医生 |
某学校 | 教师 |
某超市 | 超市收银员 |
在本申请实施例的一些可能实现中,对于第二用户在地理范围内的行为 信息的获取,主要依据用户手机上报的位置信息来统计用户去往职业兴趣点 的行为数据。具体地,可以统计用户出现在职业兴趣点围栏中的次数、时长 和频次等数据。其中,兴趣点围栏可以使用地图服务商提供的兴趣点数据。
在本申请实施例的一些可能实现中,当获取到多个第三行为特征和第四 行为特征后,可以将使用过与职业相关的应用程序和/或到访过与职业相关的 地理范围内的用户,确定为第一用户。
在本申请实施例的一些可能实现中,还可以将多个第二用户中,满足以 下至少一个条件的用户,确定为第一用户:
使用与职业相关的应用程序的次数大于预设次数;
使用与职业相关的应用程序的时长大于预设时长;
去往职业兴趣点的次数大于预设次数;
去往职业兴趣点的频次大于预设频次;
在职业兴趣点的时长大于预设时长。
在本申请实施例的一些可能实现中,根据第一用户的第一行为特征和第 二行为特征,确定第一用户的职业信息,包括:根据第一用户的第一行为特 征和第二行为特征,确定第一用户对应的多个职业;根据第一用户的第一行 为特征和第二行为特征,确定第一用户对应的多个职业中的每个职业的职业 置信度;将最大的职业置信度对应的职业,确定为第一用户的职业信息。
在本申请实施例的一些可能实现中,在根据第一用户的第一行为特征和 第二行为特征,确定第一用户对应的多个职业时,可以当用户使用过某一与 职业X相关的应用程序时,将职业X作为用户的一个职业,当用户去往过某 一与职业Y相关的地理范围内时,将职业Y作为用户的一个职业。
示例性地,对于用户A,假设用户使用过打车应用程序司机端和到访过 医院,则第一用户对应的职业包括:网约车司机和医生。
在本申请实施例的一些可能实现中,可以利用主成分分析(Principal ComponentAnalysis,PCA)等算法,计算不同职业用户在不同职业行为维度 上表现差异性,自动计算并分配权重。
示例性地,以网约车司机职业为例,由于网约车司机职业用户与偶尔兼 职做网约车司机的用户,在打车应用程序司机端的使用行为上差异性很大, 网约车司机职业用户在该打车应用程序司机端上使用次数、时长等行为数据 要远高于后者,但两者可能在职业POI的多个维度上数据表现差异不大。因 此基于PCA算法,通过计算出所有网约车司机在这些维度上的行为差异性, 可以得到网约车司机职业在不同职业行为上的权重分配结果。类似的,可以 计算出其他职业在不同职业行为上的权重分配结果。职业权重分配结果如表3所示。
表3
在本申请实施例的一些可能实现中,当确定出第一用户之后,可以统计 一段时间内(比如,最近一个月)或者一段时间内的特定时间段内(比如, 工作日的8点至18点),用户使用与职业相关的应用程序的次数、时长等行 为数据,以及去往职业POI的次数、时长和频次等行为数据,得到第一用户 对应职业的所有行为数据。
以网约车司机职业为例。首先通过统计网约车司机职业用户在近一个月 特定时间段内使用打车应用程序司机端使用行为数据(使用次数、使用时长 和使用频次等)和去往职业POI的行为数据(去往某停车场的次数、频次 等),得到各个网约车司机用户的所有行为数据,如表4所示。
表4
当得到各个网约车司机用户的所有行为数据之后,可以将各个网约车司 机用户的所有行为数据进行归一化,利用归一化的数据和表3所示的职业权 重分配结果进行加权求和,得到每个网约车司机的职业置信度。
在本申请实施例的一些可能实现中,对于某一维度,可以将该维度中的 最大值归为1,其他值归为该值与最大值的比值。则各个网约车司机用户的所 有行为数据归一化后,如表5所示。
表5
则用户A对应网约车司机的职业置信度为:
0.3×1+0.3×1+0.2×0.1+0.1×1+0.1×1+0.1×1=0.62。
用户B对应网约车司机的职业置信度为:
0.3×0.2+0.3×0.33+0.2×1+0.1×0.75+0.1×0.8+0.1×0.25=0.539。
用户C对应网约车司机的职业置信度为:
0.3×0.01+0.3×0.02+0.2×0.07+0.1×0.2+0.1×0.25+0.1×0.2=0.088。
类似的,可以得到其他职业的用户的职业置信度。
对于一个用户可能对应多个职业的情况,将该用户对应的职业置信度中 最大职业置信度对应的职业作为该用户的职业。
示例性地,对于上述用户B,其可能是房屋中介,仅在晚上兼职网约车 司机。因此,该用户B使用房屋租赁销售应用程序中介端的时长、频次和去 往房屋中介办公场所的次数和频次均较大。因此,计算得到的用户B对应房 屋中介的职业置信度应该大于用户B对应网约车司机的职业置信度。最终将 用户B的职业确定为房屋中介。
在本申请实施例的一些可能实现中,当确定出第一用户后,还可以对第 一用户进行过滤,去除非法第一用户。
示例性地,对于网约车司机职业,由于网约车司机必须具有驾驶证,而 具有驾驶证的用户必须年满18周岁。因此,可以基于年龄将职业为网约车司 机的用户中小于18周岁的用户剔除。
再示例性地,对于月嫂职业,由于月嫂必须为女性。因此,可以基于性 别将职业为月嫂的用户中的男性用户剔除。
在本申请实施例的一些可能实现中,根据第一用户的属性特征和职业信 息,训练职业识别模型,包括:根据每个第一用户的最大职业置信度,选取 满足预设条件的多个第一用户;根据满足预设条件的多个第一用户的属性特 征和职业信息,训练职业识别模型。
在本申请实施例的一些可能实现中,预设条件包括但不限于:职业置信 度大于预设阈值对应的用户;按照职业置信度从大到小排序,排名前20%的 职业置信度对应的用户。
在本申请实例的一些可能实现中,因职业变动频率较小,可每月定期更 新待识别用户职业结果。由于部分职业(如老师)随节假日和寒暑假行为差 异较大,在构建用户职业特征时,可剔除该时间段内的用户职业行为数据。 此外,职业应用程序维表也可以定期更新,在对职业应用程序维表进行定期 更新时,可对应用商店进行扫描,增改相应的职业应用程序,完善职业应用 程序维表。
本申请实施例能够有效地解决高职业置信度职业种子用户难判断、数量 少且收集困难的问题。同时深入地挖掘了用户真实的职业行为数据,对用户 职业的刻画更加全面和丰富,不仅能够有效地提高识别用户职业的准确率, 还防止了用户职业变动或假期变动带来的识别结果影响。最终,自动识别的 职业结果不仅可以提升企业客户精细化的管理水平,也有助于指导营销策略 的应用。
需要说明的是,本申请实施例提供的职业识别方法,执行主体可以为职 业识别装置,或者该职业识别装置中的用于执行职业识别方法的控制模块。 本申请实施例中以职业识别装置执行职业识别方法为例,说明本申请实施例 提供的职业识别装置。
图2是本申请实施例提供的职业识别装置的结构示意图。职业识别装置 200可以包括:
第一获取模块201,用于获取目标用户的属性特征;
识别模块202,用于将目标用户的属性特征输入到职业识别模型,得到目 标用户的职业信息。
其中,职业识别模型是根据目标训练集训练得到的,目标训练集包括多 个第一用户的属性特征和职业信息;各个第一用户的职业信息是根据第一用 户的第一行为特征和第二行为特征确定的,第一行为特征是用户对与职业相 关的应用程序的使用信息,第二行为特征是用户在与职业相关的地理范围内 的行为信息。
在本申请实施例中,通过将目标用户的属性特征输入职业识别模型,能 够得到目标用户的职业信息。由于该职业识别模型是包括多个第一用户的属 性特征和职业信息的目标训练集训练得到的,而各个第一用户的职业信息是 根据第一用户的第一行为特征和第二行为特征确定的,第一行为特征是用户 对与职业相关的应用程序的使用信息,第二行为特征是用户在与职业相关的 地理范围内的行为信息。因此,利用本申请实施例的职业识别模型进行用户 职业识别时,能够提高职业识别的准确性。
在本申请实施例的一些可能实现中,识别模块202具体可以用于:
将属性特征输入到职业识别模型,得到目标用户对应每个职业的概率;
将最大概率对应的职业,确定为目标用户的职业。
在本申请实施例的一些可能实现中,本申请实施例提供的职业识别装置 200还可以包括:
第二获取模块,用于获取多个第二用户的第三行为特征和第四行为特征, 其中,第三行为特征是用户对应用程序的使用信息,第四行为特征是用户在 地理范围内的行为信息;
第一确定模块,用于根据多个第二用户的第三行为特征和第四行为特征, 将多个第二用户中,使用过与职业相关的应用程序和/或到访过与职业相关的 地理范围内的用户,确定为第一用户;
第三获取模块,用于获取第一用户的属性特征、第一行为特征和第二行 为特征;
第二确定模块,用于根据第一用户的第一行为特征和第二行为特征,确 定第一用户的职业信息;
训练模块,用于根据第一用户的属性特征和职业信息,训练职业识别模 型。
在本申请实施例的一些可能实现中,第二确定模块可以包括:
第一确定子模块,用于根据第一用户的第一行为特征和第二行为特征, 确定第一用户对应的多个职业;
第二确定子模块,用于根据第一用户的第一行为特征和第二行为特征, 确定第一用户对应的多个职业中的每个职业的职业置信度;
第三确定子模块,用于将最大的职业置信度对应的职业,确定为第一用 户的职业信息。
在本申请实施例的一些可能实现中,第二确定模块具体可以用于:
根据每个第一用户的最大职业置信度,选取满足预设条件的多个第一用 户;
根据满足预设条件的多个第一用户的属性特征和职业信息,训练职业识 别模型。
本申请实施例中的职业识别装置可以是装置,也可以是终端中的部件、 集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。 示例性地,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、 车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant, PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的职业识别装置可以为具有操作系统的装置。该操作系 统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可 能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的职业识别装置能够实现图1的职业识别方法实施例 中的各个过程,为避免重复,这里不再赘述。
可选的,如图3所示,本申请实施例还提供一种电子设备300,包括处理 器301,存储器302,存储在存储器302上并可在处理器301上运行的程序或 指令,该程序或指令被处理器301执行时实现上述职业识别方法实施例的各 个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述的移动电子设备和 非移动电子设备。
在本申请实施例的一些可能实现中,处理器301可以包括中央处理器 (CPU),或者特定集成电路(Application Specific Integrated Circuit, ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
在本申请实施例的一些可能实现中,存储器302可以包括只读存储器 (Read-OnlyMemory,ROM),随机存取存储器(Random Access Memory, RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其 他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有 包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如, 存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其 可操作来执行参考根据本申请的职业识别方法所描述的操作。
图4是实现本申请实施例的电子设备的硬件结构示意图。该电子设备400 包括但不限于:射频单元401、网络模块402、音频输出单元403、输入单元 404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器 409、以及处理器410等部件。
本领域技术人员可以理解,电子设备400还可以包括给各个部件供电的 电源(比如电池),电源可以通过电源管理系统与处理器410逻辑相连,从 而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图4中示 出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更 多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器410,用于获取目标用户的属性特征;将目标用户的属性特 征输入到职业识别模型,得到目标用户的职业信息。
其中,职业识别模型是根据目标训练集训练得到的,目标训练集包括多 个第一用户的属性特征和职业信息;各个第一用户的职业信息是根据第一用 户的第一行为特征和第二行为特征确定的,第一行为特征是用户对与职业相 关的应用程序的使用信息,第二行为特征是用户在与职业相关的地理范围内 的行为信息。
在本申请实施例中,通过将目标用户的属性特征输入职业识别模型,能 够得到目标用户的职业信息。由于该职业识别模型是包括多个第一用户的属 性特征和职业信息的目标训练集训练得到的,而各个第一用户的职业信息是 根据第一用户的第一行为特征和第二行为特征确定的,第一行为特征是用户 对与职业相关的应用程序的使用信息,第二行为特征是用户在与职业相关的 地理范围内的行为信息。因此,利用本申请实施例的职业识别模型进行用户 职业识别时,能够提高职业识别的准确性。
在本申请实施例的一些可能实现中,处理器410具体可以用于:
将属性特征输入到职业识别模型,得到目标用户对应每个职业的概率;
将最大概率对应的职业,确定为目标用户的职业。
在本申请实施例的一些可能实现中,在本申请实施例的一些可能实现中, 处理器410还可以用于:
获取多个第二用户的第三行为特征和第四行为特征,其中,第三行为特 征是用户对应用程序的使用信息,第四行为特征是用户在地理范围内的行为 信息;
根据多个第二用户的第三行为特征和第四行为特征,将多个第二用户中, 使用过与职业相关的应用程序和/或到访过与职业相关的地理范围内的用户, 确定为第一用户;
获取第一用户的属性特征、第一行为特征和第二行为特征;
根据第一用户的第一行为特征和第二行为特征,确定第一用户的职业信 息;
根据第一用户的属性特征和职业信息,训练职业识别模型。
在本申请实施例的一些可能实现中,处理器410具体可以用于:
根据第一用户的第一行为特征和第二行为特征,确定第一用户对应的多 个职业;
根据第一用户的第一行为特征和第二行为特征,确定第一用户对应的多 个职业中的每个职业的职业置信度;
将最大的职业置信度对应的职业,确定为第一用户的职业信息。
在本申请实施例的一些可能实现中,处理器410具体可以用于:
根据每个第一用户的最大职业置信度,选取满足预设条件的多个第一用 户;
根据满足预设条件的多个第一用户的属性特征和职业信息,训练职业识 别模型。
应理解的是,本申请实施例中,输入单元404可以包括图形处理器 (GraphicsProcessing Unit,GPU)4041和麦克风4042,图形处理器4041对 在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态 图片或视频的图像数据进行处理。显示单元406可包括显示面板4061,可以 采用液晶显示器、有机发光二极管等形式来配置显示面板4061。用户输入单 元407包括触控面板4071以及其他输入设备4072。触控面板4071,也称为 触摸屏。触控面板4071可包括触摸检测装置和触摸控制器两个部分。其他输 入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关 按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器409可用于存储 软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器410可 集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、 用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是, 上述调制解调处理器也可以不集成到处理器410中。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上 存储有程序或指令,该程序或指令被处理器执行时实现上述职业识别方法实 施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。处理器可以是但 不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电 路。计算机可读存储介质的示例包括非暂态计算机可读存储介质,如计算机 只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接 口和处理器耦合,处理器用于运行程序或指令,实现上述职业识别方法实施 例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、 芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在 涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装 置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括 为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下, 由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、 物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施 方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可 以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或 组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的 技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光 盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器, 空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上 述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的, 本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求 所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (12)
1.一种职业识别方法,其特征在于,所述方法包括:
获取目标用户的属性特征;
将所述属性特征输入到职业识别模型,得到所述目标用户的职业信息;
其中,所述职业识别模型是根据目标训练集训练得到的,所述目标训练集包括多个第一用户的属性特征和职业信息;各个所述第一用户的职业信息是根据所述第一用户的第一行为特征和第二行为特征确定的,所述第一行为特征是用户对与职业相关的应用程序的使用信息,所述第二行为特征是用户在与职业相关的地理范围内的行为信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述属性特征输入到职业识别模型,得到所述目标用户的职业信息,包括:
将所述属性特征输入到所述职业识别模型,得到所述目标用户对应每个职业的概率;
将最大概率对应的职业,确定为所述目标用户的职业。
3.根据权利要求1所述的方法,其特征在于,在所述获取目标用户的属性特征之前,所述方法还包括:
获取多个第二用户的第三行为特征和第四行为特征,其中,所述第三行为特征是用户对应用程序的使用信息,所述第四行为特征是用户在地理范围内的行为信息;
根据所述多个第二用户的第三行为特征和第四行为特征,将所述多个第二用户中,使用过所述与职业相关的应用程序和/或到访过所述与职业相关的地理范围内的用户,确定为所述第一用户;
获取所述第一用户的所述属性特征、所述第一行为特征和所述第二行为特征;
根据所述第一用户的所述第一行为特征和所述第二行为特征,确定所述第一用户的职业信息;
根据所述第一用户的所述属性特征和所述职业信息,训练所述职业识别模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一用户的所述第一行为特征和所述第二行为特征,确定所述第一用户的职业信息,包括:
根据所述第一用户的所述第一行为特征和所述第二行为特征,确定所述第一用户对应的多个职业;
根据所述第一用户的所述第一行为特征和所述第二行为特征,确定所述第一用户对应的所述多个职业中的每个职业的职业置信度;
将最大的职业置信度对应的职业,确定为所述第一用户的职业信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一用户的所述属性特征和所述职业信息,训练所述职业识别模型,包括:
根据每个所述第一用户的最大职业置信度,选取满足预设条件的多个第一用户;
根据满足预设条件的多个第一用户的所述属性特征和所述职业信息,训练所述职业识别模型。
6.一种职业识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标用户的属性特征;
识别模块,用于将所述属性特征输入到职业识别模型,得到所述目标用户的职业信息;
其中,所述职业识别模型是根据目标训练集训练得到的,所述目标训练集包括多个第一用户的属性特征和职业信息;各个所述第一用户的职业信息是根据所述第一用户的第一行为特征和第二行为特征确定的,所述第一行为特征是用户对与职业相关的应用程序的使用信息,所述第二行为特征是用户在与职业相关的地理范围内的行为信息。
7.根据权利要求6所述的装置,其特征在于,所述识别模块具体用于:
将所述属性特征输入到所述职业识别模型,得到所述目标用户对应每个职业的概率;
将最大概率对应的职业,确定为所述目标用户的职业。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取多个第二用户的第三行为特征和第四行为特征,其中,所述第三行为特征是用户对应用程序的使用信息,所述第四行为特征是用户在地理范围内的行为信息;
第一确定模块,用于根据所述多个第二用户的第三行为特征和第四行为特征,将所述多个第二用户中,使用过所述与职业相关的应用程序和/或到访过所述与职业相关的地理范围内的用户,确定为所述第一用户;
第三获取模块,用于获取所述第一用户的所述属性特征、所述第一行为特征和所述第二行为特征;
第二确定模块,用于根据所述第一用户的所述第一行为特征和所述第二行为特征,确定所述第一用户的职业信息;
训练模块,用于根据所述第一用户的所述属性特征和所述职业信息,训练所述职业识别模型。
9.根据权利要求8所述的装置,其特征在于,所述第二确定模块,包括:
第一确定子模块,用于根据所述第一用户的所述第一行为特征和所述第二行为特征,确定所述第一用户对应的多个职业;
第二确定子模块,用于根据所述第一用户的所述第一行为特征和所述第二行为特征,确定所述第一用户对应的所述多个职业中的每个职业的职业置信度;
第三确定子模块,用于将最大的职业置信度对应的职业,确定为所述第一用户的职业信息。
10.根据权利要求9所述的装置,其特征在于,所述第二确定模块具体用于:
根据每个所述第一用户的最大职业置信度,选取满足预设条件的多个第一用户;
根据满足预设条件的多个第一用户的所述属性特征和所述职业信息,训练所述职业识别模型。
11.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至5任一项所述的职业识别方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至5任一项所述的职业识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110102022.9A CN112785163A (zh) | 2021-01-26 | 2021-01-26 | 职业识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110102022.9A CN112785163A (zh) | 2021-01-26 | 2021-01-26 | 职业识别方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112785163A true CN112785163A (zh) | 2021-05-11 |
Family
ID=75757544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110102022.9A Pending CN112785163A (zh) | 2021-01-26 | 2021-01-26 | 职业识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112785163A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115346028A (zh) * | 2022-08-17 | 2022-11-15 | 支付宝(杭州)信息技术有限公司 | 虚拟环境主题处理方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228453A (zh) * | 2016-08-08 | 2016-12-14 | 联动优势科技有限公司 | 一种获得用户职业信息的方法和装置 |
CN109816520A (zh) * | 2019-01-28 | 2019-05-28 | 北京三快在线科技有限公司 | 职业属性预测方法、装置、设备及存储介质 |
CN110111143A (zh) * | 2019-04-28 | 2019-08-09 | 上海二三四五移动科技有限公司 | 一种建立移动端用户画像的控制方法以及控制装置 |
CN110347936A (zh) * | 2019-06-21 | 2019-10-18 | 上海淇馥信息技术有限公司 | 基于lbs信息的数据挖掘方法、装置、系统和记录介质 |
CN110363359A (zh) * | 2019-07-23 | 2019-10-22 | 中国联合网络通信集团有限公司 | 一种职业预测方法和系统 |
CN111191021A (zh) * | 2018-11-14 | 2020-05-22 | 北京嘀嘀无限科技发展有限公司 | 职业预测方法、装置、设备及计算机可读存储介质 |
CN111210201A (zh) * | 2020-01-02 | 2020-05-29 | 平安科技(深圳)有限公司 | 职业标签建立方法、装置、电子设备及存储介质 |
CN111597343A (zh) * | 2020-07-24 | 2020-08-28 | 北京淇瑀信息科技有限公司 | 一种基于app的智能化用户职业判断方法、装置和电子设备 |
-
2021
- 2021-01-26 CN CN202110102022.9A patent/CN112785163A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228453A (zh) * | 2016-08-08 | 2016-12-14 | 联动优势科技有限公司 | 一种获得用户职业信息的方法和装置 |
CN111191021A (zh) * | 2018-11-14 | 2020-05-22 | 北京嘀嘀无限科技发展有限公司 | 职业预测方法、装置、设备及计算机可读存储介质 |
CN109816520A (zh) * | 2019-01-28 | 2019-05-28 | 北京三快在线科技有限公司 | 职业属性预测方法、装置、设备及存储介质 |
CN110111143A (zh) * | 2019-04-28 | 2019-08-09 | 上海二三四五移动科技有限公司 | 一种建立移动端用户画像的控制方法以及控制装置 |
CN110347936A (zh) * | 2019-06-21 | 2019-10-18 | 上海淇馥信息技术有限公司 | 基于lbs信息的数据挖掘方法、装置、系统和记录介质 |
CN110363359A (zh) * | 2019-07-23 | 2019-10-22 | 中国联合网络通信集团有限公司 | 一种职业预测方法和系统 |
CN111210201A (zh) * | 2020-01-02 | 2020-05-29 | 平安科技(深圳)有限公司 | 职业标签建立方法、装置、电子设备及存储介质 |
CN111597343A (zh) * | 2020-07-24 | 2020-08-28 | 北京淇瑀信息科技有限公司 | 一种基于app的智能化用户职业判断方法、装置和电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115346028A (zh) * | 2022-08-17 | 2022-11-15 | 支付宝(杭州)信息技术有限公司 | 虚拟环境主题处理方法及装置 |
CN115346028B (zh) * | 2022-08-17 | 2024-09-06 | 支付宝(杭州)信息技术有限公司 | 虚拟环境主题处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111949834B (zh) | 选址方法和选址平台系统 | |
CN108133013B (zh) | 信息处理方法、装置、计算机设备和存储介质 | |
TWI686760B (zh) | 保險欺詐識別的資料處理方法、裝置、設備及伺服器 | |
Mao et al. | Faster deliveries and smarter order assignments for an on-demand meal delivery platform | |
US20130204822A1 (en) | Tools and methods for determining relationship values | |
JP2019512806A5 (zh) | ||
CN112861972A (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
CN115391669B (zh) | 一种智能推荐方法、装置、电子设备 | |
CN107861929A (zh) | 文档生成方法、终端及计算机可读介质 | |
US20190095536A1 (en) | Method and device for content recommendation and computer readable storage medium | |
CN114117226A (zh) | 一种产品推荐方法、系统、设备及介质 | |
CN106663301A (zh) | 信息处理装置、信息处理方法及程序 | |
CN109934614A (zh) | 一种基于消费分析热力图的信用卡推广方法及装置 | |
CN103853809A (zh) | 用于业务对象的有效空间分配 | |
US10762089B2 (en) | Open ended question identification for investigations | |
CN110895543B (zh) | 人口迁徙跟踪展示方法、装置及存储介质 | |
Lansley et al. | Challenges to representing the population from new forms of consumer data | |
CN111652282A (zh) | 基于大数据的用户偏好分析方法、装置及电子设备 | |
CN112785163A (zh) | 职业识别方法、装置、设备及介质 | |
CN110197375A (zh) | 一种相似用户识别方法、装置、相似用户识别设备和介质 | |
US20140200996A1 (en) | Information distribution device and information distribution method | |
US20220307831A1 (en) | Information processing device and information processing method | |
CN115797084A (zh) | 基于车主驾驶行为的投保定价指导方法及其相关设备 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN110942056A (zh) | 服饰关键点定位方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |