CN111192025A - 职业信息匹配方法、装置、计算机设备和存储介质 - Google Patents
职业信息匹配方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111192025A CN111192025A CN201911414231.6A CN201911414231A CN111192025A CN 111192025 A CN111192025 A CN 111192025A CN 201911414231 A CN201911414231 A CN 201911414231A CN 111192025 A CN111192025 A CN 111192025A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- professional
- matching
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 59
- 238000000605 extraction Methods 0.000 claims abstract description 28
- 238000013145 classification model Methods 0.000 claims abstract description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 238000011835 investigation Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 230000009193 crawling Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract description 21
- 230000001755 vocal effect Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种职业信息匹配方法、装置、计算机设备和存储介质。所述方法包括:接收职业信息查询指令,所述职业信息查询指令携带了用户标识;根据所述用户标识获取历史多维度信息,对所述历史多维度信息进行特征提取,得到与所述用户标识对应的特征向量;将所述特征向量输入分类模型,得到多个类别特征标签;利用多个所述类别特征标签生成对应的用户画像信息;将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业。采用本方法能够对每个用户的职业信息进行准确的测评,避免了因测评信息不完整而导致无法准确的匹配,有效的提高职业测评准确性,实现人才资源的合理分配。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种职业信息匹配方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,促进了越来越多的新兴产业,新的产业也会促进职业类型的不断丰富,因此职业的分工也更加精细化,不同类型的职业要求匹配的职业能力也不同,对每个求职者进行有效的职业测评,能将不同类型的人才资源进行合理的分配。
然而,目前的职业测评方式,由于测评数据的局限性,使得测评信息不完整,导致对求职者的职业能力信息分析不够全面,使得职业测评的准确性不足。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对提高职业测评准确性的职业信息匹配方法、装置、计算机设备和存储介质。
一种职业信息匹配方法,所述方法包括:
接收职业信息查询指令,所述职业信息查询指令携带了用户标识;
根据所述用户标识获取历史多维度信息,对所述历史多维度信息进行特征提取,得到与所述用户标识对应的特征向量;
将所述特征向量输入分类模型,得到多个类别特征标签;
利用多个所述类别特征标签生成对应的用户画像信息;
将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业。
在其中一个实施例中,所述根据所述用户标识获取历史多维度信息包括:
根据所述用户标识获取对应的注册信息;
通过社交网页爬取与所述用户标识对应的社交信息;
通过征信平台获取与所述用户标识对应的征信信息。
在其中一个实施例中,所述根据所述用户标识获取历史多维度信息,对所述历史多维度信息进行特征提取包括:
利用词库模型对所述历史多维度信息进行特征提取;
将所述历史多维度信息分别转换成对应的词向量,对所述词向量进行合并,得到与所述用户标识对应的特征向量。
在其中一个实施例中,所述将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业包括:
从数据库中获取多种职业数据信息;
将所述用户画像信息与多种所述职业数据信息进行相似度匹配;
将相似度大于阈值的职业数据信息标记为待推荐职业。
在其中一个实施例中,所述将所述用户画像信息与多种所述职业数据信息进行相似度匹配包括:
获取所述用户画像信息中每个类别特征标签的权重等级;
利用散列函数对所述用户画像信息、多种所述职业数据信息进行转换,得到对应的用户画像信息序列、多种所述职业数据信息序列;
根据每个所述类别特征标签的权重等级,对所述用户画像信息序列进行加权计算,得到对应的加权用户画像信息序列;
将所述加权用户画像信息序列与多种所述职业数据信息序列进行匹配。
一种职业信息匹配装置,所述装置包括:
接收模块,用于接收职业信息查询指令,所述职业信息查询指令携带了用户标识;
信息获取模块,用于根据所述用户标识获取历史多维度信息;
特征提取模块,用于对所述历史多维度信息进行特征提取,得到与所述用户标识对应的特征向量;
分类模块,用于将所述特征向量输入分类模型,得到多个类别特征标签;
画像生成模块,用于利用多个所述类别特征标签生成对应的用户画像信息;
匹配模块,用于将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收职业信息查询指令,所述职业信息查询指令携带了用户标识;
根据所述用户标识获取历史多维度信息,对所述历史多维度信息进行特征提取,得到与所述用户标识对应的特征向量;
将所述特征向量输入分类模型,得到多个类别特征标签;
利用多个所述类别特征标签生成对应的用户画像信息;
将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收职业信息查询指令,所述职业信息查询指令携带了用户标识;
根据所述用户标识获取历史多维度信息,对所述历史多维度信息进行特征提取,得到与所述用户标识对应的特征向量;
将所述特征向量输入分类模型,得到多个类别特征标签;
利用多个所述类别特征标签生成对应的用户画像信息;
将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业。
上述职业信息匹配方法、装置、计算机设备和存储介质,通过接收职业信息查询指令,职业信息查询指令携带了用户标识。根据用户标识获取历史多维度信息,对历史多维度信息进行特征提取,得到与用户标识对应的特征向量。将特征向量输入分类模型,得到多个类别特征标签。利用多个类别特征标签生成对应的用户画像信息。将用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业。相对于传统的职业测评方式,通过获取与用户标识对应的历史多维度信息,根据用户的多维度信息进行特征提取,生成对应的用户画像信息,由此使得能够根据用户画像信息与多种职业信息进行匹配,得到与每个用户标识匹配的职业,可以对每个用户的职业信息进行准确的测评,避免了因测评信息不完整而导致无法准确的匹配,有效的提高职业测评准确性,实现人才资源的合理分配。
附图说明
图1为一个实施例中职业信息匹配方法的应用场景图;
图2为一个实施例中职业信息匹配方法的流程示意图;
图3为一个实施例中根据用户标识获取历史多维度信息,对历史多维度信息进行特征提取步骤的流程示意图;
图4为一个实施例中将用户画像信息与多种职业数据信息进行相似度匹配步骤的流程示意图;
图5为一个实施例中职业信息匹配装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的职业信息匹配方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102可以通过向服务器104发送请求,从服务器104获取对应的多种职业信息以及与用户相关的数据信息。终端102接收职业信息查询指令,职业信息查询指令携带了用户标识。终端102根据用户标识获取历史多维度信息,对历史多维度信息进行特征提取,得到与用户标识对应的特征向量,终端102将特征向量输入分类模型,得到多个类别特征标签。终端102利用多个类别特征标签生成对应的用户画像信息。终端102将用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种职业信息匹配方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,接收职业信息查询指令,职业信息查询指令携带了用户标识。
终端接收到职业信息查询指令,职业信息查询指令可以来自用户或招聘人员等。终端可以在不同场景下,通过不同的方式接收职业信息查询指令。例如,终端可通过网络应用显示职业测评系统网页,用户可通过登录职业测评系统之后,对显示的职业测评系统的主页面进行浏览,该网络应用可以是浏览器或者其他可以显示页面内容的应用程序(例如职业测评应用、公司招聘局域网应用等)。用户在登录职业测评系统之后,在显示器显示的职业测评系统主页面中进行对应的操作。例如,用户可以通过触发操作发起职业信息查询指令,终端接收到该用户发起的信息查询指令,根据该用户的账户信息,识别该用户对应的标识信息,用户标识用于识别用户的身份。其中,职业测评系统可以包括多种不同类型的职业测评内容,例如专业能力测评、个人性格测评、职业心理测评以及个人征信信息测评等,不同的职业类型匹配不同的个人职业能力。
步骤204,根据用户标识获取历史多维度信息,对历史多维度信息进行特征提取,得到与用户标识对应的特征向量。
历史多维度信息包括但不限于用户历史关注的职业类型、职业偏好、个人工作背景等。终端根据用户的标识信息,终端向服务器发送信息获取请求,服务器接收到的终端发送的信息请求指令后,服务器根据信息请求指令进行解析对应的信息数据,服务器将被请求的信息数据返回给终端,终端获取到服务器返回的历史多维度信息。终端根据获取到的该用户的历史多维度信息,利用词库模型对历史多维度信息进行特征提取,得到与该用户标识对应的特征向量。
终端也可以根据用户的标识信息,终端从本地数据中直接获取用户的历史多维度信息。其中,本地数据中包括预先保存的不同用户的历史多维度信息。具体的,本地数据中可以包括用户历史关注的职业类型、职业偏好、个人工作背景等。终端对从本地数据中直接获取到的该用户的历史多维度信息进行特征提取,得到与该用户标识对应的特征向量。
步骤206,将特征向量输入分类模型,得到多个类别特征标签。
步骤208,利用多个类别特征标签生成对应的用户画像信息。
用户画像指的是根据用户社会属性、职业偏好和职业行为等信息而抽象出的一个标签化的用户模型,用于反映用户的职业能力。用户画像由多个特征标签构成,该特征标签是通过对用户信息分析而来的高度精炼的特征标识。部分标签是根据用户的行为数据直接得到,部分是通过一系列预设的算法或规则挖掘得到。本实施例中,用户画像信息所包含的多个类别特征标签可以包括用户姓名、性别、专业基本信息、职业偏好、职业类型等,可通过用户的专业基本信息、经常浏览的页面信息、个人性格特点、工作背景、家庭信息等其中一个或多个方向的历史数据进行统计分析而得出。终端利用用户的特征向量进行信息筛选,生成与用户对应的用户画像信息。例如,终端将特征向量输入分类模型,得到多个类别特征标签。终端利用多个类别特征标签生成对应的用户画像信息。刻画某用户的用户画像信息可以包括该用户抽象思维能力强,求知欲强,肯动脑,善思考,不愿动手,喜欢独立的和富有创造性的工作。知识渊博,有学识才能,不善于领导他人,考虑问题理性,做事喜欢精确,喜欢逻辑分析和推理,不断探讨未知的领域的个人性格特征。
步骤210,将用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业。
服务器中存储有大量的职业信息数据,终端可以通过向服务器发送请求,从服务器获取对应的多种职业信息。终端将用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业。其中,多种职业信息的内容可以包括与用户标识匹配的某个职业信息以及对应的行业分析数据。分析数据可以包括同行业的不同职位的对比分析数据,也可以包括不同行业对应的同一职位的对比分析数据。终端根据匹配到的职业信息的内容,将该职业相关的信息进行推送给对应的用户。
本实施例中,通过接收职业信息查询指令,职业信息查询指令携带了用户标识。根据用户标识获取历史多维度信息,对历史多维度信息进行特征提取,得到与用户标识对应的特征向量。将特征向量输入分类模型,得到多个类别特征标签。利用多个类别特征标签生成对应的用户画像信息。将用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业。相对于传统的职业测评方式,通过获取与用户标识对应的历史多维度信息,根据用户的多维度信息进行特征提取,生成对应的用户画像信息,由此使得能够根据用户画像信息与多种职业信息进行匹配,得到与每个用户标识匹配的职业,可以对每个用户的职业信息进行准确的测评,避免了因测评信息不完整而导致无法准确的匹配,有效的提高职业测评准确性,实现人才资源的合理分配。
在一个实施例中,根据用户标识获取历史多维度信息的步骤,包括:
根据用户标识获取对应的注册信息。
通过社交网页爬取与用户标识对应的社交信息。
通过征信平台获取与用户标识对应的征信信息。
终端根据职业信息查询指令识别对应的用户标识之后,终端根据用户标识获取对应的注册信息,终端通过社交网页爬取与用户标识对应的社交信息,终端通过征信平台获取与用户标识对应的征信信息。具体的,终端通过配置工具可以搜索与用户标识相关的多个网页,终端从多个网页源码中爬取数据,当终端遍历爬取完所有与用户标识相对应的网页数据后,得到与用户标识对应的历史多维度信息,可以包括与用户对应的注册信息、社交信息、征信信息等。例如终端根据职业信息查询指令识别对应的用户标识之后,终端通过配置工具搜索与用户标识相关的网页,例如终端搜索到某个网页上有与该用户标识对应的注册信息,终端从该网页页面中爬取数据信息,得到与该用户标识对应的该用户的历史多维度信息,可以包括该用户的自我评价信息为不讲究、谦逊、踏实稳重、诚实可靠等个人性格特点。由此使得在进行职业测评时,可以利用配置工具获取到用户不同维度的信息作为相似用户进行职业匹配的大数据基础,使得测评信息更加丰富多样化,提高了职业测评信息的准确性。
在一个实施例中,根据用户标识获取历史多维度信息,对历史多维度信息进行特征提取的步骤,如图3所示,包括:
步骤302,利用词库模型对历史多维度信息进行特征提取。
步骤304,将历史多维度信息分别转换成对应的词向量,对词向量进行合并,得到与用户标识对应的特征向量。
终端根据获取到的该用户的历史多维度信息,利用词库模型对历史多维度信息进行特征提取,将该用户相关的多维度信息分别转换成对应的词向量,对词向量进行合并,得到与用户标识对应的特征向量。其中,用户的特征向量是指使用不同维度的信息生成对应的相关向量,再将用户相关的所有向量合并成用户的特征向量,刻画用户关注的职业类型、职业偏好等信息,作为相似用户推荐匹配的大数据基础。由此使得能够给用户提供更为精确的、具有针对性的职业测评信息。
在一个实施例中,将用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业的步骤,包括:
从数据库中获取多种职业数据信息。
将用户画像信息与多种职业数据信息进行相似度匹配。
将相似度大于阈值的职业数据信息标记为待推荐职业。
终端利用上述得到的用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业。具体的,终端可以通过向服务器发送请求,从服务器获取对应的多种职业数据信息。终端将用户画像信息与多种职业数据信息进行相似度匹配,将相似度大于阈值的职业数据信息标记为待推荐职业。具体的,终端利用哈希算法,对用户画像信息与多种职业数据信息进行相似度匹配。终端根据获取到的历史多维度信息的不同类型,进行分类筛选,计算不同属性信息的权重。其中,多维度信息可以包括文字型信息、数值型信息、图像信息等。终端可以根据用户画像信息的关键信息,利用散列函数生成一个固定属性信息排列次序的特征标签对应的用户画像信息序列,以便同维度上可以利用同一个属性信息参与相似度计算。终端进行相似度求解计算,将相似度计算结果大于阈值的用户画像信息序列对应的职业数据信息标记为待推荐职业。由此使得通过对用户对应的特征向量进行分类,得到多个类别标签,并根据用户的类别标签来确定具体的用户画像信息。根据所确定的具体的用户画像信息来匹配对应的职业,从而提高了为用户匹配对应职业信息的准确度。
在其中一个实施例中,将用户画像信息与多种职业数据信息进行相似度匹配的步骤,如图4所示,包括:
步骤402,获取用户画像信息中每个类别特征标签的权重等级。
步骤404,利用散列函数对用户画像信息、多种职业数据信息进行转换,得到对应的用户画像信息序列、多种职业数据信息序列。
步骤406,根据每个类别特征标签的权重等级,对用户画像信息序列进行加权计算,得到对应的加权用户画像信息序列。
步骤408,将加权用户画像信息序列与多种职业数据信息序列进行匹配。
终端将上述得到的用户特征向量输入分类模型中,终端利用分类模型进行多层特征筛选后,得到多个类别特征标签,终端利用多个类别特征标签生成对应的用户画像信息。终端将用户画像信息与多种职业数据信息进行相似度匹配。具体的,终端将上述得到的用户特征向量输入预先训练好的分类模型中,终端利用分类模型进行多层特征筛选后,得到多个类别特征标签。终端根据获取到的多个类别特征标签,计算不同特征标签信息的权重等级。进一步的,终端利用散列函数对用户画像信息、多种职业数据信息进行转换,得到对应的用户画像信息序列、多种职业数据信息序列。终端根据得到的不同特征标签信息的权重等级,终端对用户画像信息序列进行加权计算,得到对应的加权用户画像信息序列。终端将加权用户画像信息序列与多种职业数据信息序列进行匹配。
以职业偏好为工程师举例说明。假设终端获取到用户的历史多纬度信息包括用户历史关注的职业类型为工程师。终端获取到的历史多维度信息包括职业类型为技能型,终端以技能型作为该用户画像信息的关键词,构建第一词向量。假设终端获取到的历史多维度信息还包括该用户的个人性格特点为不善言辞内向型,终端则再以性格特征内向型作为该用户画像信息的关键词,构建第二词向量。进一步的,终端将第一词向量和第二词向量合并成该用户的特征向量。终端根据用户特征向量对应的多个类别特征标签,利用哈希算法进行计算,将该用户画像信息与多种职业数据信息进行相似度匹配。其中,哈希算法(Hash)即散列函数。哈希算法是一种单向密码体制,即是一个从明文到密文的不可逆的映射,只有加密过程,没有解密过程。同时,哈希函数可以将任意长度的输入经过变化以后得到固定长度的输出。哈希函数的这种单向特征和输出数据长度固定的特征使得它可以生成消息或者数据。具体的,终端获取用户画像信息中每个类别特征标签的权重等级,例如终端可以预先对不同类别特征标签设置对应的权重等级。终端利用哈希算法,对该用户的用户画像信息和多种职业信息进行转换,得到对应的用户画像信息序列、多种职业数据信息序列。终端根据每个类别特征标签的权重等级,对用户画像信息序列进行加权计算,得到对应的加权用户画像信息序列。进一步的,终端将加权用户画像信息序列与多种职业数据信息序列进行相似度求解计算,得到对应的相似度数值。当相似度大于阈值时,确定该加权用户画像信息序列对应的职业信息为待推荐职业。阈值可以在配置文件中预先设置,例如,阈值为85%。终端将该类加权用户画像信息序列对应的职业标记为待推荐职业。由于将用户画像信息与多种职业数据信息进行相似度匹配,因此在进行职业测评时,能够给用户提供更为精确的、具有针对性的职业信息内容。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种职业信息匹配装置,包括:接收模块502、信息获取模块504、特征提取模块506、分类模块508、画像生成模块510和匹配模块512,其中:
接收模块502,用于接收职业信息查询指令,职业信息查询指令携带了用户标识。
信息获取模块504,用于根据用户标识获取历史多维度信息。
特征提取模块506,用于对历史多维度信息进行特征提取,得到与用户标识对应的特征向量。
分类模块508,用于将特征向量输入分类模型,得到多个类别特征标签。
画像生成模块510,用于利用多个类别特征标签生成对应的用户画像信息。
匹配模块512,用于将用户画像信息与多种职业信息进行匹配,得到与用户标识匹配的职业。
在一个实施例中,该装置还包括:爬取模块。
信息获取模块504还用于根据用户标识获取对应的注册信息。爬取模块用于通过社交网页爬取与用户标识对应的社交信息。信息获取模块504还用于通过征信平台获取与用户标识对应的征信信息。
在一个实施例中,特征提取模块506还用于利用词库模型对历史多维度信息进行特征提取;将历史多维度信息分别转换成对应的词向量,对词向量进行合并,得到与用户标识对应的特征向量。
在一个实施例中,匹配模块512还用于从数据库中获取多种职业数据信息,将用户画像信息与多种职业数据信息进行相似度匹配,将相似度大于阈值的职业数据信息标记为待推荐职业。
在一个实施例中,匹配模块512还用于获取用户画像信息中每个类别特征标签的权重等级,利用散列函数对用户画像信息、多种职业数据信息进行转换,得到对应的用户画像信息序列、多种职业数据信息序列,根据每个类别特征标签的权重等级,对用户画像信息序列进行加权计算,得到对应的加权用户画像信息序列,将加权用户画像信息序列与多种职业数据信息序列进行匹配。
关于职业信息匹配装置的具体限定可以参见上文中对于职业信息匹配方法的限定,在此不再赘述。上述职业信息匹配装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种职业信息匹配方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述各个方法实施例的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种职业信息匹配方法,所述方法包括:
接收职业信息查询指令,所述职业信息查询指令携带了用户标识;
根据所述用户标识获取历史多维度信息,对所述历史多维度信息进行特征提取,得到与所述用户标识对应的特征向量;
将所述特征向量输入分类模型,得到多个类别特征标签;
利用多个所述类别特征标签生成对应的用户画像信息;
将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户标识获取历史多维度信息包括:
根据所述用户标识获取对应的注册信息;
通过社交网页爬取与所述用户标识对应的社交信息;
通过征信平台获取与所述用户标识对应的征信信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户标识获取历史多维度信息,对所述历史多维度信息进行特征提取包括:
利用词库模型对所述历史多维度信息进行特征提取;
将所述历史多维度信息分别转换成对应的词向量,对所述词向量进行合并,得到与所述用户标识对应的特征向量。
4.根据权利要求1所述的方法,其特征在于,所述将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业包括:
从数据库中获取多种职业数据信息;
将所述用户画像信息与多种所述职业数据信息进行相似度匹配;
将相似度大于阈值的职业数据信息标记为待推荐职业。
5.根据权利要求4所述的方法,其特征在于,所述将所述用户画像信息与多种所述职业数据信息进行相似度匹配包括:
获取所述用户画像信息中每个类别特征标签的权重等级;
利用散列函数对所述用户画像信息、多种所述职业数据信息进行转换,得到对应的用户画像信息序列、多种所述职业数据信息序列;
根据每个所述类别特征标签的权重等级,对所述用户画像信息序列进行加权计算,得到对应的加权用户画像信息序列;
将所述加权用户画像信息序列与多种所述职业数据信息序列进行匹配。
6.一种职业信息匹配装置,其特征在于,所述装置包括:
接收模块,用于接收职业信息查询指令,所述职业信息查询指令携带了用户标识;
信息获取模块,用于根据所述用户标识获取历史多维度信息;
特征提取模块,用于对所述历史多维度信息进行特征提取,得到与所述用户标识对应的特征向量;
分类模块,用于将所述特征向量输入分类模型,得到多个类别特征标签;
画像生成模块,用于利用多个所述类别特征标签生成对应的用户画像信息;
匹配模块,用于将所述用户画像信息与多种职业信息进行匹配,得到与所述用户标识匹配的职业。
7.根据权利要求6的职业信息匹配装置,其特征在于,所述特征提取模块模块还用于利用词库模型对所述历史多维度信息进行特征提取;将所述历史多维度信息分别转换成对应的词向量,对所述词向量进行合并,得到与所述用户标识对应的特征向量。
8.根据权利要求6的职业信息匹配装置,其特征在于,所述匹配模块还用于从数据库中获取多种职业数据信息;将所述用户画像信息与多种所述职业数据信息进行相似度匹配;将相似度大于阈值的职业数据信息标记为待推荐职业。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911414231.6A CN111192025A (zh) | 2019-12-31 | 2019-12-31 | 职业信息匹配方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911414231.6A CN111192025A (zh) | 2019-12-31 | 2019-12-31 | 职业信息匹配方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111192025A true CN111192025A (zh) | 2020-05-22 |
Family
ID=70709636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911414231.6A Pending CN111192025A (zh) | 2019-12-31 | 2019-12-31 | 职业信息匹配方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111192025A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814056A (zh) * | 2020-07-31 | 2020-10-23 | 平安金融管理学院(中国·深圳) | 基于信息处理的供应商推荐方法及相关设备 |
CN111898031A (zh) * | 2020-08-14 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 一种获得用户画像的方法及装置 |
CN112233740A (zh) * | 2020-09-28 | 2021-01-15 | 广州金域医学检验中心有限公司 | 患者身份识别方法、装置、设备和介质 |
CN112328849A (zh) * | 2020-11-02 | 2021-02-05 | 腾讯科技(深圳)有限公司 | 用户画像的构建方法、基于用户画像的对话方法及装置 |
CN112363773A (zh) * | 2020-10-23 | 2021-02-12 | 岭东核电有限公司 | 移动终端配置方法、装置、计算机设备和存储介质 |
CN112989037A (zh) * | 2021-02-05 | 2021-06-18 | 浙江连信科技有限公司 | 用于识别职业压力源的信息处理方法及装置 |
CN113032441A (zh) * | 2021-03-24 | 2021-06-25 | 宁波莱博网络科技有限公司 | 一种基于大数据技术的用户画像分析系统 |
CN113159497A (zh) * | 2021-02-25 | 2021-07-23 | 泰豪信息技术有限公司 | 监仓分配方法、系统、可读存储介质及计算机设备 |
CN113627797A (zh) * | 2021-08-12 | 2021-11-09 | 深圳平安智汇企业信息管理有限公司 | 入职员工画像生成方法、装置、计算机设备及存储介质 |
CN113641901A (zh) * | 2021-08-05 | 2021-11-12 | 腾讯科技(深圳)有限公司 | 资讯推荐方法、装置、计算机可读介质及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832776A (zh) * | 2017-10-12 | 2018-03-23 | 如是科技(大连)有限公司 | 职位推荐的处理方法及装置 |
CN108874928A (zh) * | 2018-05-31 | 2018-11-23 | 平安科技(深圳)有限公司 | 简历数据信息解析处理方法、装置、设备及存储介质 |
CN109241446A (zh) * | 2018-10-17 | 2019-01-18 | 重庆聚焦人才服务有限公司 | 一种职位推荐方法及系统 |
CN109345201A (zh) * | 2018-09-20 | 2019-02-15 | 成都辰语轩科技有限公司 | 人力资源管理方法、装置、电子设备及存储介质 |
CN109408746A (zh) * | 2018-09-26 | 2019-03-01 | 平安科技(深圳)有限公司 | 画像信息查询方法、装置、计算机设备和存储介质 |
CN109493199A (zh) * | 2019-01-04 | 2019-03-19 | 深圳壹账通智能科技有限公司 | 产品推荐方法、装置、计算机设备和存储介质 |
CN110335060A (zh) * | 2019-05-20 | 2019-10-15 | 微民保险代理有限公司 | 产品信息推送方法、装置、存储介质和计算机设备 |
CN110569340A (zh) * | 2019-07-24 | 2019-12-13 | 深圳壹账通智能科技有限公司 | 文本信息验证方法、装置、计算机设备和存储介质 |
-
2019
- 2019-12-31 CN CN201911414231.6A patent/CN111192025A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832776A (zh) * | 2017-10-12 | 2018-03-23 | 如是科技(大连)有限公司 | 职位推荐的处理方法及装置 |
CN108874928A (zh) * | 2018-05-31 | 2018-11-23 | 平安科技(深圳)有限公司 | 简历数据信息解析处理方法、装置、设备及存储介质 |
CN109345201A (zh) * | 2018-09-20 | 2019-02-15 | 成都辰语轩科技有限公司 | 人力资源管理方法、装置、电子设备及存储介质 |
CN109408746A (zh) * | 2018-09-26 | 2019-03-01 | 平安科技(深圳)有限公司 | 画像信息查询方法、装置、计算机设备和存储介质 |
CN109241446A (zh) * | 2018-10-17 | 2019-01-18 | 重庆聚焦人才服务有限公司 | 一种职位推荐方法及系统 |
CN109493199A (zh) * | 2019-01-04 | 2019-03-19 | 深圳壹账通智能科技有限公司 | 产品推荐方法、装置、计算机设备和存储介质 |
CN110335060A (zh) * | 2019-05-20 | 2019-10-15 | 微民保险代理有限公司 | 产品信息推送方法、装置、存储介质和计算机设备 |
CN110569340A (zh) * | 2019-07-24 | 2019-12-13 | 深圳壹账通智能科技有限公司 | 文本信息验证方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
周永章: "《地球科学大数据挖掘与机器学习》", 中山大学出版社, pages: 51 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814056A (zh) * | 2020-07-31 | 2020-10-23 | 平安金融管理学院(中国·深圳) | 基于信息处理的供应商推荐方法及相关设备 |
CN111898031A (zh) * | 2020-08-14 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 一种获得用户画像的方法及装置 |
CN111898031B (zh) * | 2020-08-14 | 2024-04-05 | 腾讯科技(深圳)有限公司 | 一种获得用户画像的方法及装置 |
CN112233740A (zh) * | 2020-09-28 | 2021-01-15 | 广州金域医学检验中心有限公司 | 患者身份识别方法、装置、设备和介质 |
CN112233740B (zh) * | 2020-09-28 | 2024-03-29 | 广州金域医学检验中心有限公司 | 患者身份识别方法、装置、设备和介质 |
CN112363773B (zh) * | 2020-10-23 | 2024-02-02 | 岭东核电有限公司 | 移动终端配置方法、装置、计算机设备和存储介质 |
CN112363773A (zh) * | 2020-10-23 | 2021-02-12 | 岭东核电有限公司 | 移动终端配置方法、装置、计算机设备和存储介质 |
CN112328849A (zh) * | 2020-11-02 | 2021-02-05 | 腾讯科技(深圳)有限公司 | 用户画像的构建方法、基于用户画像的对话方法及装置 |
CN112328849B (zh) * | 2020-11-02 | 2024-05-07 | 腾讯科技(深圳)有限公司 | 用户画像的构建方法、基于用户画像的对话方法及装置 |
CN112989037B (zh) * | 2021-02-05 | 2023-05-23 | 浙江连信科技有限公司 | 用于识别职业压力源的信息处理方法及装置 |
CN112989037A (zh) * | 2021-02-05 | 2021-06-18 | 浙江连信科技有限公司 | 用于识别职业压力源的信息处理方法及装置 |
CN113159497A (zh) * | 2021-02-25 | 2021-07-23 | 泰豪信息技术有限公司 | 监仓分配方法、系统、可读存储介质及计算机设备 |
CN113032441A (zh) * | 2021-03-24 | 2021-06-25 | 宁波莱博网络科技有限公司 | 一种基于大数据技术的用户画像分析系统 |
CN113641901A (zh) * | 2021-08-05 | 2021-11-12 | 腾讯科技(深圳)有限公司 | 资讯推荐方法、装置、计算机可读介质及电子设备 |
CN113641901B (zh) * | 2021-08-05 | 2024-02-02 | 腾讯科技(深圳)有限公司 | 资讯推荐方法、装置、计算机可读介质及电子设备 |
CN113627797A (zh) * | 2021-08-12 | 2021-11-09 | 深圳平安智汇企业信息管理有限公司 | 入职员工画像生成方法、装置、计算机设备及存储介质 |
CN113627797B (zh) * | 2021-08-12 | 2023-11-14 | 深圳平安智汇企业信息管理有限公司 | 入职员工画像生成方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111192025A (zh) | 职业信息匹配方法、装置、计算机设备和存储介质 | |
CN108874992B (zh) | 舆情分析方法、系统、计算机设备和存储介质 | |
CN108228873B (zh) | 对象推荐、发布内容推送方法、装置、存储介质和设备 | |
CN110457431B (zh) | 基于知识图谱的问答方法、装置、计算机设备和存储介质 | |
CN110427467B (zh) | 问答处理方法、装置、计算机设备和存储介质 | |
CN109815333B (zh) | 信息获取方法、装置、计算机设备和存储介质 | |
CN111061859B (zh) | 基于知识图谱的数据处理方法、装置和计算机设备 | |
CN109086394B (zh) | 搜索排序方法、装置、计算机设备和存储介质 | |
CN109063108B (zh) | 搜索排序方法、装置、计算机设备和存储介质 | |
CN108959644B (zh) | 搜索排序方法、装置、计算机设备和存储介质 | |
CN109582876B (zh) | 旅游行业用户画像构造方法、装置和计算机设备 | |
CN108804133B (zh) | 虚拟资源的获取方法、系统、计算机设备和存储介质 | |
CN108664582B (zh) | 企业关系的查询方法、装置、计算机设备及存储介质 | |
CN110166522B (zh) | 服务器识别方法、装置、可读存储介质和计算机设备 | |
CN112651236B (zh) | 提取文本信息的方法、装置、计算机设备和存储介质 | |
CN110888911A (zh) | 样本数据处理方法、装置、计算机设备及存储介质 | |
CN110880006A (zh) | 用户分类方法、装置、计算机设备和存储介质 | |
CN112434217A (zh) | 职位信息推荐方法、系统、计算机设备及存储介质 | |
CN114399396A (zh) | 保险产品推荐方法、装置、计算机设备及存储介质 | |
CN111177794B (zh) | 城市画像方法、装置、计算机设备和存储介质 | |
CN113704436A (zh) | 基于会话场景的用户画像标签挖掘方法及装置 | |
CN110555165B (zh) | 信息识别方法、装置、计算机设备和存储介质 | |
CN112035614A (zh) | 测试集生成方法、装置、计算机设备和存储介质 | |
CN110532229B (zh) | 证据文件检索方法、装置、计算机设备和存储介质 | |
CN109542962B (zh) | 数据处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |