CN108920544A - 一种基于知识图谱的个性化职位推荐方法 - Google Patents

一种基于知识图谱的个性化职位推荐方法 Download PDF

Info

Publication number
CN108920544A
CN108920544A CN201810609066.9A CN201810609066A CN108920544A CN 108920544 A CN108920544 A CN 108920544A CN 201810609066 A CN201810609066 A CN 201810609066A CN 108920544 A CN108920544 A CN 108920544A
Authority
CN
China
Prior art keywords
employment
knowledge
job
data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810609066.9A
Other languages
English (en)
Inventor
缪裕青
缪永进
刘同来
蔡国永
文益民
徐智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201810609066.9A priority Critical patent/CN108920544A/zh
Publication of CN108920544A publication Critical patent/CN108920544A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱的个性化职位推荐方法,包括:获取求职招聘领域数据,获取求职者的简历信息,对求职招聘领域数据进行规范化处理;之后进行知识抽取,融合,形成结构化的求职招聘领域知识;将获取的结构化的求职招聘领域知识存入图数据库,构建求职招聘领域知识图谱;构建基于知识图谱的个性化职位推荐模型;读取求职者的简历信息,基于上述知识图谱对简历信息中某些属性进行映射;基于上述知识图谱,根据上述职位推荐模型对职位按行业类别进行过滤,形成待推荐职位列表;针对待推荐职位列表,对简历信息和职位信息中的相应属性进行量化;计算简历信息和职位信息的相似度,筛选出与求职者简历相似度最高的前N个职位生成职位推荐列表,并推荐给求职者。

Description

一种基于知识图谱的个性化职位推荐方法
技术领域
本发明涉及一种基于知识图谱的个性化职位推荐方法,属于数据挖掘中推荐系统领域。
背景技术
互联网的普及和大数据时代的到来为网络招聘带来了得天独厚的优势和难得的机遇。网络招聘已成为求职者求职应聘的重要途径之一,但网络上发布职位的爆炸性增长,引发信息超载问题,使求职者难以在海量招聘职位中快速找到自己期望的职位。
传统的搜索引擎技术在解决信息超载问题方面发挥了重要作用,搜索引擎在本质上就是帮助用户过滤信息,快速获取所需的信息,但是不同用户在输入相同的关键词,最终的搜索结果都一样,缺乏个性。
求职者对网络招聘个性化服务需求不断提升,促使个性化职位推荐成为一个非常热门的研究领域,得到了深入研究,但是目前的个性化职位推荐没有考虑求职者的性格类型,推荐结果单一、缺乏多样性,不能满足求职者对职位的个性化需求。
目前,知识图谱在智能搜索、情报分析、反欺诈等应用中发挥了重要作用。随着大数据和人工智能的再次兴起,知识图谱又被广泛的应用于聊天机器人和智能问答系统中。在个性化推荐研究上,尽管知识图谱拥有强大语义处理能力和在信息检索方面快速的优势,能极大地提高搜索的效率和推荐的效果,在旅游、电影、书籍等推荐中得到了使用,但鲜有研究者将知识图谱与职位推荐相结合进行研究,目前还未见有将知识图谱和个性化推荐技术相结合职位推荐方法。
发明内容
本发明要解决的技术问题是提供一种基于知识图谱的个性化职位推荐方法,该方法将知识图谱和个性化推荐技术相结合,为求职者快速推荐职位。
本发明所述的基于知识图谱的个性化职位推荐方法,包括:
从互联网上公开数据中获取求职招聘领域数据,所述求职招聘领域数据包括职位信息及其它与求职招聘领域相关的数据;
获取求职者的简历信息,所述简历信息包括求职者的求职意向;
对收集的求职招聘领域数据进行规范化处理;
对规范化后形成的求职招聘领域数据进行知识抽取,包括实体及实体属性的抽取,关系及关系属性的抽取;
对知识抽取之后形成的求职招聘领域知识进行融合,将知识抽取得到的实体对象正确链接到相应实体上,形成结构化的求职招聘领域知识;
将结构化的求职招聘领域知识存入图数据库,通过自顶向下的手工方式构建求职招聘领域知识图谱;
构建基于知识图谱的个性化职位推荐模型,包括简历模型和职位模型;对简历模型和职位模型中的相应属性制订量化规则;
读取求职者的简历信息,基于求职招聘领域知识图谱对简历信息中某些属性进行映射;
基于求职招聘领域知识图谱,根据基于知识图谱的个性化职位推荐模型对职位按行业类别进行过滤,形成待推荐职位列表;
针对待推荐职位列表,根据前述量化规则对简历信息和职位信息中的相应属性进行量化;
计算简历信息和职位信息的相似度,筛选出与求职者简历相似度最高的前N个职位生成职位推荐列表,并推荐给求职者。
上述方法中,可以先通过构建一个包括需要由求职者完成测评试题的性格测评系统来获取包括求职者性格类别的简历信息。
上述方法中,对收集的求职招聘领域数据进行规范化处理包括删除重复数据、补全缺失数据、纠正错位数据、对不便于相似度计算的数据进行格式转换和数据分类。
上述方法中,在完成实体及实体属性的抽取之后,使用基于模式匹配的方法,通过自顶向下的手工构建的方式获取语义信息,抽取出实体之间规范的三元组语义关系。
与现有技术相比,本发明的特点在于:
1、通过构建求职招聘领域知识图谱,发挥知识图谱拥有的强大语义处理能力和在信息检索方面快速的优势,极大地提高了搜索的效率和推荐的效果。
2、通过在个性化推荐过程中增加求职者的性格类型,提高了推荐结果的准确性和多样性。
3、通过将知识图谱和个性化推荐技术相结合,基于求职招聘领域知识图谱为求职者推荐的职位更加符合求职者的个性,满足了求职者对职位的个性化需求。
附图说明
图1为本发明所述方法的流程示意图;
图2为本发明实施例1中性格测评系统的功能模块图;
图3为本发明实施例1中采用性格测评系统进行性格测评的流程图;
图4为本发明实施例1中职位分类框架图;
图5为本发明实施例1中构建求职招聘领域知识图谱的流程。
具体实施方式
下面结合具体实施例对本发明作进一步的详述,以更好地理解本发明的内容,但本发明并不限于以下实施例。
实施例1
本发明所述的基于知识图谱的个性化职位推荐方法的流程图如图1所示,包括以下步骤:
步骤101,从互联网上公开数据中获取求职招聘领域数据,所述求职招聘领域数据包括职位信息及其它与求职招聘领域相关的数据。
具体是通过网络爬虫从互联网上爬取职位信息,如采用免费网络爬虫软件——八爪鱼网页数据采集器,从智联招聘、前程无忧、中华英才网等大型专业招聘网站公开的数据中有选择地爬取职位信息,具体包括性别要求、年龄要求、学历要求、所属行业类别、工作经验要求、、月薪、工作地点等信息。所述其它与求职招聘相关的数据,如行业类别、专业类别、性格类别等数据,因数据量比较小,可直接通过人工从互联网进行搜集整理。
步骤102,获取求职者的简历信息,所述简历信息包括求职者的求职意向。
通过构建一个包括需要由求职者完成测评试题的性格测评系统来获取包括求职者性格类别的简历信息。该性格测评系统由测试模块、信息完善模块和测评报告生成模块构成,其功能模块构成如图2所示。系统的测试模块由选择题构成,由求职者选择完成,为系统分析求职者的性格提供依据。信息完善模块用于获取求职者与自己求职意向有关的信息,如:性别、年龄、学历、所学专业、工作经验、期望月薪、期望工作地点等等,仅供推荐个性化职位用。本系统不收集其它诸如姓名、家庭住址、电话号码等类涉及个人隐私的信息。测评报告生成模块用于对求职者作答测试题的情况进行汇总分析,对照测试评价参考信息生成性格测评报告通过浏览器展示给求职者,同时将相应的测评结果数据进行保存(存入数据库)。性格测评流程如图3所示。
步骤103,对收集的求职招聘领域数据进行规范化处理。
前述收集的原始数据无法直接用来构建求职招聘领域知识图谱,因为职位数据来自于不同的平台,存在大量的数据缺失、数据错位以及数据重复等问题,在知识抽取之前必须先对获取的原始数据进行规范化处理,这是构建求职招聘领域知识图谱的基础。
所述对收集的求职招聘领域数据进行规范化处理主要包括以下几个方面:
1)删除重复数据。因为招聘者会不定期的在同一平台发布相同的招聘职位,因此爬取的数据会存在一定量的重复数据,需要进行去重处理。
2)处理缺失数据。由于不同平台要求用户提供的数据不一致,导致收集的职位数据不完整,存在缺失,此时需要对缺失的数据进行补充。如:有些招聘单位发布的职位信息没有包含对经验的要求,那么该属性就可以用“工作经验不限”或“无工作经验要求”来填充,以保证数据的完整性。
3)处理错位数据。在数据整理的过程中发现爬取到的数据属性与数据表中的属性值不对应(如爬取到的数据属性是工作地点,但在数据表中存储的却是年龄),造成数据属性和属性值不一致,发生错位,对于这种情况,需要进行调整,确保属性和属性值对应。
4)数据格式转换。对获取的不便于相似度计算的数据进行必要的格式转换,如招聘职位中“年龄要求”,有的表述为“不超过30岁”,有的表述为“22-28岁”,造成很难用一种格式表述,所以在处理的时候将年龄要求转换为两个属性:最低年龄和最高年龄,从而将年龄转换为一个范围值,然后采用公式1的方法进行归一化处理和量化。
公式1中v表示年龄的量化值,Ymax表示某个简历或职位中年龄允许的最大值,Ymin表示某个简历或职位中年龄允许的最小值,Umax表示年龄默认的最大值(如60),Umin表示年龄默认的最小值(如18)。
5)数据分类。获取的数据尤其是职位数据,职位名称五花八门,不能反映职位的行业类别,为了便于知识图谱的构建,需要对获取的简历信息和职位数据按行业类别进行分类。对于简历信息主要依据专业类别进行划分,职位数据主要依据职位描述的内容进行划分。专业类别与行业类别,及职位类别与行业类别的对应关系依据《国家统计局行业分类标准》,结合《普通高等学校本科专业目录》和《普通高等学校高职高专(专科)专业目录》,并参考智联招聘、前程无忧等网站的行业分类进行确定。
专业类别的数量有限,通过人工进行处理。对于职位数据因数量大,需要通过机器学习的方法对职位数据按照职位描述的内容进行职位的行业分类。鉴于朴素贝叶斯文本分类方法简单高效,易于实现,在多分类问题上的能取得较好效果,本申请采用朴素贝叶斯分类算法对职位根据职位描述的文本内容按行业进行分类。
①朴素贝叶斯分类算法的基本原理
朴素贝叶斯分类算法是一种概率模型,它基于贝叶斯定理和特征条件独立假设。算法思想是:对于特定的待分类项S,求S出现的条件下各个类别Rk出现的概率,将S归入P(Rk|S)值最大的那个类别。
朴素贝叶斯分类算法定义如下:
Ⅰ、假设类别集合C=(R1,R2,…,Ri,…,Rm);
Ⅱ、假设待分类项S=(s1,s2,…,sj,…,sn),sj是S的第j个特征项,且S的各个特征项相互独立,即:
Ⅲ、分别计算P(R1|S),P(R2|S),…,P(Rm|S),计算方法如下:
P(Rk|S)=P(S|Rk)P(Rk)/P(S);
Ⅳ、若P(Rk|S)=max{P(R1|S),P(R2|S),…,P(Rm|S)},那么S属于类别Rk
②职位分类框架如图4所示,职位分类的具体实施步骤如下:
Step 1文本标注。从获取的职位数据中挑选一定量的职位数据按行业类别进行标注,并把这些已标注的数据按一定比例划分为训练集和测试集。
Step 2文本提取。将训练集和测试集中每一个职位数据的职位描述属性的文本提取出来保存为一个文本文件,按行业类别名建立文件夹来保存相应类别的文本文件,文件夹名即为该类职位描述文本文件的标签。将训练集和测试集文本文件分开存放。
Step 3文本处理。对训练集和测试集中职位描述文本使用中文分词工具Jieba进行分词并进行去除停用词处理,保存为相应的文本文件,形成真正的训练文本集和测试文本集。
Step 4生成文本向量。根据训练文本集生成词袋模型(包含训练文本集中所有文本中出现的所有词),将训练文本集中所有文本统一到一个词向量空间中,将训练集文本中的每一个文本文件按照词袋模型转换为词向量,词向量的长度为词袋模型的长度,从而将训练文本集转换为训练文本词向量集。将测试文本也按该词袋模型转换为测试文本词向量集。
Step 5词向量转换。计算训练文本词向量集和测试文本词向量集中每个词向量中各特征词的TF-IDF值,计算方法如公式2。将训练文本集和测试文本集的数据映射到TF-IDF词向量空间,并构造TF-IDF词向量矩阵。
vi,j=tfi,j×idfi (公式2)
公式2中vi,j表示TF-IDF值,tfi,j表示词频,指某个词在项目中出现的频率,代表该词在项目中的重要程度,计算方法如公式3。idfi,j表示逆文档频率,是衡量一个词语在文档中重要程度的量,计算方法如公式4。
公式3中ni,j是第i个特征词在项目j中的出现次数,分母表示该项目中所有特征词出现的次数之和。
idfi=1og(D/Dw) (公式4)
公式4中D为项目总数,Dw为特征词出现过的项目数。为了防止分母为0,一般使用(1+Dw)作为分母。
Step 6特征提取。利用TF-IDF过滤掉常见词,保留区分度高的重要特征词。
Step7训练朴素贝叶斯分类器,进行分类。这里采用的分类器是Python的科学计算库Scikit-learn封装好的函数MultinomialNB,获取训练集的词向量矩阵和标签进行训练,训练完成后获取测试集的词向量矩阵,对测试集进行分类,给出分类标签。
步骤104,对规范化后形成的求职招聘领域数据进行知识抽取,包括实体及实体属性的抽取,关系及关系属性的抽取。
(1)实体及实体属性的抽取:
原始数据经前述规范化处理后,得到规范的职位、简历、行业类别、专业类别、性格类型等求职招聘领域知识。这些求职招聘领域知识具有极为丰富的语义,领域知识的特征通过知识属性的特征体现出来,而属性之间又存在语义关系,这有利于对求职招聘领域知识进行抽取。
求职招聘领域数据,经过规范化处理后已经是较为规范的结构化知识,可以直接从中抽取出规范的实体如:职位、简历、行业类别、专业类别、性格类型等。经实体抽取之后,就得到了命名实体,进一步可从中抽取出实体所具有的属性。
(2)关系及关系属性抽取:
从求职招聘领域知识中抽取出的实体比较规范,而且实体类别的数量不大,因此一旦抽取得到了规范的命名实体,就可以使用基于模式匹配的方法,通过自顶向下的手工构建的方式获取语义信息,抽取出实体之间规范的三元组语义关系,如<职位,需要,行业>,<简历,学习,专业>,<专业,属于,行业>,<简历,具有,性格类型>等,进一步可抽取出关系所具有的属性。
步骤105,对知识抽取之后形成的求职招聘领域知识进行知识融合,将知识抽取得到的实体对象正确链接到相应实体上,形成结构化的求职招聘领域知识;
经过知识抽取之后,虽然已经得到了规范的实体、实体间关系、以及实体和关系具有的属性等知识,但是这些知识还不能直接用来构建知识图谱,因为这些知识中还包括大量的冗余信息和错误信息,必须对这些数据进行清理和整合,即对知识抽取之后形成的求职招聘领域知识进行融合。本申请中所述的融合涉及的内容主要是实体链接,即将知识抽取得到的实体对象正确链接到相应实体上的操作。同一个实体对象在不同的场景下可能会对应不同的实体对象,实体链接就是要解决自然语言中普遍存在的一词多义问题,实体链接的过程就是一个消除歧义的过程。实体链接主要解决两个问题:实体消岐和共指消解。
实体消岐主要解决同名实体产生歧义的问题。如:对于“英语”这个专业实体,可以对应商务方向的“英语”实体,也可以对应旅游方向的“英语”实体,还可以对应教育方向的“英语”实体,究竟对应哪个实体,就需要通过实体消岐解决,消岐的思想就是根据实体名字出现的语境,分析不同实体在此处可能出现的概率。如在某职位中出现了“英语”,那么可根据该职位对应的职位描述的内容进行分析判断,如果职位描述中出现较多与教育相关的信息,那将它链接到教育方向的“英语”,如果出现较多与商务有关的内容,则可链接到商务方向的“英语”。
共指消解主要解决多个名称对应同一实体对象的问题。如:求职者简历中所学专业“计算机应用”、“计算机技术”、“计算机应用和维护”、“计算机应用及控制”等都应指高校专业目录中的“计算机应用技术”,需要将这些名称链接到正确的实体对象。
前述步骤103-105可统称为知识获取步骤。
步骤106,将结构化的求职招聘领域知识存入图数据库(即知识存储),通过自顶向下的手工方式构建求职招聘领域知识图谱。
原始数据经过知识抽取和融合之后,就形成了结构化的求职招聘领域知识,存入图数据库之后即可以用来构建求职招聘领域知识图谱。图数据库实现了图中节点、边以及属性等图数据的存储,具体可以采用Neo4j图数据库,把实体定义为节点,实体间的关系定义为连接节点的边,将结构化的求职招聘领域知识存储在网络上形成知识图谱。
对于知识图谱的绘制和使用,分别如下:
将知识抽取和融合后形成的结构化的求职招聘领域知识存储成csv格式的文件,借助Cypher语言的LOAD CSV语句采用批量方式或者通过REST API接口导入Neo4j图数据库中保存。
知识图谱是一个具有强大语义处理能力的知识库。结构化的求职招聘领域知识成功存入Neo4j图数据库后,便可以通过图数据库查询语言Cypher的相关语句对图数据库执行查询、添加、修改和删除等操作,以及进行知识图谱的绘制和使用。整个构建求职招聘领域知识图谱的流程如图5所示。
步骤107,构建基于知识图谱的个性化职位推荐模型,包括简历模型和职位模型;对简历模型和职位模型中的相应属性制订量化规则。
(1)构建基于知识图谱的个性化职位推荐模型
为了能够为求职者推荐尽可能个性化的职位,针对简历和职位分别进行建模,具体方案如下:
表1和表2分别展示了个性化职位推荐模型的简历模型和职位模型:
表1简历模型
表2职位模型
由表1和表2可以看出,简历模型和职位模型均由不可直接数值化分量和可直接数值化分量组成,二者的特征分量在名称上有所不同,但本质含义是一致的,二者的特征分量存在对应关系,从而可以建立简历到职位之间的映射关系,为每个简历和职位生成一个向量,该向量的各个分量对应简历模型和职位模型的每一个属性;所有向量构成一个向量集。上述向量形式化如下:
简历向量集记为:Q(Q1,Q2,…,Qi,…,Qm);
职位向量集记为:P(P1,P2,…,Pk,…,Pn);
第i个简历向量记为:Qi<q1,q2,…,q9>;
第k个职位向量记为:Pk<p1,p2,…,p9>;
在此基础上对向量集中各分量进行量化,计算简历和职位之间的相似度。
(2)制订量化规则。
1)不可直接数值化分量的量化
对于不可直接数值化分量区分两种情况:参与相似度计算的分量和不参与相似度计算的分量。
对于不参与相似度计算的分量不进行量化,如所学专业,性格类别,而是基于求职招聘领域知识图谱将他们映射成职位行业类别,在进行个性化职位推荐时用于对职位进行过滤,减少相似度计算的量,加快简历和职位匹配的速度,提高推荐的效率。
对于参与相似度计算的分量,如期望职位和职位名称,采用前述职位分类方法中Step 3-Step 5的方法,对文本借助中文分词工具进行分词、去除停用词,建立向量空间模型计算向量空间中每个词的TF-IDF值,将不可直接数值化分量数值化并作归一化处理。
2)可直接数值化分量的量化
对简历模型向量和职位模型向量中可直接数值化分量逐一进行量化,各分量的取值范围在0到1之间,按分量值的不同设定相应的量化值。如对工作经验的量化如下述表3所示:
表3工作经验量化表
又如:对工作地点,将简历中期望的工作地点和职位中的工作地点映射成行政区划代码表示,通过行政区划代码进行匹配,若前2位相同则认为是同省,前4位相同则视为同城,否则视为跨省。工作地点的量化如下述表4所示:
表4工作地点量化表
步骤108,读取求职者的简历信息,基于求职招聘领域知识图谱对简历信息中的所学专业和性格类型均映射成职位行业类别。
步骤109,基于求职招聘领域知识图谱,根据基于知识图谱的个性化职位推荐模型对职位按行业类别进行过滤,形成待推荐职位列表。
步骤110,针对待推荐职位列表,根据前述量化规则对简历信息和职位信息中的相应属性进行量化。
步骤111,计算简历信息和职位信息的相似度,筛选出与求职者简历相似度最高的前N个职位生成职位推荐列表,并推荐给求职者。
相似度计算主要是计算前述可直接数值化分量和参与相似度计算的不可直接数值化分量量化后的相似度。
下面展示了利用欧氏距离计算简历模型向量Q和职位模型向量P之间的相似度,计算方法如公式5。计算结果值越小表示相似度越高。
具体计算方法:对于简历特征qi,当qi-pi>=0时取di=qi-pi,否则di=qi-pi=∞。
式中d(Q,P)表示简历向量Q和职位向量P的相似度,Q=[q1,q2,…,qi,…,qn]代表简历向量,qi代表简历向量的各个分量,P=[p1,p2,…,pi,…,pn]代表职位向量,pi代表职位向量的各个分量。计算出的d(Q,P)值越接近0,说明简历向量和职位向量越相似。

Claims (3)

1.一种基于知识图谱的个性化职位推荐方法,其特征在于:包括:
从互联网上公开数据中获取求职招聘领域数据,所述求职招聘领域数据包括职位信息及其它与求职招聘领域相关的数据;
获取求职者的简历信息,所述简历信息包括求职者的求职意向;
对收集的求职招聘领域数据进行规范化处理;
对规范化后形成的求职招聘领域数据进行知识抽取,包括实体及实体属性的抽取,关系及关系属性的抽取;
对知识抽取之后形成的求职招聘领域知识进行融合,将知识抽取得到的实体对象正确链接到相应实体上,形成结构化的求职招聘领域知识;
将结构化的求职招聘领域知识存入图数据库,通过自顶向下的手工方式构建求职招聘领域知识图谱;
构建基于知识图谱的个性化职位推荐模型,包括简历模型和职位模型;对简历模型和职位模型中的相应属性制订量化规则;
读取求职者的简历信息,基于求职招聘领域知识图谱对简历信息中某些属性进行映射;
基于求职招聘领域知识图谱,根据基于知识图谱的个性化职位推荐模型对职位按行业类别进行过滤,形成待推荐职位列表;
针对待推荐职位列表,根据前述量化规则对简历信息和职位信息中的相应属性进行量化;
计算简历信息和职位信息的相似度,筛选出与求职者简历相似度最高的前N个职位生成职位推荐列表,并推荐给求职者。
2.根据权利要求1所述的基于知识图谱的个性化职位推荐方法,其特征在于:通过构建一个包括需要由求职者完成测评试题性格的测评系统来获取包括求职者性格类别的简历信息。
3.根据权利要求1所述的基于知识图谱的个性化职位推荐方法,其特征在于:对收集的求职招聘领域数据进行规范化处理包括删除重复数据、补全缺失数据、纠正错位数据、对不便于相似度计算的数据进行格式转换和数据分类。
CN201810609066.9A 2018-06-13 2018-06-13 一种基于知识图谱的个性化职位推荐方法 Pending CN108920544A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810609066.9A CN108920544A (zh) 2018-06-13 2018-06-13 一种基于知识图谱的个性化职位推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810609066.9A CN108920544A (zh) 2018-06-13 2018-06-13 一种基于知识图谱的个性化职位推荐方法

Publications (1)

Publication Number Publication Date
CN108920544A true CN108920544A (zh) 2018-11-30

Family

ID=64420633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810609066.9A Pending CN108920544A (zh) 2018-06-13 2018-06-13 一种基于知识图谱的个性化职位推荐方法

Country Status (1)

Country Link
CN (1) CN108920544A (zh)

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684441A (zh) * 2018-12-21 2019-04-26 义橙网络科技(上海)有限公司 对职位和简历进行匹配的方法、系统、设备和介质
CN109918483A (zh) * 2019-03-15 2019-06-21 智者四海(北京)技术有限公司 匹配招聘职位与求职简历的装置和方法
CN109978510A (zh) * 2019-04-02 2019-07-05 北京网聘咨询有限公司 校园招聘管理系统及方法
CN110019689A (zh) * 2019-04-17 2019-07-16 北京网聘咨询有限公司 职位匹配方法和职位匹配系统
CN110032681A (zh) * 2019-04-17 2019-07-19 北京网聘咨询有限公司 基于简历内容的职位推荐方法
CN110191096A (zh) * 2019-04-30 2019-08-30 安徽工业大学 一种基于语义分析的词向量网页入侵检测方法
CN110196943A (zh) * 2019-04-22 2019-09-03 苏州同者信息科技有限公司 一种职位智能推荐系方法及其系统
CN110321446A (zh) * 2019-07-08 2019-10-11 深圳市华云中盛科技有限公司 相关数据推荐方法、装置、计算机设备及存储介质
CN110443571A (zh) * 2019-07-16 2019-11-12 阿里巴巴集团控股有限公司 基于知识图谱进行简历评估的方法、装置及设备
CN110633960A (zh) * 2019-09-25 2019-12-31 重庆市重点产业人力资源服务有限公司 一种基于大数据的人力资源智能匹配、推荐的方法
CN110895755A (zh) * 2019-11-25 2020-03-20 上海沃锐企业发展有限公司 职位匹配方法以及装置、设备、存储介质
CN111091454A (zh) * 2019-11-05 2020-05-01 新华智云科技有限公司 一种基于知识图谱的金融舆情推荐方法
CN111177283A (zh) * 2019-12-31 2020-05-19 广东轩辕网络科技股份有限公司 一种基于强化学习的智能人事模型构建方法及装置
CN111192024A (zh) * 2019-12-31 2020-05-22 广东轩辕网络科技股份有限公司 一种基于强化学习的人岗匹配方法及装置
CN111241361A (zh) * 2020-01-09 2020-06-05 福州数据技术研究院有限公司 基于云平台的企业与高校的智能引荐系统及方法
CN111242565A (zh) * 2019-12-31 2020-06-05 广州轩辕研究院有限公司 一种基于智能人事模型的简历优化方法及装置
CN111460174A (zh) * 2020-04-03 2020-07-28 中国建设银行股份有限公司 基于实体知识推理的简历异常检测方法及系统
CN111488472A (zh) * 2020-04-09 2020-08-04 河北利至人力资源服务有限公司 一种图数据处理方法及系统
CN111737486A (zh) * 2020-05-28 2020-10-02 广东轩辕网络科技股份有限公司 基于知识图谱、深度学习的人岗匹配方法、存储装置
CN111737485A (zh) * 2020-05-28 2020-10-02 广东轩辕网络科技股份有限公司 基于知识图谱、深度学习的人岗匹配方法、人岗匹配系统
CN111754109A (zh) * 2020-06-23 2020-10-09 重庆电子工程职业学院 一种毕业生就业管理系统
CN111861268A (zh) * 2020-07-31 2020-10-30 平安金融管理学院(中国·深圳) 候选人推荐方法、装置、电子设备及存储介质
CN112084320A (zh) * 2019-06-14 2020-12-15 百度在线网络技术(北京)有限公司 一种试题推荐方法、装置和智能设备
CN112100492A (zh) * 2020-09-11 2020-12-18 河北冀联人力资源服务集团有限公司 一种不同版本的简历的批量投递方法和系统
CN112100999A (zh) * 2020-09-11 2020-12-18 河北冀联人力资源服务集团有限公司 一种简历文本相似度匹配方法和系统
CN112132536A (zh) * 2020-08-31 2020-12-25 三盟科技股份有限公司 一种岗位推荐方法、系统、计算机设备及存储介质
CN112287109A (zh) * 2020-10-29 2021-01-29 北京希瑞亚斯科技有限公司 信息匹配方法、装置、电子设备及计算机可读存储介质
CN112308535A (zh) * 2020-11-26 2021-02-02 上海松鼠课堂人工智能科技有限公司 基于知识图谱的岗位选择评估推荐方法及系统
CN112395508A (zh) * 2020-12-25 2021-02-23 东北电力大学 一种人工智能人才职位推荐系统及其处理方法
CN112417165A (zh) * 2020-11-18 2021-02-26 杭州电子科技大学 一种生涯规划知识图谱构建及查询方法和系统
CN112561644A (zh) * 2020-12-16 2021-03-26 深圳市网联安瑞网络科技有限公司 基于链接预测的商品推荐方法、装置及相关设备
CN112800243A (zh) * 2021-02-04 2021-05-14 天津德尔塔科技有限公司 一种基于知识图谱的项目预算分析方法及系统
CN112883198A (zh) * 2021-02-24 2021-06-01 广州视源电子科技股份有限公司 一种知识图谱构建方法、装置、存储介质以及计算机设备
CN113220390A (zh) * 2021-04-20 2021-08-06 北京城市网邻信息技术有限公司 信息显示方法、装置、电子设备及存储介质
CN113240400A (zh) * 2021-06-02 2021-08-10 北京金山数字娱乐科技有限公司 一种基于知识图谱的候选人确定方法及装置
CN113268560A (zh) * 2020-02-17 2021-08-17 北京沃东天骏信息技术有限公司 用于文本匹配的方法和装置
CN114691892A (zh) * 2022-04-21 2022-07-01 君之福(北京)科技有限公司 一种基于大数据的退役军人职业规划方法及系统
CN115098791A (zh) * 2022-08-24 2022-09-23 中建电子商务有限责任公司 一种实时岗位推荐方法和系统
CN117056458A (zh) * 2023-08-04 2023-11-14 北京网聘信息技术有限公司 基于向量空间算法进行前端检索的方法
CN117171428A (zh) * 2023-08-04 2023-12-05 北京网聘信息技术有限公司 一种提升搜索和推荐结果准确性的方法
CN117196556A (zh) * 2023-09-19 2023-12-08 江苏锡世科技有限公司 一种基于大数据的多平台招聘信息管理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708525A (zh) * 2012-05-22 2012-10-03 华南理工大学 基于gpu加速的招聘职位智能推荐方法
CN104834668A (zh) * 2015-03-13 2015-08-12 浙江奇道网络科技有限公司 基于知识库的职位推荐系统
CN105893641A (zh) * 2016-07-01 2016-08-24 中国传媒大学 一种职位推荐方法
CN108021673A (zh) * 2017-12-06 2018-05-11 北京拉勾科技有限公司 一种用户兴趣模型生成方法、职位推荐方法及计算设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708525A (zh) * 2012-05-22 2012-10-03 华南理工大学 基于gpu加速的招聘职位智能推荐方法
CN104834668A (zh) * 2015-03-13 2015-08-12 浙江奇道网络科技有限公司 基于知识库的职位推荐系统
CN105893641A (zh) * 2016-07-01 2016-08-24 中国传媒大学 一种职位推荐方法
CN108021673A (zh) * 2017-12-06 2018-05-11 北京拉勾科技有限公司 一种用户兴趣模型生成方法、职位推荐方法及计算设备

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684441A (zh) * 2018-12-21 2019-04-26 义橙网络科技(上海)有限公司 对职位和简历进行匹配的方法、系统、设备和介质
CN109918483A (zh) * 2019-03-15 2019-06-21 智者四海(北京)技术有限公司 匹配招聘职位与求职简历的装置和方法
CN109918483B (zh) * 2019-03-15 2021-07-16 智者四海(北京)技术有限公司 匹配招聘职位与求职简历的装置和方法
CN109978510A (zh) * 2019-04-02 2019-07-05 北京网聘咨询有限公司 校园招聘管理系统及方法
CN110019689A (zh) * 2019-04-17 2019-07-16 北京网聘咨询有限公司 职位匹配方法和职位匹配系统
CN110032681A (zh) * 2019-04-17 2019-07-19 北京网聘咨询有限公司 基于简历内容的职位推荐方法
CN110196943A (zh) * 2019-04-22 2019-09-03 苏州同者信息科技有限公司 一种职位智能推荐系方法及其系统
CN110191096A (zh) * 2019-04-30 2019-08-30 安徽工业大学 一种基于语义分析的词向量网页入侵检测方法
CN110191096B (zh) * 2019-04-30 2023-05-09 安徽工业大学 一种基于语义分析的词向量网页入侵检测方法
CN112084320A (zh) * 2019-06-14 2020-12-15 百度在线网络技术(北京)有限公司 一种试题推荐方法、装置和智能设备
CN112084320B (zh) * 2019-06-14 2023-09-15 百度在线网络技术(北京)有限公司 一种试题推荐方法、装置和智能设备
CN110321446A (zh) * 2019-07-08 2019-10-11 深圳市华云中盛科技有限公司 相关数据推荐方法、装置、计算机设备及存储介质
CN110321446B (zh) * 2019-07-08 2021-09-14 深圳市华云中盛科技股份有限公司 相关数据推荐方法、装置、计算机设备及存储介质
CN110443571A (zh) * 2019-07-16 2019-11-12 阿里巴巴集团控股有限公司 基于知识图谱进行简历评估的方法、装置及设备
CN110633960A (zh) * 2019-09-25 2019-12-31 重庆市重点产业人力资源服务有限公司 一种基于大数据的人力资源智能匹配、推荐的方法
CN111091454A (zh) * 2019-11-05 2020-05-01 新华智云科技有限公司 一种基于知识图谱的金融舆情推荐方法
CN110895755A (zh) * 2019-11-25 2020-03-20 上海沃锐企业发展有限公司 职位匹配方法以及装置、设备、存储介质
CN111242565A (zh) * 2019-12-31 2020-06-05 广州轩辕研究院有限公司 一种基于智能人事模型的简历优化方法及装置
CN111192024A (zh) * 2019-12-31 2020-05-22 广东轩辕网络科技股份有限公司 一种基于强化学习的人岗匹配方法及装置
CN111177283A (zh) * 2019-12-31 2020-05-19 广东轩辕网络科技股份有限公司 一种基于强化学习的智能人事模型构建方法及装置
CN111241361A (zh) * 2020-01-09 2020-06-05 福州数据技术研究院有限公司 基于云平台的企业与高校的智能引荐系统及方法
CN113268560A (zh) * 2020-02-17 2021-08-17 北京沃东天骏信息技术有限公司 用于文本匹配的方法和装置
CN111460174A (zh) * 2020-04-03 2020-07-28 中国建设银行股份有限公司 基于实体知识推理的简历异常检测方法及系统
CN111488472A (zh) * 2020-04-09 2020-08-04 河北利至人力资源服务有限公司 一种图数据处理方法及系统
CN111488472B (zh) * 2020-04-09 2021-07-20 河北利至人力资源服务有限公司 一种图数据处理方法及系统
CN111737485A (zh) * 2020-05-28 2020-10-02 广东轩辕网络科技股份有限公司 基于知识图谱、深度学习的人岗匹配方法、人岗匹配系统
CN111737486A (zh) * 2020-05-28 2020-10-02 广东轩辕网络科技股份有限公司 基于知识图谱、深度学习的人岗匹配方法、存储装置
CN111737486B (zh) * 2020-05-28 2023-06-02 广东轩辕网络科技股份有限公司 基于知识图谱、深度学习的人岗匹配方法、存储装置
CN111754109A (zh) * 2020-06-23 2020-10-09 重庆电子工程职业学院 一种毕业生就业管理系统
CN111861268A (zh) * 2020-07-31 2020-10-30 平安金融管理学院(中国·深圳) 候选人推荐方法、装置、电子设备及存储介质
CN112132536A (zh) * 2020-08-31 2020-12-25 三盟科技股份有限公司 一种岗位推荐方法、系统、计算机设备及存储介质
CN112100492A (zh) * 2020-09-11 2020-12-18 河北冀联人力资源服务集团有限公司 一种不同版本的简历的批量投递方法和系统
CN112100999A (zh) * 2020-09-11 2020-12-18 河北冀联人力资源服务集团有限公司 一种简历文本相似度匹配方法和系统
CN112287109A (zh) * 2020-10-29 2021-01-29 北京希瑞亚斯科技有限公司 信息匹配方法、装置、电子设备及计算机可读存储介质
CN112417165A (zh) * 2020-11-18 2021-02-26 杭州电子科技大学 一种生涯规划知识图谱构建及查询方法和系统
CN112308535A (zh) * 2020-11-26 2021-02-02 上海松鼠课堂人工智能科技有限公司 基于知识图谱的岗位选择评估推荐方法及系统
CN112561644A (zh) * 2020-12-16 2021-03-26 深圳市网联安瑞网络科技有限公司 基于链接预测的商品推荐方法、装置及相关设备
CN112561644B (zh) * 2020-12-16 2023-08-01 深圳市网联安瑞网络科技有限公司 基于链接预测的商品推荐方法、装置及相关设备
CN112395508B (zh) * 2020-12-25 2024-03-29 东北电力大学 一种人工智能人才职位推荐系统及其处理方法
CN112395508A (zh) * 2020-12-25 2021-02-23 东北电力大学 一种人工智能人才职位推荐系统及其处理方法
CN112800243A (zh) * 2021-02-04 2021-05-14 天津德尔塔科技有限公司 一种基于知识图谱的项目预算分析方法及系统
CN112883198A (zh) * 2021-02-24 2021-06-01 广州视源电子科技股份有限公司 一种知识图谱构建方法、装置、存储介质以及计算机设备
CN112883198B (zh) * 2021-02-24 2024-05-24 广州视源电子科技股份有限公司 一种知识图谱构建方法、装置、存储介质以及计算机设备
CN113220390A (zh) * 2021-04-20 2021-08-06 北京城市网邻信息技术有限公司 信息显示方法、装置、电子设备及存储介质
CN113240400A (zh) * 2021-06-02 2021-08-10 北京金山数字娱乐科技有限公司 一种基于知识图谱的候选人确定方法及装置
CN114691892A (zh) * 2022-04-21 2022-07-01 君之福(北京)科技有限公司 一种基于大数据的退役军人职业规划方法及系统
CN115098791B (zh) * 2022-08-24 2023-01-10 中建电子商务有限责任公司 一种实时岗位推荐方法和系统
CN115098791A (zh) * 2022-08-24 2022-09-23 中建电子商务有限责任公司 一种实时岗位推荐方法和系统
CN117056458A (zh) * 2023-08-04 2023-11-14 北京网聘信息技术有限公司 基于向量空间算法进行前端检索的方法
CN117171428A (zh) * 2023-08-04 2023-12-05 北京网聘信息技术有限公司 一种提升搜索和推荐结果准确性的方法
CN117171428B (zh) * 2023-08-04 2024-04-05 北京网聘信息技术有限公司 一种提升搜索和推荐结果准确性的方法
CN117056458B (zh) * 2023-08-04 2024-04-19 北京网聘信息技术有限公司 基于向量空间算法进行前端检索的方法
CN117196556A (zh) * 2023-09-19 2023-12-08 江苏锡世科技有限公司 一种基于大数据的多平台招聘信息管理系统及方法
CN117196556B (zh) * 2023-09-19 2024-02-23 江苏锡世科技有限公司 一种基于大数据的多平台招聘信息管理系统及方法

Similar Documents

Publication Publication Date Title
CN108920544A (zh) 一种基于知识图谱的个性化职位推荐方法
CN108492200B (zh) 一种基于卷积神经网络的用户属性推断方法和装置
CN110795619B (zh) 一种融合多目标的教育资源个性化推荐系统及方法
CN109446331B (zh) 一种文本情绪分类模型建立方法及文本情绪分类方法
CN106021364A (zh) 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN108182295A (zh) 一种企业知识图谱属性抽取方法及系统
CN110516085A (zh) 基于双向注意力的图像文本互检索方法
CN110532379B (zh) 一种基于lstm的用户评论情感分析的电子资讯推荐方法
CN111709575A (zh) 基于c-lstm的学业成绩预测方法
CN105931116A (zh) 基于深度学习机制的自动化信用评分系统及方法
CN109753602A (zh) 一种基于机器学习的跨社交网络用户身份识别方法和系统
CN111737485A (zh) 基于知识图谱、深度学习的人岗匹配方法、人岗匹配系统
CN108363748B (zh) 基于知乎的话题画像系统及话题画像方法
CN115599899B (zh) 基于飞行器知识图谱的智能问答方法、系统、设备及介质
CN113673943A (zh) 一种基于履历大数据的人员任免辅助决策方法及系统
CN109949174A (zh) 一种异构社交网络用户实体锚链接识别方法
CN115526236A (zh) 一种基于多模态对比学习的文本网络图分类方法
CN113239159A (zh) 基于关系推理网络的视频和文本的跨模态检索方法
CN111191099A (zh) 一种基于社交媒体的用户活动类型识别方法
CN112115971A (zh) 一种基于异质学术网络进行学者画像的方法及系统
CN115630153A (zh) 一种基于大数据技术的研究生文献资源推荐方法
CN111710428A (zh) 一种建模全局和局部上下文交互的生物医学文本表示方法
CN112785156B (zh) 一种基于聚类与综合评价的产业领袖识别方法
CN110046225B (zh) 一种科技项目材料完整性评估决策模型训练方法
CN114943216B (zh) 基于图注意力网络的案件微博属性级观点挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181130