CN112395508B - 一种人工智能人才职位推荐系统及其处理方法 - Google Patents
一种人工智能人才职位推荐系统及其处理方法 Download PDFInfo
- Publication number
- CN112395508B CN112395508B CN202011561842.6A CN202011561842A CN112395508B CN 112395508 B CN112395508 B CN 112395508B CN 202011561842 A CN202011561842 A CN 202011561842A CN 112395508 B CN112395508 B CN 112395508B
- Authority
- CN
- China
- Prior art keywords
- job
- social network
- data
- nodes
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 8
- 238000013473 artificial intelligence Methods 0.000 title claims description 14
- 238000005516 engineering process Methods 0.000 claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000010276 construction Methods 0.000 claims abstract description 14
- 238000007726 management method Methods 0.000 claims abstract description 8
- 238000010586 diagram Methods 0.000 claims description 32
- 238000000034 method Methods 0.000 claims description 19
- 238000005065 mining Methods 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 13
- SUDBRAWXUGTELR-HPFNVAMJSA-N 5-[[(2r,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxymethyl]-1h-pyrimidine-2,4-dione Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OCC1=CNC(=O)NC1=O SUDBRAWXUGTELR-HPFNVAMJSA-N 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000007670 refining Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 238000012886 linear function Methods 0.000 claims description 5
- 238000012512 characterization method Methods 0.000 claims description 4
- 238000009412 basement excavation Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于大数据领域,特别是涉及一种人工智能人才职位推荐系统及其处理方法。该系统包括数据采集和数据库管理模块、职位社交网络构建模块、技能与需求深度分析模块、信息检索与职位推荐模块,主要应用于人才的职位推荐环境下。该系统涉及的为人才提供的职位推荐领域较为广泛,通过深度挖掘人才所学专业技术与新兴职位技术间深层次的支撑关系,通过利用社交网络的优势,对不同领域的职位信息进行综合分析,从而避免推荐的职位信息收到求职者关键词的局限性。职位信息检索模型,通过分层索引方式实现了社交网络的层次化,逐层精炼职位数据,最终将关键性职位推荐给求职者,其推荐准确度高,职位信息检索快。
Description
技术领域
本发明属于大数据领域,特别是涉及一种人工智能人才职位推荐系统及其处理方法。
背景技术
基于移动社交网络的人工智能人才职位推荐是推荐算法应用中重要的一部分,以移动职位数据为基础,识别出人才未来的意向性职位。主流的职位推荐都以求职者的关键词信息为推荐的依据,其核心在于对关键词的整体信息进行分析,而这就容易局限求职者的求职领域,对于部分无工作经验的人才来说,面临大量的招聘信息,无法快速准确地定位到适合自己的工作岗位;同时部分行业技术需求更新迅速,对于人才技术的要求不断地变更,这种变化的人才需求应与普通的职位推荐方法相区别。
目前,职位推荐系统依据求职者简历数据的表层关键词信息进行分析处理,如求职者的毕业院校,工作经验, 所学专业;或者针对少量的其他信息,如性格,政治面貌,能力评估等,使得其推荐信息受限。而对于人才的深层次技术与职位需求间支撑关系的分析而言,所达到的层次不足以支撑后续的研究,因此现阶段的职位推荐技术仍有待改进和提高。
发明内容
本发明的目的在于解决目前职位推荐方法中深层次需求-技术间的支撑关系分析不足以及因职位信息太多导致求职者无法快速准确地定位到目标职位的问题。本发明提出的一种人工智能人才职位推荐系统及其分析方法,深层次挖掘新技术需求与人工智能人才所具备的技术之间的潜在的支撑关系,为求职者提供更全面的职位推荐解决方案;同时,基于移动社交网络的职位推荐系统可以优化相似职位间的结构关系,通过逐层精炼的方式来降低大量职位信息对求职者职位推荐的局限性。
为达到上述目的,本发明是通过下述技术方案实现的:
一种人工智能人才职位推荐系统及其处理方法,包括:
数据采集和数据库管理模块,用于数据采集、数据分类和数据预处理,构建职位技能匹配数据库,包括数据采集装置、数据预处理装置;
职位社交网络构建模块,分析职位间技术支撑的潜在关系,挖掘不同职位间的关联关系,建立职位社交网络图,网络结构的维护与优化,包括实体命名装置、网络关系构建装置、社交网络图存储装置与职位社交网络优化装置;
技能与职位需求深度分析模块,深度分析人工智能人才求职者专业技能与新兴职位的技能需求间潜在的支撑关系,包括深度挖掘装置;
信息检索与职位推荐模块,对职位网络图进行分层索引,对职位信息逐层精炼后与用户求职意向信息进行综合分析,对求职者进行准确的职位推荐,包括层索引构建装置和职位推荐装置。
所述的一种人工智能人才职位推荐系统,数据采集装置,采集基于移动设备上的实时职位数据、新经济技术关键词数据以及使用者的求职需求数据。
所述的一种人工智能人才职位推荐系统,数据预处理装置设置为:
(1)构建职位需求知识库J,包括职位ID、求职者的工作经验要求、求职者学历和求职者技术要求;
(2)维护新兴技术关键词Tw,包括新兴技术ID、新兴技术技能要求、新兴技术就业领域;
(3)根据职位数据与需求知识库,将职位数据整合成结构化数据Struc=(J,Tw);
(4)挖掘人才关键词信息AIF,包括人工智能人才的基本信息、毕业院校、所学专业、所具备的专业技术以及技术需求。
所述的一种人工智能人才职位推荐系统,实体命名装置设置为:
(1)根据整合完成后的所述结构化职位数据Struc,抽取出职位信息,将其转换成带有类别属性的实体;
(2)将抽取出来的职位实体拟合成社交网络中的节点实体N,定义节点属性property=(Struc,C,O),其中C代表类别属性,O代表节点的其他属性;
(3)结合职位需求知识库,实时维护每个实体节点的需求属性。
所述的一种人工智能人才职位推荐系统,网络关系构建装置设置为:根据不同职位间需求属性的相似度,计算不同职位间的相似程度,采用公式:进行衡量,其中/>相当于一个阈值控制器,/>表示两个需求属性间的相似程度,/>;根据职位间的相似程度,建立相互关系,进而建立职位社交网络;所述社交网络图存储装置设置为将所述职位社交网络进行关系存储,记为G=(N,E),其中G代表整个社交网络图,N代表图中的实体节点,E代表节点之间的关系,即为边。
所述的一种人工智能人才职位推荐系统,职位社交网络优化装置设置为:
(1)通过利用线性函数限制其内核的查找数量,改进Enumerate top-k算法,挖掘职位社交网络中的密集结构,并将其结构信息进行存储,其中/>和/>是密集结构挖掘中的超参数,且保证/>;
(2)分析挖掘出的密集结构,通过公式衡量密集结构的重要程度,根据密集结构的重要行度量值从大到小进行排序,取出前75%的密集结构汇总成超级节点SuperNode,进而优化整个网络结构,其中α为子图边的权重,β为子图节点度的权重,/>为子图中实际存在的边的数量,/>表示节点/>的度, />,/>表示子图中节点的最大度。
所述的一种人工智能人才职位推荐系统,深度挖掘装置通过运用语义关系,将人才所学的专业技能与新兴技术职位需求进行语义拟合,深层次挖掘技能与职位间的关联关系,将专业技能与职位进行映射。
所述的一种人工智能人才职位推荐系统,分层索引构建装置设置为:
(1)对原始社交网络图进行图的表征学习,得到图中每个节点的Embedding向量Vector;
(2)通过分析不同SuperNode中所包含节点间的重叠关系,提取出桥节点BN;
(3)结合节点的表征向量Vector和桥节点BN的频次,通过公式计算桥节点的关键系数,根据关键系数从大到小进行排序,提取出BN的前75%作为关键节点,记为关键节点KeyNodes,其中count(BN)为节点的频次,NE(BN)为BN节点在子图中的所有邻接点;
(4)对于社交网络优化装置输出的优化后的社交网络图、挖掘出的密集结构和提取出来的KeyNodes,自下而上依次建立起索引关系,进而构建职位信息的分层索引结构。
所述的一种人工智能人才职位推荐系统,职位推荐装置设置为:
(1)通过分析人才的技术支撑与职位需求,将AIF数据进行结构化处理,处理后的数据包括人才ID、工作地点期望、工资期望、所学专业、人才所拥有的技能;
(2)根据需求信息和Struc数据,将结构化后的AIF数据与优化后的网络结构通过技能与职位需求深度分析模块进行初步的拟合,然后索引到上层密集结构层,再通过密集结构层索引到KeyNodes层,进而将KeyNodes实体节点所代表的职位推荐给人才。
一种人工智能人才职位推荐系统的处理方法,具体步骤如下:
步骤1:根据采集到的人才信息AIF数据,提取所学专业以及所学的关键技术;
步骤2:根据采集到的职位需求知识库J与专业以及关键技术,结合新兴技术关键词Tw,分析三者之间的关系支撑;
步骤3:根据实体命名装置抽取出来的职位实体,结合技能与职位需求深度分析模块,衡量各个职位间的关联程度,进而建立职位社交网络图;
步骤4:挖掘职位社交网络中的密集结构,并将其结构信息进行存储;
步骤5:根据挖掘出的密集结构衡量密集结构的重要程度;
步骤6:对原始社交网络图进行图的表征学习,得到图中每个节点的Vector,而每个Vector对应于128维度的表征数据;
步骤7:根据不同SuperNode中所含节点间的重叠关系,提取出桥节点;
步骤8:计算桥节点的关键性系数;
步骤9:将优化后的社交网络图、挖掘出来的密集结构与关键节点通过分层索引的方式建立索引关系,进而构建职位信息的分层信息检索模型;
步骤10:根据需求知识库J深度挖掘出来的技术支撑关系,将人才与职位信息进行关联;
步骤11:根据匹配出来的大量的职位信息,通过索引进行精炼,并且索引至第二层结构SecondStruc;
步骤12:根据SecondStruc结构信息,依据上述已经计算出来的关键性节点,将匹配关系映射至顶层,即KeyNodes层次;
步骤13:将匹配出来的关键性节点转换回KeyJob并推荐给人才;
步骤14:当KeyJob信息过少时,通过反向索引将推荐信息返回至第二层中,实现将更多的职位信息输出,进而为求职者推荐职位。
综上所述,本发明的有益效果包括:
(1)本发明提供的系统主要应用于人才的职位推荐环境下,通过构建职位社交网络,利用社交网络的优势,通过密集子图挖掘算法,识别不同领域下的相关联的工作职位,通过职位实体间的关联关系,实现相同技术对应的其不同领域下的职位推荐。
(2)本发明不仅仅依赖于人才的简历数据和其限定的关键词信息,而是通过分析其所具备的专业技能与新兴技术等信息,深层次挖掘其内在的技术支撑关系,从而尽可能避免为求职者推荐的职位受限于某个领域。
(3)本发明提供的系统中,通过将社交网络图进行层次化划分,将优化的网络结构、密集结构与KeyNodes通过分层索引的方式建立索引结构,在职位信息检索上实现了较大进步。
(4)其方法科学合理,适应性强。
前面所述的为本申请的概述,因此必然有简化、概括和细节省略的情况;本领域的技术人员应该认识到,概述部分仅是对本申请的说明,而不应看作是对本申请的任何限定。本说明书中描述的装置和/或方法和/或其他主题的其他方面、特征和优点将会由于本说明书的阐述而变得清晰。概述部分是用来以一种简化的方式导入多个将在以下具体实施方式部分进一步描述的概念。本概述部分既非用于确定所要求保护主题的关键特征或必要特征,也非用来作为确定所要求保护主题的范围的辅助手段。
附图说明
通过下面说明书和所附的权利要求书并与附图结合,就会更加充分地清楚理解本申请的上述和其他特征。应当理解,这些附图仅是对本申请若干实施方式的描述,不应认为是对本申请范围的限定,通过附图,本申请内容将会得到更加明确和详细地说明。
图1是本发明的基于移动社交网络的人工智能人才职位推荐系统的系统框图。
图2是本发明的基于移动社交网络的人工智能人才职位推荐系统处理方法的方法流程图。
具体实施方式
在下面的具体实施方式部分中,结合作为说明书一部分的附图进行说明。在附图中,相同/类似的标记通常表示相同/类似的部件,除非说明书中另有说明。具体实施方式、附图和权利要求书中描述的用来举例说明的实施方式不应认为是对本申请的限定。在不偏离本申请表述的主题的精神或范围的情况下,可以采用本申请的其他实施方式,并且可以对本申请做出其他变化。应该很容易理解,可以对本说明书中一般性描述的、附图中图解说明的本申请的各个方面进行各种不同构成的配置、替换、组合,设计,而所有这些改变都显然在预料之中,并构成本申请的一部分。
参照图1,一种人工智能人才职位推荐系统,包括:数据采集和数据库管理模块、职位社交网络构建模块、技能与职位需求深度分析模块、信息检索与职位推荐模块。
其中,所述的数据采集和数据库管理模块用于数据采集、数据分类和数据预处理,构建职位技能匹配数据库,包括数据采集装置、数据预处理装置;所述职位社交网络构建模块,用于分析职位间技术支撑的潜在关系,挖掘不同职位间的关联关系,建立职位社交网络图,网络结构的维护与优化,包括实体命名装置、网络关系构建装置、社交网络图存储装置与职位社交网络优化装置;所述技能与职位需求深度分析模块,深度分析人工智能人才求职者专业技能与新兴职位的技能需求间潜在的支撑关系,包括深度挖掘装置;所述信息检索与职位推荐模块,对职位网络图进行分层索引,对职位信息逐层精炼后与用户求职意向信息进行综合分析,对求职者进行准确的职位推荐,包括层索引构建装置和职位推荐装置。
进一步的,数据采集装置,用于采集基于移动设备上的实时职位数据、新经济技术关键词数据以及使用者的求职需求数据。职位数据包括:职位ID、职位名称、职位工作地点、薪资、工作经验要求、技术要求等信息。该模块采集的人工智能人才基本信息数据包括:ID、姓名、性别、年龄、所学专业、毕业院校、所具备的技能和其他信息。该模块中的数据分类装置将其采集到的职位数据分为八大类:技术类职位、产品类职位、设计类职位、运营类职位、市场类职位、职能类职位和游戏类职位和其他类。该模块中的数据库管理装置主要是数据本体的构建,为了实现数据的整体性,对分类的数据分别进行属性定义,所有的数据必须按照一个统一的数据模型进行组织,描述和存储。从而数据具有整体的结构化特征,面向全系统,实现数据的共享。数据库管理模块将采集的原始数据分为三大类,职位数据(记为Jo):包括职位ID、职位名称、职位工作地点、薪资、工作经验要求,技术要求等信息。人工智能人才基本信息数据(记为AIF):包括ID、姓名、性别、年龄、所学专业、毕业院校、所具备的技能和其他信息。新兴技术关键词数据(记为Tw):包括新兴技术ID、新兴技术技能要求、 新兴技术就业领域和其他数据。数据库管理装置对于采集到的数据,进行属性定义,进行数据本体构建,根据数据来源类型,建立属性列表1。
属性列表1
进一步的,数据预处理装置设置为:
(1)构建职位需求知识库J,包括职位ID、求职者的工作经验要求、求职者学历和求职者技术要求;
(2)维护新兴技术关键词Tw,包括新兴技术ID、新兴技术技能要求、新兴技术就业领域;
(3)根据职位数据与需求知识库,将职位数据整合成结构化数据Struc=(J,Tw);
(4)挖掘人才关键词信息AIF,包括人工智能人才的基本信息、毕业院校、所学专业、所具备的专业技术以及技术需求。
进一步的,实体命名装置设置为:
(1)根据整合完成后的所述结构化职位数据Struc,抽取出职位信息,将其转换成带有类别属性的实体;
(2)将抽取出来的职位实体拟合成社交网络中的节点实体N,定义节点属性property=(Struc,C,O),其中C代表类别属性,O代表节点的其他属性;
(3)结合职位需求知识库,实时维护每个实体节点的需求属性。
进一步的,网络关系构建装置设置为:根据不同职位间需求属性的相似度,计算不同职位间的相似程度,采用公式:进行衡量,其中/>相当于一个阈值控制器,/>表示两个需求属性间的相似程度,/>;根据职位间的相似程度,建立相互关系,进而建立职位社交网络;所述社交网络图存储装置设置为将所述职位社交网络进行关系存储,记为G=(N,E),其中G代表整个社交网络图,N代表图中的实体节点,E代表节点之间的关系,即为边。
进一步的,职位社交网络优化装置设置为:
(1)通过利用线性函数限制其内核的查找数量,改进Enumerate top-k算法,挖掘职位社交网络中的密集结构,并将其结构信息进行存储,其中/>和/>是密集结构挖掘中的超参数,且保证/>;
(2)分析挖掘出的密集结构,通过公式衡量密集结构的重要程度,根据密集结构的重要行度量值从大到小进行排序,取出前75%的密集结构汇总成超级节点SuperNode,进而优化整个网络结构,其中α为子图边的权重,β为子图节点度的权重,/>为子图中实际存在的边的数量,/>表示节点/>的度, />,/>表示子图中节点的最大度。
进一步的,深度挖掘装置通过运用语义关系,将人才所学的专业技能与新兴技术职位需求进行语义拟合,深层次挖掘技能与职位间的关联关系,将专业技能与职位进行映射。
进一步的,分层索引构建装置设置为:
(1)对原始社交网络图进行图的表征学习,得到图中每个节点的Embedding向量Vector;
(2)通过分析不同SuperNode中所包含节点间的重叠关系,提取出桥节点BN;
(3)结合节点的表征向量Vector和桥节点BN的频次,通过公式计算桥节点的关键系数,根据关键系数从大到小进行排序,提取出BN的前75%作为关键节点,记为关键节点KeyNodes,其中count(BN)为节点的频次,NE(BN)为BN节点在子图中的所有邻接点;
(4)对于社交网络优化装置输出的优化后的社交网络图、挖掘出的密集结构和提取出来的KeyNodes,自下而上依次建立起索引关系,进而构建职位信息的分层索引结构。
进一步的,职位推荐装置设置为:
(1)通过分析人才的技术支撑与职位需求,将AIF数据进行结构化处理,处理后的数据包括人才ID、工作地点期望、工资期望、所学专业、人才所拥有的技能;
(2)根据需求信息和Struc数据,将结构化后的AIF数据与优化后的网络结构通过技能与职位需求深度分析模块进行初步的拟合,然后索引到上层密集结构层,再通过密集结构层索引到KeyNodes层,进而将KeyNodes实体节点所代表的职位推荐给人才。
参照图2,一种人工智能人才职位推荐系统的处理方法,具体步骤如下:
步骤1:根据采集到的人才信息AIF数据,提取所学专业以及所学的关键技术;
步骤2:根据采集到的职位需求知识库J与专业以及关键技术,结合新兴技术关键词Tw,分析三者之间的关系支撑;
步骤3:根据实体命名装置抽取出来的职位实体,结合技能与职位需求深度分析模块,通过公式衡量各个职位间的关联程度,进而建立职位社交网络图G=(N,E);
步骤4:通过利用线性函数限制其内核的查找数量,改进Enumerate top-k算法,进而实现挖掘职位社交网络中的密集结构,并将其结构信息进行存储;
步骤5:根据挖掘出的密集结构,通过公式衡量密集结构的重要程度,根据密集结构的重要行度量值从大到小进行排序,取出前75%的密集结构汇总成超级节点SuperNode,进而优化整个网络结构;
步骤6:对原始社交网络图进行图的表征学习,得到图中每个节点的Vector,而每个Vector对应于128维度的表征数据;
步骤7:根据不同SuperNode中所含节点间的重叠关系,提取出桥节点BN;
步骤8:根据公式计算桥节点的关键系数,根据关键系数从大到小进行排序,提取出BN的前75%作为关键节点,记为关键节点KeyNodes;
步骤9:将优化后的社交网络图、挖掘出来的密集结构与关键节点通过分层索引的方式建立索引关系,进而构建职位信息的分层信息检索模型;
步骤10:根据需求知识库J深度挖掘出来的技术支撑关系,将人才与职位信息进行关联;
步骤11:根据匹配出来的大量的职位信息,通过索引进行精炼,并且索引至第二层结构SecondStruc;
步骤12:根据SecondStruc结构信息,依据上述已经计算出来的关键性节点,将匹配关系映射至顶层,即KeyNodes层次;
步骤13:将匹配出来的关键性节点转换回KeyJob并推荐给人才;
步骤14:当KeyJob信息过少时,通过反向索引将推荐信息返回至第二层中,实现将更多的职位信息输出,进而为求职者推荐职位。
综上可见,本发明提供的系统通过构建职位社交网络,利用社交网络的优势,通过密集子图挖掘算法,识别不同领域下的相关联的工作职位,通过职位实体间的关联关系,实现相同技术对应的其不同领域下的职位推荐。不仅仅依赖于人才的简历数据和其限定的关键词信息,而是通过分析其所具备的专业技能与新兴技术等信息,深层次挖掘其内在的技术支撑关系,从而尽可能避免为求职者推荐的职位受限于某个领域。本发明通过将社交网络图进行层次化划分,将优化的网络结构、密集结构与KeyNodes通过分层索引的方式建立索引结构,在职位信息检索上实现了较大进步,其方法科学合理,适应性强。
前述已通过框图、流程图和/或实施例子进行了详细描述,阐明了本申请装置和/或方法的不同实施方式,当这些框图、流程图和/或实施例包含一个或多个功能和/或操作时,本领域的技术人员会明白,这些框图、流程图和/或实施例中的各功能和/或操作可以通过各种硬件、软件、固件或实质上它们的任意组合而单独地和/或共同地实施。本领域的技术人员会认识到,以本说明书中说明的方式描述装置和/或方法,然后进行工程实践以将所描述的装置和/或方法集成到数据处理系统中,在本领域里是很常见的,也就是说,本说明书中描述的装置和/或方法中的至少一部分,可通过合理数量的实验集成到数据处理系统中,对于本说明书中所用的基本上任何复数和/或单数术语,本领域的技术人员可以将复数解释为单数和/或将单数解释为复数,只要这样做从上下文和/或应用上看是合适的即可,为了清楚起见,在本说明书中可能将各种单数/复数组合明确地表述出来。
本申请中公开了本申请的多个方面和实施方式,本领域的技术人员会明白本申请的其它方面和实施方式,本申请中公开的多个方面和实施方式只是用于举例说明,并非是对本申请的限定,本申请的真正保护范围和精神应当以下面的权利要求书为准。
Claims (6)
1.一种人工智能人才职位推荐系统,其特征在于,包括:
数据采集和数据库管理模块,用于数据采集、数据分类和数据预处理,构建职位技能匹配数据库,包括数据采集装置、数据预处理装置;
职位社交网络构建模块,分析职位间技术支撑的潜在关系,挖掘不同职位间的关联关系,建立职位社交网络图,网络结构的维护与优化,包括实体命名装置、网络关系构建装置、社交网络图存储装置与职位社交网络优化装置;
技能与职位需求深度分析模块,深度分析人工智能人才求职者专业技能与新兴职位的技能需求间潜在的支撑关系,包括深度挖掘装置;
信息检索与职位推荐模块,将职位网络图进行分层索引,对职位信息逐层精炼后与用户求职意向信息进行综合分析,对求职者进行准确的职位推荐,包括分层索引构建装置和职位推荐装置;
所述数据预处理装置设置为:
(1)构建职位需求知识库J、包括职位ID、求职者的工作经验要求、求职者学历和求职者技术要求;
(2)维护新兴技术关键词Tw,包括新兴技术ID、新兴技术技能要求、新兴技术就业领域;
(3)根据职位需求知识库和新兴技术关键词,将职位数据整合成结构化职位数据Struc=(J,Tw);
(4)挖掘人工智能人才关键词信息AIF,包括人工智能人才的基本信息、毕业院校、所学专业、所具备的专业技术以及技术需求;
所述实体命名装置设置为:
(1)根据整合完成后的所述结构化职位数据Struc,抽取出职位信息,将其转换成带有类别属性的实体;
(2)将抽取出来的职位实体拟合成社交网络中的节点实体N,定义节点属性property=(Struc,C,O),其中C代表类别属性,O代表节点的其他属性;
(3)结合职位需求知识库,实时维护每个实体节点的需求属性;
所述网络关系构建装置设置为:
根据不同职位间需求属性的相似度,计算不同职位间的相似程度,采用公式: 进行衡量,其中β相当于一个阈值控制器,/>表示两个需求属性间的相似程度,Ai,Bj∈property;根据职位间的相似程度,建立相互关系,进而建立职位社交网络;所述社交网络图存储装置设置为将所述职位社交网络进行关系存储,记为G=(N,E),其中G代表整个社交网络图,N代表图中的实体节点,E代表节点之间的连接关系,即为图中的边;
所述职位社交网络优化装置设置为:
(1)改进Enumerate top-k算法,通过利用线性函数:限制其内核的查找数量,挖掘职位社交网络中的密集结构,并将其结构信息进行存储,其中k和kp是密集结构挖掘中的超参数,且保证k<kp;
(2)分析挖掘出的密集结构,通过公式衡量密集结构的重要程度,根据密集结构的重要行度量值从大到小进行排序,取出前75%的密集结构汇总成SuperNode,进而优化整个网络结构,其中α为子图边的权重,β为子图节点度的权重,E为子图中实际存在的边的数量,D(Ni)表示节点Ni的度,Ni∈N;MaxD(N)表示子图中节点的最大度。
2.如权利要求1所述的一种人工智能人才职位推荐系统,其特征在于,所述数据采集装置,采集基于移动设备上的实时职位数据、新经济技术关键词数据以及使用者的求职需求数据。
3.如权利要求1所述的一种人工智能人才职位推荐系统,其特征在于,所述深度挖掘装置通过运用语义关系,将人才所学的专业技能与新兴技术职位需求进行语义拟合,深层次挖掘技能与职位间的关联关系,将专业技能与职位进行映射。
4.如权利要求1所述的一种人工智能人才职位推荐系统,其特征在于,所述分层索引构建装置设置为:
(1)对原始社交网络图进行图的表征学习,得到图中每个节点的Embedding向量Vector;
(2)通过分析不同SuperNode中所包含节点间的重叠关系,提取出桥节点BN;
(3)结合节点的表征向量Vector和桥节点BN的频次,通过公式:计算桥节点的关键系数,根据关键系数从大到小进行排序,提取出BN的前70%作为关键节点,记为关键节点KeyNodes,其中count(BN)为节点的频次,NE(BN)为BN节点在子图中的所有邻接点;
(4)对于社交网络优化装置输出的优化后的社交网络图、挖掘出的密集结构和提取出来的KeyNodes,自下而上的依次建立起索引关系,进而构建职位信息的分层索引结构。
5.如权利要求4所述的一种人工智能人才职位推荐系统,其特征在于,所述职位推荐装置为:
(1)通过分析人才的技术支撑与职位需求,将AIF数据进行结构化处理,处理后的数据包括人才ID、工作地点期望、工资期望、所学专业、人才所拥有的技能;
(2)根据需求信息和Struc数据,将结构化后的AIF数据与优化后的网络结构通过技能与职位需求深度分析模块进行初步的拟合,然后索引到上层密集结构层;再通过密集结构层索引到KeyNodes层,进而将KeyNodes实体节点所代表的职位推荐给人才。
6.一种人工智能人才职位推荐系统的处理方法,其特征在于,具体步骤如下:
步骤1:根据采集到的人才关键词信息AIF数据,提取所学专业以及所学的关键技术;
步骤2:根据采集到的职位需求知识库J与专业以及关键技术,结合新兴技术关键词Tw,分析三者之间的关系支撑;
步骤3:根据实体命名装置抽取出来的职位实体,结合技能与需求深度分析模块,采用公式:进行衡量,其中β相当于一个阈值控制器,/>表示两个需求属性间的相似程度,Ai,Bj∈property,衡量各个职位间的关联程度,进而建立职位社交网络图,记为G=(N,E),其中G代表整个社交网络图,N代表图中的实体节点,E代表节点之间的连接关系,即为图中的边;
步骤4:挖掘职位社交网络中的密集结构,通过利用线性函数:限制其内核的查找数量,挖掘职位社交网络中的密集结构,并将其结构信息进行存储,其中k和kp是密集结构挖掘中的超参数,且保证k<kp;
步骤5:根据挖掘出的密集结构,通过公式衡量密集结构的重要程度,根据密集结构的重要行度量值从大到小进行排序,取出前75%的密集结构汇总成SuperNode,进而优化整个网络结构,其中α为子图边的权重,β为子图节点度的权重,E为子图中实际存在的边的数量,D(Ni)表示节点Ni的度,Ni∈N;MaxD(N)表示子图中节点的最大度;
步骤6:对原始社交网络图进行图的表征学习,得到图中每个节点的Vector,而每个Vector对应于128维度的表征数据;
步骤7:根据不同SuperNode中所含节点间的重叠关系,提取出桥节点BN;
步骤8:计算桥节点的关键性系数表征向量Vector和桥节点BN的频次,通过公式:计算桥节点的关键系数,根据关键系数从大到小进行排序,提取出BN的前70%作为关键节点,记为关键节点KeyNodes,其中count(BN)为节点的频次,NE(BN)为BN节点在子图中的所有邻接点;
步骤9:将优化后的社交网络图、挖掘出来的密集结构与关键节点通过分层索引的方式建立索引关系,进而构建职位信息的分层信息检索模型;
步骤10:根据需求知识库J深度挖掘出来的技术支撑关系,将人工智能人才与职位信息进行关联;
步骤11:根据匹配出来的大量的职位信息,通过索引进行精炼,并且索引至第二层结构SecondStruc;
步骤12:根据SecondStruc结构信息,依据已经计算出来的关键性节点,将匹配关系映射至顶层即KeyNodes层次;
步骤13:将匹配出来的关键性节点转换回KeyJob并推荐给人工智能人才;
步骤14:当KeyJob信息过少时,通过反向索引将推荐信息返回至第二层中,实现将更多的职位信息输出,进而为求职者推荐职位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011561842.6A CN112395508B (zh) | 2020-12-25 | 2020-12-25 | 一种人工智能人才职位推荐系统及其处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011561842.6A CN112395508B (zh) | 2020-12-25 | 2020-12-25 | 一种人工智能人才职位推荐系统及其处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112395508A CN112395508A (zh) | 2021-02-23 |
CN112395508B true CN112395508B (zh) | 2024-03-29 |
Family
ID=74625210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011561842.6A Active CN112395508B (zh) | 2020-12-25 | 2020-12-25 | 一种人工智能人才职位推荐系统及其处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112395508B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112883198B (zh) * | 2021-02-24 | 2024-05-24 | 广州视源电子科技股份有限公司 | 一种知识图谱构建方法、装置、存储介质以及计算机设备 |
CN113806598B (zh) * | 2021-09-23 | 2024-04-05 | 广东省通信产业服务有限公司广州分公司 | 一种利于云搜索的专业人才分类统计数据库及方法 |
US20230281565A1 (en) * | 2022-03-04 | 2023-09-07 | HireTeamMate Incorporated | System and method for generating lower-dimension graph representations in talent acquisition platforms |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
CN110674318A (zh) * | 2019-08-14 | 2020-01-10 | 中国科学院计算机网络信息中心 | 一种基于引文网络社区发现的数据推荐方法 |
CN111177583A (zh) * | 2019-12-30 | 2020-05-19 | 山东合天智汇信息技术有限公司 | 一种基于社交平台的人脉分析方法及系统 |
CN111737495A (zh) * | 2020-06-28 | 2020-10-02 | 福州数据技术研究院有限公司 | 基于领域自分类的中高端人才智能推荐系统及其方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130275429A1 (en) * | 2012-04-12 | 2013-10-17 | Graham York | System and method for enabling contextual recommendations and collaboration within content |
US20140143164A1 (en) * | 2012-11-20 | 2014-05-22 | Christian Posse | Techniques for quantifying the job-seeking propensity of members of a social network service |
US20170359437A1 (en) * | 2016-06-09 | 2017-12-14 | Linkedin Corporation | Generating job recommendations based on job postings with similar positions |
US20190087916A1 (en) * | 2017-09-21 | 2019-03-21 | Microsoft Technology Licensing, Llc | Model-based recommendation of career path transitions in social networks |
US20190384861A1 (en) * | 2018-06-15 | 2019-12-19 | Linkedin Corporation | Real-time graph traversals for network-based recommendations |
US20200151647A1 (en) * | 2018-11-09 | 2020-05-14 | Microsoft Technology Licensing, Llc | Recommending jobs based on title transition embeddings |
-
2020
- 2020-12-25 CN CN202011561842.6A patent/CN112395508B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
CN110674318A (zh) * | 2019-08-14 | 2020-01-10 | 中国科学院计算机网络信息中心 | 一种基于引文网络社区发现的数据推荐方法 |
CN111177583A (zh) * | 2019-12-30 | 2020-05-19 | 山东合天智汇信息技术有限公司 | 一种基于社交平台的人脉分析方法及系统 |
CN111737495A (zh) * | 2020-06-28 | 2020-10-02 | 福州数据技术研究院有限公司 | 基于领域自分类的中高端人才智能推荐系统及其方法 |
Non-Patent Citations (5)
Title |
---|
Job Recommendation from Semantic Similarity of LinkedIn Users Skills;Domeniconi, G.等;《Proceedings of the 5th International Conference on Pattern Recognition Applications and Methods》;第270-277页 * |
Tripartite Vector Representations for Better Job Recommendation;Mengshu Liu等;《arXiv》;第1-5页 * |
基于社交关系的职位推荐系统的架构与实现;王超;《中国优秀硕士学位论文全文数据库 信息科技辑》;I138-1508 * |
知识图谱的推荐系统综述;常亮等;《智能系统学报》;第207-216页 * |
高校实习全生命周期管理与岗位推荐系统的研究与实现;陈梦婷;《中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》;H131-315 * |
Also Published As
Publication number | Publication date |
---|---|
CN112395508A (zh) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112395508B (zh) | 一种人工智能人才职位推荐系统及其处理方法 | |
López-Robles et al. | Understanding the intellectual structure and evolution of Competitive Intelligence: A bibliometric analysis from 1984 to 2017 | |
Silwattananusarn et al. | Data mining and its applications for knowledge management: a literature review from 2007 to 2012 | |
Érdi et al. | Prediction of emerging technologies based on analysis of the US patent citation network | |
Zong et al. | Doctoral dissertations of Library and Information Science in China: A co-word analysis | |
US20230077834A1 (en) | Cognitive rule engine | |
CN111144831B (zh) | 一种适用于人员招聘的人选精准甄别系统及其甄别方法 | |
CN114819589A (zh) | 城市空间高质量利用测定方法、系统、计算机设备及终端 | |
CN110033191B (zh) | 一种商业人工智能的分析方法及系统 | |
CN113254517A (zh) | 一种基于互联网大数据的服务提供方法 | |
CN102799627A (zh) | 一种基于一阶逻辑和神经网络的数据对应方法 | |
Song et al. | Interactive visual pattern search on graph data via graph representation learning | |
Umair et al. | Main path analysis to filter unbiased literature | |
CN109543189A (zh) | 基于语义相似度的机器人数据互操作领域本体映射方法 | |
Wijayanti et al. | K-means cluster analysis for students graduation: case study: STMIK Widya Cipta Dharma | |
CN117455158A (zh) | 一种典型场景智能体编组决策方案生成装置及方法 | |
You et al. | Evolution monitoring for innovation sources using patent cluster analysis | |
Kashevarova | Technological development modeling based on patent analysis: Review of the state-of-the-art | |
CN110059967A (zh) | 一种应用于城市辅助决策分析的数据处理方法及装置 | |
Karlovčec et al. | Core-periphery dynamics in collaboration networks: the case study of Slovenia | |
Mehrotra et al. | Landscape Analysis of Patent Dataset. | |
Nilsson et al. | Probabilistic Gradient-Based Extrema Tracking | |
Feng et al. | ASMaaS: Automatic Semantic Modeling as a Service | |
Ali et al. | Collaboration and Risk in Building Information Modelling (BIM): A Systematic Literature Review. Buildings 2022, 12, 571 | |
Navagamuwa et al. | Automated Query Generation for Complex Event Processing: A Shapelets, Parallel Coordinates, and Clustering Based Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |