CN112380359A - 基于知识图谱的培训资源分配方法、装置、设备及介质 - Google Patents
基于知识图谱的培训资源分配方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112380359A CN112380359A CN202110059438.7A CN202110059438A CN112380359A CN 112380359 A CN112380359 A CN 112380359A CN 202110059438 A CN202110059438 A CN 202110059438A CN 112380359 A CN112380359 A CN 112380359A
- Authority
- CN
- China
- Prior art keywords
- graph
- training
- data
- training resource
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 231
- 238000013468 resource allocation Methods 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 23
- 238000002372 labelling Methods 0.000 claims description 22
- 238000007781 pre-processing Methods 0.000 claims description 17
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 8
- 230000007704 transition Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 238000013439 planning Methods 0.000 abstract description 11
- 230000008569 process Effects 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004590 computer program Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 230000001960 triggered effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06312—Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
- G06Q50/2057—Career enhancement or continuing education service
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大数据领域,提供一种基于知识图谱的培训资源分配方法、装置、设备及介质,能够基于知识图谱及多个维度实现对路径的自动规划,以便于后续根据查找到的路径进行培训资源推荐,根据所述目标路径生成培训资源推荐信息,最终实现基于知识图谱及路径规划的培训资源推荐,以辅助进行培训资源的配置。此外,本发明还涉及区块链技术,培训资源知识图谱可存储于区块链节点中。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于知识图谱的培训资源分配方法、装置、设备及介质。
背景技术
当前,针对营业部的部课培训,由于受众人群较少,大部分培训无法如期进行开班,例如部课衔接训练、部课早早练和部课新人集训等。部门增员率及岗结上岗率较低等问题,也导致营业部无法承办针对新人线的营业部半制式培训班。另外,营业部导师资源匮乏,优质导师人力不足。但是,在供给不足的同时,新人培训作为有效活动的重要助力,仍然是营业部训练辅导的刚需任务,由此产生了长期的供需失衡、资源错配问题。
针对以上情况,可采用由营业区进行统筹、营业部开展轮值的方式解决营业部开课难、导师缺、资源少的问题,但是,现有的解决方案所覆盖的因素仍然较为片面,当同时覆盖多个因素时,多个算法模型将降低运算效率,因此,在模型覆盖面及运算效率间很难达到平衡。
发明内容
鉴于以上内容,有必要提供一种基于知识图谱的培训资源分配方法、装置、设备及介质,能够实现基于知识图谱及路径规划的培训资源推荐,以辅助进行培训资源的配置。
一种基于知识图谱的培训资源分配方法,所述基于知识图谱的培训资源分配方法包括:
响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据;
对所述基础数据进行预处理,得到中间数据;
识别所述中间数据的实体,得到实体列表;
基于所述实体列表构建培训资源知识图谱;
获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图;
获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径;
根据所述目标路径生成培训资源推荐信息。
根据本发明优选实施例,所述根据所述基于知识图谱的培训资源分配指令获取基础数据包括:
解析所述基于知识图谱的培训资源分配指令的方法体,得到所述基于知识图谱的培训资源分配指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
利用所述正则表达式在所述基于知识图谱的培训资源分配指令所携带的信息中进行遍历,并将遍历到的数据确定为数据库标识;
根据所述数据库标识调取目标数据库,并从所述目标数据库中获取数据作为所述基础数据。
根据本发明优选实施例,所述对所述基础数据进行预处理,得到中间数据包括:
当所述基础数据为图片数据时,将所述基础数据转换为初始文本,对所述初始文本进行过滤及清洗,得到过滤后的文本,基于UTF-8编码算法对所述过滤后的文本进行编码,得到所述中间数据;或者
当所述基础数据为文本类型时,对所述基础数据进行过滤及清洗,得到过滤后的文本,基于UTF-8编码算法对所述过滤后的文本进行编码,得到所述中间数据。
根据本发明优选实施例,所述识别所述中间数据的实体,得到实体列表包括:
将所述中间数据输入至预先训练的序列标注模型中,并获取Softmax层中每个序列位置上对应的各个标签的输出概率以及转移概率;
对于每个序列位置,计算各个标签的输出概率以及转移概率的和作为各个标签的分值;
将分值最高的标签确定为每个序列位置的输出标签;
组合每个序列位置的输出标签,得到所述实体列表。
根据本发明优选实施例,所述方法还包括:
根据预先定义的标注需求配置序列标注模式;
将所述序列标注模式添加到Bi-LSTM+CRF模型中,得到所述序列标注模型。
根据本发明优选实施例,所述将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图包括:
获取所述待分配对象对应的待分配维度;
在每个待分配维度上,基于SPFA算法在所述培训资源知识图谱中进行最短路径选择,得到每个待分配维度对应的最短路径;
整合每个待分配维度对应的最短路径,得到所述路径图。
根据本发明优选实施例,所述根据所述培训需求数据在所述路径图中进行搜索,得到目标路径包括:
根据所述培训需求数据确定目标待分配维度;
从所述路径图中查询与所述目标待分配维度对应的路径;
将搜索到的路径确定为所述目标路径。
一种基于知识图谱的培训资源分配装置,所述基于知识图谱的培训资源分配装置包括:
获取单元,用于响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据;
预处理单元,用于对所述基础数据进行预处理,得到中间数据;
识别单元,用于识别所述中间数据的实体,得到实体列表;
构建单元,用于基于所述实体列表构建培训资源知识图谱;
遍历单元,用于获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图;
搜索单元,用于获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径;
生成单元,用于根据所述目标路径生成培训资源推荐信息。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述基于知识图谱的培训资源分配方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述基于知识图谱的培训资源分配方法。
由以上技术方案可以看出,本发明能够响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据,对所述基础数据进行预处理,得到中间数据,识别所述中间数据的实体,得到实体列表,基于所述实体列表构建培训资源知识图谱,构建的知识图谱的延展性及可用性较高,可快速应付新增需求,获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图,获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径,基于知识图谱及多个维度实现对路径的自动规划,以便于后续根据查找到的路径进行培训资源推荐,根据所述目标路径生成培训资源推荐信息,最终实现基于知识图谱及路径规划的培训资源推荐,以辅助进行培训资源的配置。
附图说明
图1是本发明基于知识图谱的培训资源分配方法的较佳实施例的流程图。
图2是本发明基于知识图谱的培训资源分配装置的较佳实施例的功能模块图。
图3是本发明实现基于知识图谱的培训资源分配方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明基于知识图谱的培训资源分配方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述基于知识图谱的培训资源分配方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据。
在本发明的至少一个实施例中,所述基于知识图谱的培训资源分配指令可以由负责分配培训资源的工作人员触发,也可以在区部领导想要了解培训情况时主动触发,本发明不限制。
在本实施例中,所述基础数据可以包括,但不限于以下一种或者多种数据的组合:
地区、营业区、营业部、培训课程、讲师、销售人员等。
在本发明的至少一个实施例中,所述根据所述基于知识图谱的培训资源分配指令获取基础数据包括:
解析所述基于知识图谱的培训资源分配指令的方法体,得到所述基于知识图谱的培训资源分配指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
利用所述正则表达式在所述基于知识图谱的培训资源分配指令所携带的信息中进行遍历,并将遍历到的数据确定为数据库标识;
根据所述数据库标识调取目标数据库,并从所述目标数据库中获取数据作为所述基础数据。
其中,所述基于知识图谱的培训资源分配指令实质上是一条代码,在所述基于知识图谱的培训资源分配指令中,根据代码的编写原则,{}之间的内容被称之为所述方法体。
所述预设标签可以进行自定义配置,所述预设标签与数据库标识具有一一对应的关系,例如:所述预设标签可以是ID,进一步以所述预设标签建立正则表达式ID(),并以ID()进行遍历。
通过上实施方式,能够基于正则表达式及预设标签快速确定数据库标识,并进一步利用所述数据库标识调用目标数据库,以便从所述目标数据库中获取所述基础数据,作为后续建立知识图谱的数据基础。
S11,对所述基础数据进行预处理,得到中间数据。
可以理解的是,在所述基础数据中,除了文本格式的数据外,还可能包括图片数据的数据,因此,为了便于数据处理,需要先对数据的格式进行统一。
具体地,所述对所述基础数据进行预处理,得到中间数据包括:
当所述基础数据为图片数据时,将所述基础数据转换为初始文本,对所述初始文本进行过滤及清洗,得到过滤后的文本,基于UTF-8(8-bit Unicode Transformation Format,8位元)编码算法对所述过滤后的文本进行编码,得到所述中间数据;或者
当所述基础数据为文本类型时,对所述基础数据进行过滤及清洗,得到过滤后的文本,基于UTF-8编码算法对所述过滤后的文本进行编码,得到所述中间数据。
其中,可以采用OCR(Optical Character Recognition,光学字符识别)算法将所述基础数据转换为所述初始文本,本发明不限制。
同时,通过所述UTF-8编码算法对所述过滤后的文本进行编码,能够对所述过滤后的文本执行全角半角符号转换及去除乱码等操作,并最终实现编码统一。
进一步地,所述中间数据可以是TXT文本格式,也可以是其他文本格式,本发明不限制。
通过上述实施方式,能够对所述基础数据进行过滤及清洗,以排除掉干扰信息,并进一步将所述基础数据转化为统一的文本格式,实现了数据格式的统一,便于后续基于所述中间数据执行数据处理。
S12,识别所述中间数据的实体,得到实体列表。
通过对所述基础数据进行预处理,得到的所述中间数据为非结构化数据,因此,需要对所述中间数据中的关键实体信息进行识别,相当于对所述中间数据进行序列标注。因此,首先要构建序列标注模型。
进一步地,在本实施例中,所述识别所述中间数据的实体,得到实体列表包括:
将所述中间数据输入至预先训练的序列标注模型中,并获取Softmax层中每个序列位置上对应的各个标签的输出概率以及转移概率;
对于每个序列位置,计算各个标签的输出概率以及转移概率的和作为各个标签的分值;
将分值最高的标签确定为每个序列位置的输出标签;
组合每个序列位置的输出标签,得到所述实体列表。
例如:假如B-PER表示人名的首字符标记,E-PER表示人名的结尾字符标记,O表示独立字符标记,B-ORG表示培训机构名的首字符标记,I-ORG表示培训机构名的中间字符标记,那么通过对序列中相同类别的标记项进行合并,得到的实体列表中可以包括如下序列:序列(B,E),表示人名;序列(B,I,E),表示培训机构名;序列(O),表示独立字符。
需要说明的是,在将所述中间数据输入至预先训练的序列标注模型中前,还需要训练所述序列标注模型。
具体地,所述方法还包括:
根据预先定义的标注需求配置序列标注模式;
将所述序列标注模式添加到Bi-LSTM+CRF模型中,得到所述序列标注模型。
其中,所述序列标注模式可以根据具体的标注需求进行配置。
例如:不可连续输出相同的标签等。
在上述实施方式中,Bi-LSTM(Bidirectional Long Short Term Memory,双向长短时记忆)层提供了长距离的依赖建模,加强了每个字符与上下文字符间的联系,而CRF(conditional random field,条件随机场)可以容纳任意的上下文信息,特征设计灵活,CRF层可以构建字符间的特征转移及对应关系,并同时考虑输出标签之间的顺序性,进而达到更准确的识别效果。
S13,基于所述实体列表构建培训资源知识图谱。
具体地,可以将所述实体列表中的所有实体作为知识图谱的节点或者边,并连接各个节点,最终得到所述培训资源知识图谱。
本实施例中构建的知识图谱的延展性及可用性较高,可快速应付新增需求。
具体地,每个节点与维度的构建方式如下:
① 对每个营业区部的关系做拆解及连接,以过往交往经验、地理关系、组织关系等为关系粗度进行修正及权重加成,关系越近距离设定越短。
② 将课程的培训记录及特征做整理,串起各类型标签及课程的关联性,课程间可以有上下游关联性。
③ 对每个代理人的课程培训记录与特征做串联,连接起代理人所属营业部、所有培训课程、所有课程的标签的记录。
在本实施例中,在构建的所述培训资源知识图谱中,可以包括“营业区-营业部-销售员-课程-讲师”间的多种关系,即所述培训资源知识图谱是一种多属性、多维度的培训关系网络。
例如,所述培训资源知识图谱可以包括,但不限于以下三种维度:
1. 营业区-营业部关系维度:通过地理位置,连接营业区、部间的关系,例如“杭州-杭州营业区(a)-杭州营业部(1)”及底下的销售人员等,并以历史区部交互经验、销售人员年资等作为关系粗度。
2. 培训资源关系:包含讲师及课程间的关系,课程的标签、各个营业部开过什么课程等。以开课频次作为关系粗度。
3. 人员与培训的关系:包含销售员上过什么课程、评价、反馈等。以评价作为关系粗度。
以上述三种维度的关系构建的所述培训资源知识图谱,包含地区、营业区、营业部、培训课程、讲师、销售人员等关系节点,以及开课、上课、教课、课程对应标签、所属区部等关系维度,是一种多重节点/关系的知识图谱,数据间关系的覆盖面较为全面。
S14,获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图。
在本实施例中,所述待分配对象包括需要进行培训资源分配的部门或者个人,本发明不限制。
在本发明的至少一个实施例中,所述将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图包括:
获取所述待分配对象对应的待分配维度;
在每个待分配维度上,基于SPFA(Shortest Path Faster Algorithm,最短路径算法)算法在所述培训资源知识图谱中进行最短路径选择,得到每个待分配维度对应的最短路径;
整合每个待分配维度对应的最短路径,得到所述路径图。
例如:当所述待分配对象为节点u时,以所述节点u在第一维度上进行遍历,获取到最短路径对应的节点为节点v,则所述节点u与所述节点v间的路径为所述第一维度上的最短路径;再以所述节点u在第二维度上进行遍历,如果此时所述节点v的最短路径估计值有所调整,即所述节点v不在当前的队列中,所述节点u与所述节点v间的路径不再是所述第二维度上的最短路径,则将所述节点v放入队尾。以此类推,不断从所述培训资源知识图谱中选择节点进行如上松弛操作,直至队列空为止。最后,对每个维度上得到的最短路径进行整合,得到所述路径图。
需要说明的是,在传统的BFS(Breadth-First-Search,广度优先搜索算法)算法中,如果剔除了一个节点,那么该节点不会再进入队列参与后续的迭代过程。
本实施方式采用SPFA算法代替传统的BFS算法,剔除的节点可在出队列后再次被放入队列,也就是说,节点有改进后重新排序的可能,通过这样的反复迭代,能更好的描述课程评价提升的实际情况。
S15,获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径。
可以理解的是,当所述基于知识图谱的培训资源分配指令被触发时,伴随指令即可直接获取到所述待分配对象的培训需求数据。
例如:所述需求数据可以为进行部级培训资源的分配,或者也可以为进行区级培训资源的分配。
所述培训需求数据与所述待分配维度具有对应关系。
在本发明的至少一个实施例中,所述根据所述培训需求数据在所述路径图中进行搜索,得到目标路径包括:
根据所述培训需求数据确定目标待分配维度;
从所述路径图中查询与所述目标待分配维度对应的路径;
将搜索到的路径确定为所述目标路径。
通过上述实施方式,能够基于知识图谱及多个维度实现对路径的自动规划,以便于后续根据查找到的路径进行培训资源推荐。
S16,根据所述目标路径生成培训资源推荐信息。
具体地,所述根据所述目标路径生成培训资源推荐信息包括:
获取所述目标路径上的所有标签信息;
获取培训课程标签、授课单位标签及授课地点标签;
根据所述培训课程标签从所述所有标签信息中确定目标培训课程,根据所述授课单位标签从所述所有标签信息中获取目标授课单位,及根据所述授课地点标签从所述所有标签信息中获取目标授课地点;
根据所述目标培训课程、所述目标授课单位及所述目标授课地点生成所述培训资源推荐信息。
通过上述实施方式,能够基于生成的路径实现对培训资源的自动推荐,以辅助进行培训资源的分配。
需要说明的是,为了进一步保证数据的安全性,可以将所述培训资源知识图谱部署于区块链,以避免数据被恶意篡改。
由以上技术方案可以看出,本发明能够响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据,对所述基础数据进行预处理,得到中间数据,识别所述中间数据的实体,得到实体列表,基于所述实体列表构建培训资源知识图谱,构建的知识图谱的延展性及可用性较高,可快速应付新增需求,获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图,获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径,基于知识图谱及多个维度实现对路径的自动规划,以便于后续根据查找到的路径进行培训资源推荐,根据所述目标路径生成培训资源推荐信息,最终实现基于知识图谱及路径规划的培训资源推荐,以辅助进行培训资源的配置。
如图2所示,是本发明基于知识图谱的培训资源分配装置的较佳实施例的功能模块图。所述基于知识图谱的培训资源分配装置11包括获取单元110、预处理单元111、识别单元112、构建单元113、遍历单元114、搜索单元115、生成单元116。本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
响应于基于知识图谱的培训资源分配指令,获取单元110根据所述基于知识图谱的培训资源分配指令获取基础数据。
在本发明的至少一个实施例中,所述基于知识图谱的培训资源分配指令可以由负责分配培训资源的工作人员触发,也可以在区部领导想要了解培训情况时主动触发,本发明不限制。
在本实施例中,所述基础数据可以包括,但不限于以下一种或者多种数据的组合:
地区、营业区、营业部、培训课程、讲师、销售人员等。
在本发明的至少一个实施例中,所述获取单元110根据所述基于知识图谱的培训资源分配指令获取基础数据包括:
解析所述基于知识图谱的培训资源分配指令的方法体,得到所述基于知识图谱的培训资源分配指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
利用所述正则表达式在所述基于知识图谱的培训资源分配指令所携带的信息中进行遍历,并将遍历到的数据确定为数据库标识;
根据所述数据库标识调取目标数据库,并从所述目标数据库中获取数据作为所述基础数据。
其中,所述基于知识图谱的培训资源分配指令实质上是一条代码,在所述基于知识图谱的培训资源分配指令中,根据代码的编写原则,{}之间的内容被称之为所述方法体。
所述预设标签可以进行自定义配置,所述预设标签与数据库标识具有一一对应的关系,例如:所述预设标签可以是ID,进一步以所述预设标签建立正则表达式ID(),并以ID()进行遍历。
通过上实施方式,能够基于正则表达式及预设标签快速确定数据库标识,并进一步利用所述数据库标识调用目标数据库,以便从所述目标数据库中获取所述基础数据,作为后续建立知识图谱的数据基础。
预处理单元111对所述基础数据进行预处理,得到中间数据。
可以理解的是,在所述基础数据中,除了文本格式的数据外,还可能包括图片数据的数据,因此,为了便于数据处理,需要先对数据的格式进行统一。
具体地,所述预处理单元111对所述基础数据进行预处理,得到中间数据包括:
当所述基础数据为图片数据时,将所述基础数据转换为初始文本,对所述初始文本进行过滤及清洗,得到过滤后的文本,基于UTF-8(8-bit Unicode Transformation Format,8位元)编码算法对所述过滤后的文本进行编码,得到所述中间数据;或者
当所述基础数据为文本类型时,对所述基础数据进行过滤及清洗,得到过滤后的文本,基于UTF-8编码算法对所述过滤后的文本进行编码,得到所述中间数据。
其中,可以采用OCR(Optical Character Recognition,光学字符识别)算法将所述基础数据转换为所述初始文本,本发明不限制。
同时,通过所述UTF-8编码算法对所述过滤后的文本进行编码,能够对所述过滤后的文本执行全角半角符号转换及去除乱码等操作,并最终实现编码统一。
进一步地,所述中间数据可以是TXT文本格式,也可以是其他文本格式,本发明不限制。
通过上述实施方式,能够对所述基础数据进行过滤及清洗,以排除掉干扰信息,并进一步将所述基础数据转化为统一的文本格式,实现了数据格式的统一,便于后续基于所述中间数据执行数据处理。
识别单元112识别所述中间数据的实体,得到实体列表。
通过对所述基础数据进行预处理,得到的所述中间数据为非结构化数据,因此,需要对所述中间数据中的关键实体信息进行识别,相当于对所述中间数据进行序列标注。因此,首先要构建序列标注模型。
进一步地,在本实施例中,所述识别单元112识别所述中间数据的实体,得到实体列表包括:
将所述中间数据输入至预先训练的序列标注模型中,并获取Softmax层中每个序列位置上对应的各个标签的输出概率以及转移概率;
对于每个序列位置,计算各个标签的输出概率以及转移概率的和作为各个标签的分值;
将分值最高的标签确定为每个序列位置的输出标签;
组合每个序列位置的输出标签,得到所述实体列表。
例如:假如B-PER表示人名的首字符标记,E-PER表示人名的结尾字符标记,O表示独立字符标记,B-ORG表示培训机构名的首字符标记,I-ORG表示培训机构名的中间字符标记,那么通过对序列中相同类别的标记项进行合并,得到的实体列表中可以包括如下序列:序列(B,E),表示人名;序列(B,I,E),表示培训机构名;序列(O),表示独立字符。
需要说明的是,在将所述中间数据输入至预先训练的序列标注模型中前,还需要训练所述序列标注模型。
具体地,根据预先定义的标注需求配置序列标注模式;
将所述序列标注模式添加到Bi-LSTM+CRF模型中,得到所述序列标注模型。
其中,所述序列标注模式可以根据具体的标注需求进行配置。
例如:不可连续输出相同的标签等。
在上述实施方式中,Bi-LSTM(Bidirectional Long Short Term Memory,双向长短时记忆)层提供了长距离的依赖建模,加强了每个字符与上下文字符间的联系,而CRF(conditional random field,条件随机场)可以容纳任意的上下文信息,特征设计灵活,CRF层可以构建字符间的特征转移及对应关系,并同时考虑输出标签之间的顺序性,进而达到更准确的识别效果。
构建单元113基于所述实体列表构建培训资源知识图谱。
具体地,可以将所述实体列表中的所有实体作为知识图谱的节点或者边,并连接各个节点,最终得到所述培训资源知识图谱。
本实施例中构建的知识图谱的延展性及可用性较高,可快速应付新增需求。
具体地,每个节点与维度的构建方式如下:
① 对每个营业区部的关系做拆解及连接,以过往交往经验、地理关系、组织关系等为关系粗度进行修正及权重加成,关系越近距离设定越短。
② 将课程的培训记录及特征做整理,串起各类型标签及课程的关联性,课程间可以有上下游关联性。
③ 对每个代理人的课程培训记录与特征做串联,连接起代理人所属营业部、所有培训课程、所有课程的标签的记录。
在本实施例中,在构建的所述培训资源知识图谱中,可以包括“营业区-营业部-销售员-课程-讲师”间的多种关系,即所述培训资源知识图谱是一种多属性、多维度的培训关系网络。
例如,所述培训资源知识图谱可以包括,但不限于以下三种维度:
1. 营业区-营业部关系维度:通过地理位置,连接营业区、部间的关系,例如“杭州-杭州营业区(a)-杭州营业部(1)”及底下的销售人员等,并以历史区部交互经验、销售人员年资等作为关系粗度。
2. 培训资源关系:包含讲师及课程间的关系,课程的标签、各个营业部开过什么课程等。以开课频次作为关系粗度。
3. 人员与培训的关系:包含销售员上过什么课程、评价、反馈等。以评价作为关系粗度。
以上述三种维度的关系构建的所述培训资源知识图谱,包含地区、营业区、营业部、培训课程、讲师、销售人员等关系节点,以及开课、上课、教课、课程对应标签、所属区部等关系维度,是一种多重节点/关系的知识图谱,数据间关系的覆盖面较为全面。
遍历单元114获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图。
在本实施例中,所述待分配对象包括需要进行培训资源分配的部门或者个人,本发明不限制。
在本发明的至少一个实施例中,所述遍历单元114将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图包括:
获取所述待分配对象对应的待分配维度;
在每个待分配维度上,基于SPFA(Shortest Path Faster Algorithm,最短路径算法)算法在所述培训资源知识图谱中进行最短路径选择,得到每个待分配维度对应的最短路径;
整合每个待分配维度对应的最短路径,得到所述路径图。
例如:当所述待分配对象为节点u时,以所述节点u在第一维度上进行遍历,获取到最短路径对应的节点为节点v,则所述节点u与所述节点v间的路径为所述第一维度上的最短路径;再以所述节点u在第二维度上进行遍历,如果此时所述节点v的最短路径估计值有所调整,即所述节点v不在当前的队列中,所述节点u与所述节点v间的路径不再是所述第二维度上的最短路径,则将所述节点v放入队尾。以此类推,不断从所述培训资源知识图谱中选择节点进行如上松弛操作,直至队列空为止。最后,对每个维度上得到的最短路径进行整合,得到所述路径图。
需要说明的是,在传统的BFS(Breadth-First-Search,广度优先搜索算法)算法中,如果剔除了一个节点,那么该节点不会再进入队列参与后续的迭代过程。
本实施方式采用SPFA算法代替传统的BFS算法,剔除的节点可在出队列后再次被放入队列,也就是说,节点有改进后重新排序的可能,通过这样的反复迭代,能更好的描述课程评价提升的实际情况。
搜索单元115获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径。
可以理解的是,当所述基于知识图谱的培训资源分配指令被触发时,伴随指令即可直接获取到所述待分配对象的培训需求数据。
例如:所述需求数据可以为进行部级培训资源的分配,或者也可以为进行区级培训资源的分配。
所述培训需求数据与所述待分配维度具有对应关系。
在本发明的至少一个实施例中,所述搜索单元115根据所述培训需求数据在所述路径图中进行搜索,得到目标路径包括:
根据所述培训需求数据确定目标待分配维度;
从所述路径图中查询与所述目标待分配维度对应的路径;
将搜索到的路径确定为所述目标路径。
通过上述实施方式,能够基于知识图谱及多个维度实现对路径的自动规划,以便于后续根据查找到的路径进行培训资源推荐。
生成单元116根据所述目标路径生成培训资源推荐信息。
具体地,所述生成单元116根据所述目标路径生成培训资源推荐信息包括:
获取所述目标路径上的所有标签信息;
获取培训课程标签、授课单位标签及授课地点标签;
根据所述培训课程标签从所述所有标签信息中确定目标培训课程,根据所述授课单位标签从所述所有标签信息中获取目标授课单位,及根据所述授课地点标签从所述所有标签信息中获取目标授课地点;
根据所述目标培训课程、所述目标授课单位及所述目标授课地点生成所述培训资源推荐信息。
通过上述实施方式,能够基于生成的路径实现对培训资源的自动推荐,以辅助进行培训资源的分配。
需要说明的是,为了进一步保证数据的安全性,可以将所述培训资源知识图谱部署于区块链,以避免数据被恶意篡改。
由以上技术方案可以看出,本发明能够响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据,对所述基础数据进行预处理,得到中间数据,识别所述中间数据的实体,得到实体列表,基于所述实体列表构建培训资源知识图谱,构建的知识图谱的延展性及可用性较高,可快速应付新增需求,获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图,获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径,基于知识图谱及多个维度实现对路径的自动规划,以便于后续根据查找到的路径进行培训资源推荐,根据所述目标路径生成培训资源推荐信息,最终实现基于知识图谱及路径规划的培训资源推荐,以辅助进行培训资源的配置。
如图3所示,是本发明实现基于知识图谱的培训资源分配方法的较佳实施例的电子设备的结构示意图。
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于知识图谱的培训资源分配程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,所述电子设备1既可以是总线型结构,也可以是星形结构,所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(Secure Digital, SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于知识图谱的培训资源分配程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于知识图谱的培训资源分配程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于知识图谱的培训资源分配方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成获取单元110、预处理单元111、识别单元112、构建单元113、遍历单元114、搜索单元115、生成单元116。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述基于知识图谱的培训资源分配方法的部分。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器等。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器13逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图3仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种基于知识图谱的培训资源分配方法,所述处理器13可执行所述多个指令从而实现:
响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据;
对所述基础数据进行预处理,得到中间数据;
识别所述中间数据的实体,得到实体列表;
基于所述实体列表构建培训资源知识图谱;
获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图;
获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径;
根据所述目标路径生成培训资源推荐信息。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。本发明中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于知识图谱的培训资源分配方法,其特征在于,所述基于知识图谱的培训资源分配方法包括:
响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据;
对所述基础数据进行预处理,得到中间数据;
识别所述中间数据的实体,得到实体列表;
基于所述实体列表构建培训资源知识图谱;
获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图;
获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径;
根据所述目标路径生成培训资源推荐信息。
2.如权利要求1所述的基于知识图谱的培训资源分配方法,其特征在于,所述根据所述基于知识图谱的培训资源分配指令获取基础数据包括:
解析所述基于知识图谱的培训资源分配指令的方法体,得到所述基于知识图谱的培训资源分配指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
利用所述正则表达式在所述基于知识图谱的培训资源分配指令所携带的信息中进行遍历,并将遍历到的数据确定为数据库标识;
根据所述数据库标识调取目标数据库,并从所述目标数据库中获取数据作为所述基础数据。
3.如权利要求1所述的基于知识图谱的培训资源分配方法,其特征在于,所述对所述基础数据进行预处理,得到中间数据包括:
当所述基础数据为图片数据时,将所述基础数据转换为初始文本,对所述初始文本进行过滤及清洗,得到过滤后的文本,基于UTF-8编码算法对所述过滤后的文本进行编码,得到所述中间数据;或者
当所述基础数据为文本类型时,对所述基础数据进行过滤及清洗,得到过滤后的文本,基于UTF-8编码算法对所述过滤后的文本进行编码,得到所述中间数据。
4.如权利要求1所述的基于知识图谱的培训资源分配方法,其特征在于,所述识别所述中间数据的实体,得到实体列表包括:
将所述中间数据输入至预先训练的序列标注模型中,并获取Softmax层中每个序列位置上对应的各个标签的输出概率以及转移概率;
对于每个序列位置,计算各个标签的输出概率以及转移概率的和作为各个标签的分值;
将分值最高的标签确定为每个序列位置的输出标签;
组合每个序列位置的输出标签,得到所述实体列表。
5.如权利要求4所述的基于知识图谱的培训资源分配方法,其特征在于,所述方法还包括:
根据预先定义的标注需求配置序列标注模式;
将所述序列标注模式添加到Bi-LSTM+CRF模型中,得到所述序列标注模型。
6.如权利要求1所述的基于知识图谱的培训资源分配方法,其特征在于,所述将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图包括:
获取所述待分配对象对应的待分配维度;
在每个待分配维度上,基于SPFA算法在所述培训资源知识图谱中进行最短路径选择,得到每个待分配维度对应的最短路径;
整合每个待分配维度对应的最短路径,得到所述路径图。
7.如权利要求1所述的基于知识图谱的培训资源分配方法,其特征在于,所述根据所述培训需求数据在所述路径图中进行搜索,得到目标路径包括:
根据所述培训需求数据确定目标待分配维度;
从所述路径图中查询与所述目标待分配维度对应的路径;
将搜索到的路径确定为所述目标路径。
8.一种基于知识图谱的培训资源分配装置,其特征在于,所述基于知识图谱的培训资源分配装置包括:
获取单元,用于响应于基于知识图谱的培训资源分配指令,根据所述基于知识图谱的培训资源分配指令获取基础数据;
预处理单元,用于对所述基础数据进行预处理,得到中间数据;
识别单元,用于识别所述中间数据的实体,得到实体列表;
构建单元,用于基于所述实体列表构建培训资源知识图谱;
遍历单元,用于获取待分配对象,将所述待分配对象作为起始节点在所述培训资源知识图谱中进行图遍历,得到路径图;
搜索单元,用于获取所述待分配对象的培训需求数据,根据所述培训需求数据在所述路径图中进行搜索,得到目标路径;
生成单元,用于根据所述目标路径生成培训资源推荐信息。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的基于知识图谱的培训资源分配方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的基于知识图谱的培训资源分配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110059438.7A CN112380359B (zh) | 2021-01-18 | 2021-01-18 | 基于知识图谱的培训资源分配方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110059438.7A CN112380359B (zh) | 2021-01-18 | 2021-01-18 | 基于知识图谱的培训资源分配方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112380359A true CN112380359A (zh) | 2021-02-19 |
CN112380359B CN112380359B (zh) | 2021-04-20 |
Family
ID=74581941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110059438.7A Active CN112380359B (zh) | 2021-01-18 | 2021-01-18 | 基于知识图谱的培训资源分配方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112380359B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254218A (zh) * | 2021-06-22 | 2021-08-13 | 中国平安人寿保险股份有限公司 | 模型的资源部署方法、系统、设备及存储介质 |
CN113313433A (zh) * | 2021-07-13 | 2021-08-27 | 平安科技(深圳)有限公司 | 基于知识图谱的会议资源分配方法及相关设备 |
CN113408832A (zh) * | 2021-08-19 | 2021-09-17 | 国网浙江省电力有限公司 | 基于融合性地理关系的培训规划锚定方法、装置及中台 |
CN113592301A (zh) * | 2021-07-30 | 2021-11-02 | 国能大渡河大数据服务有限公司 | 一种员工培训管理方法及系统 |
CN113609281A (zh) * | 2021-08-09 | 2021-11-05 | 海南大学 | 基于dikw图谱的意图识别方法及装置 |
CN114491059A (zh) * | 2021-12-23 | 2022-05-13 | 北京科东电力控制系统有限责任公司 | 一种电网技能培训知识库构建方法及系统 |
CN117648179A (zh) * | 2023-11-23 | 2024-03-05 | 北京菱云科技有限公司 | 一种资源分配方法、装置、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180210913A1 (en) * | 2017-01-23 | 2018-07-26 | International Business Machines Corporation | Crowdsourced discovery of paths in a knowledge graph |
CN109670049A (zh) * | 2018-11-19 | 2019-04-23 | 平安科技(深圳)有限公司 | 图谱路径查询方法、装置、计算机设备和存储介质 |
CN109977283A (zh) * | 2019-03-14 | 2019-07-05 | 中国人民大学 | 一种基于知识图谱和用户足迹的旅游推荐方法和系统 |
CN111639498A (zh) * | 2020-04-21 | 2020-09-08 | 平安国际智慧城市科技股份有限公司 | 知识抽取方法、装置、电子设备及存储介质 |
CN111639266A (zh) * | 2020-04-16 | 2020-09-08 | 北京三快在线科技有限公司 | 推荐信息生成方法、装置、电子设备及可读存储介质 |
CN112116331A (zh) * | 2020-09-28 | 2020-12-22 | 中国建设银行股份有限公司 | 一种人才推荐方法及装置 |
CN112184500A (zh) * | 2019-07-03 | 2021-01-05 | 浙江有教信息科技有限公司 | 基于深度学习和知识图谱的课外学习辅导系统及实现方法 |
-
2021
- 2021-01-18 CN CN202110059438.7A patent/CN112380359B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180210913A1 (en) * | 2017-01-23 | 2018-07-26 | International Business Machines Corporation | Crowdsourced discovery of paths in a knowledge graph |
CN109670049A (zh) * | 2018-11-19 | 2019-04-23 | 平安科技(深圳)有限公司 | 图谱路径查询方法、装置、计算机设备和存储介质 |
CN109977283A (zh) * | 2019-03-14 | 2019-07-05 | 中国人民大学 | 一种基于知识图谱和用户足迹的旅游推荐方法和系统 |
CN112184500A (zh) * | 2019-07-03 | 2021-01-05 | 浙江有教信息科技有限公司 | 基于深度学习和知识图谱的课外学习辅导系统及实现方法 |
CN111639266A (zh) * | 2020-04-16 | 2020-09-08 | 北京三快在线科技有限公司 | 推荐信息生成方法、装置、电子设备及可读存储介质 |
CN111639498A (zh) * | 2020-04-21 | 2020-09-08 | 平安国际智慧城市科技股份有限公司 | 知识抽取方法、装置、电子设备及存储介质 |
CN112116331A (zh) * | 2020-09-28 | 2020-12-22 | 中国建设银行股份有限公司 | 一种人才推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
张迪: "基于知识图谱的教学资源推荐方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254218A (zh) * | 2021-06-22 | 2021-08-13 | 中国平安人寿保险股份有限公司 | 模型的资源部署方法、系统、设备及存储介质 |
CN113313433A (zh) * | 2021-07-13 | 2021-08-27 | 平安科技(深圳)有限公司 | 基于知识图谱的会议资源分配方法及相关设备 |
CN113592301A (zh) * | 2021-07-30 | 2021-11-02 | 国能大渡河大数据服务有限公司 | 一种员工培训管理方法及系统 |
CN113609281A (zh) * | 2021-08-09 | 2021-11-05 | 海南大学 | 基于dikw图谱的意图识别方法及装置 |
CN113408832A (zh) * | 2021-08-19 | 2021-09-17 | 国网浙江省电力有限公司 | 基于融合性地理关系的培训规划锚定方法、装置及中台 |
CN113408832B (zh) * | 2021-08-19 | 2021-11-02 | 国网浙江省电力有限公司 | 基于融合性地理关系的培训规划锚定方法、装置及中台 |
CN114491059A (zh) * | 2021-12-23 | 2022-05-13 | 北京科东电力控制系统有限责任公司 | 一种电网技能培训知识库构建方法及系统 |
CN117648179A (zh) * | 2023-11-23 | 2024-03-05 | 北京菱云科技有限公司 | 一种资源分配方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112380359B (zh) | 2021-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112380359B (zh) | 基于知识图谱的培训资源分配方法、装置、设备及介质 | |
CN112380859A (zh) | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 | |
CN115002200B (zh) | 基于用户画像的消息推送方法、装置、设备及存储介质 | |
CN107368521B (zh) | 一种基于大数据和深度学习的知识推介方法及系统 | |
CN112801718A (zh) | 用户行为预测方法、装置、设备及介质 | |
CN112288337B (zh) | 行为推荐方法、装置、设备及介质 | |
CN113946690A (zh) | 潜在客户挖掘方法、装置、电子设备及存储介质 | |
CN112380454A (zh) | 培训课程推荐方法、装置、设备及介质 | |
CN115081538A (zh) | 基于机器学习的客户关系识别方法、装置、设备及介质 | |
CN114781832A (zh) | 课程推荐方法、装置、电子设备及存储介质 | |
CN113887941A (zh) | 业务流程生成方法、装置、电子设备及介质 | |
CN113868528A (zh) | 资讯推荐方法、装置、电子设备及可读存储介质 | |
CN115293603A (zh) | 任务分配方法、装置、电子设备及计算机可读存储介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN112860851B (zh) | 基于根因分析的课程推荐方法、装置、设备及介质 | |
CN112396547B (zh) | 基于无监督学习的课程推荐方法、装置、设备及介质 | |
CN114003704A (zh) | 指定标签客群的创建方法、装置、电子设备及存储介质 | |
CN113505273A (zh) | 基于重复数据筛选的数据排序方法、装置、设备及介质 | |
CN112364068A (zh) | 课程标签生成方法、装置、设备及介质 | |
CN112307771B (zh) | 基于情感分析的课程分析方法、装置、设备及介质 | |
CN113268614B (zh) | 标签体系更新方法、装置、电子设备及可读存储介质 | |
CN114595321A (zh) | 问题标注方法、装置、电子设备及存储介质 | |
CN113657546A (zh) | 信息分类方法、装置、电子设备及可读存储介质 | |
CN113672722B (zh) | 线上课程智能推荐方法、装置、电子设备及存储介质 | |
CN113656703B (zh) | 基于新上线课程的智能推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |