CN107423399A - 一种基于知识图谱推理的科研项目申报信息语义推荐方法 - Google Patents
一种基于知识图谱推理的科研项目申报信息语义推荐方法 Download PDFInfo
- Publication number
- CN107423399A CN107423399A CN201710620616.2A CN201710620616A CN107423399A CN 107423399 A CN107423399 A CN 107423399A CN 201710620616 A CN201710620616 A CN 201710620616A CN 107423399 A CN107423399 A CN 107423399A
- Authority
- CN
- China
- Prior art keywords
- information
- scientific research
- collection
- declared
- requirements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011160 research Methods 0.000 title claims abstract description 162
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000013507 mapping Methods 0.000 claims abstract description 40
- 239000012141 concentrate Substances 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 13
- 230000010354 integration Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000005194 fractionation Methods 0.000 claims description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于知识图谱推理的科研项目申报信息语义推荐方法,本发明放方法首先对个人信息、科研申报信息的采集并转化为个人信息知识图谱和科研申报信息知识图谱,然后根据语义逻辑对个人信息知识图谱与科研申报信息知识图谱进行语义约束并定义推理方法,最后根据语义逻辑逆推理对科研申报信息进行推荐,实现了对科研项目申报信息推荐高度支持、计算复杂度低,而且能处理科研人员具有大量科研背景下的推荐。
Description
技术领域
本发明涉及推荐系统算法领域,更具体地,涉及一种基于知识图谱推理的科研项目申报信息语义推荐方法。
背景技术
互联网信息的传递与呈现突破传统时空观念,表现出极大的时效性与多样化,人们每天在从各个信息流中快速获取大量信息的同时,难免会有部分信息遗漏的可能性。对于科研工作人员来说,能够快速获得项目申报信息尤其重要。推荐系统具有个性化、人性化和社交化的特点,以服务读者为核心,整合数字资源,其主要任务是联系用户和资源,价值信息的同时,也能让有潜在价值的信息主动呈现在用户面前。推荐系统针对不同的服务对象,分为基于全体用户的推荐和基于单个用户的推荐(即个性化推荐),对于个性化推荐也有广泛的研究,如协同过滤系统、基于内容推荐系统、基于网络结构的推荐算法等等。以协同过滤为例,利用用户的历史信息计算用户之间相似性,然后利用与目标用户相似性较高的邻居对其他产品的评价预测目标用户对特定产品的喜好成都,根据这一喜好程度来对目标用户进行推荐。对于科研项目申报信息的推荐系统还未有成型的推荐系统和有效的应用。
现有技术的主要缺陷在于:(1)传统的推荐系统算法主要缺点在于计算复杂度高,对科研项目申报信息推荐支持较少;(2)利用单元特征的推荐算法在对科研信息的推荐在科研人员具有大量的科研背景下不能取到满意的推荐效果。
发明内容
本发明为提供一种基于知识图谱推理的科研项目申报信息语义推荐方法,该方法对科研项目申报信息推荐高度支持、计算复杂度低,而且能处理科研人员具有大量科研背景下的推荐。
为了达到上述技术效果,本发明的技术方案如下:
一种基于知识图谱推理的科研项目申报信息语义推荐方法,包括以下步骤:
S1:将个人信息转换成知识图谱;
S2:将科研申报信息转换成知识图谱;
S3:将得到的个人信息知识图谱和科研申报信息知识图谱进行语义逻辑逆推理;
S4:计算科研申报信息剩余时间分数;
S5:利用步骤S4得到的结果进行语义推荐。
进一步地,所述步骤S1的具体过程如下:
S11:建立用户的个人信息集,并通过用户所在院校、姓名等信息在知网、万方学术网站收集到用户曾发表的学术论文,将曾发表的学术论文信息整合后建立多个领域关键词,将领域关键词添加到个人信息集形成新的个人信息集;
S12:在个人信息知识图谱中以姓名、性别、职称、学历、研究领域、工作单位关键词建立多个“申报条件”,同时建立“申报符合”的ObjectPropert属性;
S13:将步骤S11建立的个人信息集内容转化为个人信息知识图谱的“申报条件”下的单独个体;
S14:将姓名与其他个人信息分别做个体关联,其中以“申报符合”为关联属性。
S15:定义两个得分变量Conform和Condition,其中Conform为满足科研项目申报条件数,Condition为个人所拥有的科研条件数。
进一步地,所述步骤S2的具体过程如下:
S21:把常见的职称、年龄、研究领域申报要求类别进行收集整合,根据整合后的申报要求类别的内容定义过滤规则并定义申报要求集;
S22:采集科研申报信息;
S23:在科研申报信息知识图谱中建立:“姓名”、“申报范围”、“申报级别”、申报要求的多个类别、不符合申报要求的多个类别,同时建立“的身份”的ObjectPropert属性;
S24:对步骤S22的科研申报信息集进行申报要求信息提取;
S25:科研申报信息的知识图谱转换。
进一步地,所述步骤S22的过程是:
S221:对各级别教育厅公告、各大高校科研处和已有的科研项目申报信息网站进行实时监控;
S222:将各级别教育厅下发的公告内容采集后,根据标题、正文内容、发布栏目名称的信息源对公告进行过滤提取出科研项目申报公告,将公告中的科研申报信息放入科研申报信息集中;
S223:将各大高校科研处发布的科研申报信息的公告内容采集后放入科研申报信息集中;
S224:将已有的科研项目申报信息网站所发布的申报信息采集后放入科研申报信息集中;
S225:将步骤S222、步骤S223、步骤S224的科研申报信息集中每一条科研申报信息根据其内容提取范围和级别的关键词作“申报范围”和“申报级别”的标记。
进一步地,所述步骤S23中在“申报符合”的ObjectPropert属性中,将Domain定义为“姓名”,将Range定义为“申报要求”;对步骤S23中建立的类别做以下定义:disjointWith(C1,C2),其中C1是“申报要求”,C2是“非申报要求”。
进一步地,所述步骤S24的过程是:
S241:将科研申报信息的标题、正文逐句进行词语拆分放入到一个结果集中;
S242:对步骤S241中的结果集使用步骤S21中定义的过滤规则进行结果过滤,将科研申报信息中出现的申报要求信息每一项都单独的放入到申报要求信息集中;
S243:利用正则表达式提取项目申报截止时间,同时记录当前文章时间,将两个时间放到时间集中。
进一步地,所述步骤S25的过程是:
S251:在科研申报信息的知识图谱中,将步骤S242中的申报要求信息集中的每一项申报要求作为“申报要求”类别下的单独个体;
S252:把步骤S242的申报要求结信息集与步骤S21中的申报要求集进行匹配,提取出没有成功匹配的申报要求,并将没有成功匹配到的申报要求的每一项都单独的放入到非申报要求信息集中;
S253:在科研申报信息的知识图谱中,将步骤S252的申报要求信息集的每一项申报要求作为“非申报要求”类别下的单独个体;
S254:在科研申报信息的知识图谱中,将步骤S225做的“申报范围”和“申报级别”标记的关键词分别作为“申报范围”和“申报级别”类下的个体。
进一步地,所述步骤S3的过程是:
S31:根据步骤S2所转换完成的科研申报信息知识图谱得出以下关系:IndividualOf(I,C1)→IndividualOf(I,C2)or IndividualOf(I,C3),其中,I为个人信息知识图谱中的“工作单位”下的个体,C1为“工作单位”,C2为“申报范围”,C3为“申报性质”‘’
S32:通过步骤S232中的定义,我们可以得出两种结果:①ContainOf(I,C2,C3),此时个人条件满足申报范围与申报性质;②NotContainOf(I,C2,C3),此时个人条件不满足申报范围与申报性质。
进一步地,所述步骤S4的过程是:
S41:将步骤S243的时间集中截止时间与当前时间,以天为单位相减得到剩余时间TimeLeft=剩余时间=截止时间-当前时间;
S42:时间剩余分数计算公式:其中dx为中心值设置函数;
S43:将步骤S42计算出的TimeLeftScore的值放入分数集中。
进一步地,所述步骤S5的过程包括主动推荐和被动推荐;
所述主动推荐的过程是:
S511:当有新的科研申报信息被采集,经过步骤S2转换成科研申报信息知识图谱后,分别将步骤S1转换完成的个人申报信息知识图谱进行匹配;
S512:通过步骤S3的语义逻辑逆推理过程,得出两种结果:①当个人条件不满足时,将不再进行推荐过程;②当个人条件满足时,将进行以下推荐过程;
S513:将科研申报信息知识图谱与个人申报信息知识图谱进行步骤S3的可满足性的语义推理,可得出共满足条件数Conform;
S514:将步骤S513得出的Conform与步骤S15的Condition进行以下计算得出Score:
S515:将步骤S513计算出的Score的值放入分数集中;
S516:将时间集中的当前时间与申报截止时间根据步骤S4的定义剩余时间分数得出TimeLeftScore;
S517:通过步骤S515和步骤S516所计算得出的Score和TimeLeftScore进行以下判断,对Score的分支评定为相关和不相关等级,对TimeLeftScore分值评定为紧急、警告、一般等级:①TimeLeftScore>=X为紧急,②X>TimeLeftScore>=Y为警告,③Y>TimeLeftScore>0为一般,其中X>Y;
S518:(一)当Score的等级为相关时,①当TimeLeftScore等级为紧急时,系统将该科研申报信息以短信形式推荐给科研人员;②当TimeLeftScore等级为警告时,系统将该科研申报信息以邮件形式推荐给科研人员;③当TimeLeftScore等级为一般时,系统将该科研申报信息以站内信形式推荐给科研人员;(二)当Score的等级为不相关时,系统不对该科研申报信息进行推荐;
所述被动推荐的过程是:
S521:在已有的检索结果相关性打分公式上加入剩余时间分数得到新的相关性分数;
S522:根据步骤S4重新计算剩余时间分数并放入时间集中;
S523:定义相关性打分公式:其中为查询向量,为文档向量,TimeLeftScore为剩余时间分数。
S524:根据步骤S523定义的公式可以计算出用户在搜索时的搜索结果相关性分数,将按从高到低进行排序。
与现有技术相比,本发明技术方案的有益效果是:
本发明放方法首先对个人信息、科研申报信息的采集并转化为个人信息知识图谱和科研申报信息知识图谱,然后根据语义逻辑对个人信息知识图谱与科研申报信息知识图谱进行语义约束并定义推理方法,最后根据语义逻辑逆推理对科研申报信息进行推荐,实现了对科研项目申报信息推荐高度支持、计算复杂度低,而且能处理科研人员具有大量科研背景下的推荐。
附图说明
图1为本发明方法的流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种基于知识图谱推理的科研项目申报信息语义推荐方法,其具体过程如下:
(1)将个人信息转换成知识图谱:
(1-1)通过采集个人信息:
(1-1-1)让用户在系统中相应类别下填入个人信息,将填入的信息放到个人信息集中;
(1-1-2)通过用户所在院校、姓名等信息在知网、万方等学术网站收集到用户曾发表的学术论文,将曾发表的学术论文信息整合后建立多个领域关键词,将领域关键词添加到步骤(1-1-1)中的个人信息集形成新的个人信息集;
(1-2)在个人信息知识图谱中以姓名、性别、职称、学历、研究领域、工作单位等关键词建立多个“申报条件”,同时建立”申报符合”的ObjectPropert属性;
(1-3)将步骤(1-1-2)的个人信息集内容转化为个人信息知识图谱的“申报条件”下的单独个体;
(1-4)将姓名与其他个人信息分别做个体关联,其中以“申报符合”为关联属性。
(1-5)定义两个得分变量Conform和Condition,其中Conform为满足科研项目申报条件数,Condition为个人所拥有的科研条件数;
(2)将科研申报信息转换成知识图谱:
(2-1)把常见的职称、年龄、研究领域等申报要求类别进行收集整合,根据整合后的申报要求类别的内容定义过滤规则并定义申报要求集;
(2-2)采集科研申报信息:
(2-2-1)对各级别教育厅公告、各大高校科研处和已有的科研项目申报信息网站进行实时监控;
(2-2-2)将各级别教育厅下发的公告内容采集后,根据标题、正文内容、发布栏目名称的等信息源对公告进行过滤提取出科研项目申报公告,将公告中的科研申报信息放入科研申报信息集中;
(2-2-3)将各大高校科研处发布的科研申报信息的公告内容采集后放入科研申报信息集中;
(2-2-4)将已有的科研项目申报信息网站所发布的申报信息采集后放入科研申报信息集中;
(2-2-5)将步骤(2-2-2)、步骤(2-2-3)、步骤(2-2-4)的科研申报信息集中每一条科研申报信息根据其内容提取范围和级别的关键词作“申报范围”和“申报级别”的标记;
(2-3)在科研申报信息知识图谱中建立:“姓名”、“申报范围”、“申报级别”、申报要求的多个类别(此处统称“申报要求”)、不符合申报要求的多个类别(此处统称为“非申报要求”),同时建立“的身份”的ObjectPropert属性;
(2-3-1)在“申报符合”的ObjectPropert属性中,将Domain定义为“姓名”,将Range定义为“申报要求”;
(2-3-2)对步骤(2-3)中建立的类别做以下定义:disjointWith(C1,C2,其中C1是“申报要求”,C2是“非申报要求”;
(2-4)对步骤(2-2)的科研申报信息集进行申报要求信息提取:
(2-4-1)将科研申报信息的标题、正文逐句进行词语拆分放入到一个结果集中;
(2-4-2)对步骤(2-4-1)中的结果集使用步骤(2-1)中定义的过滤规则进行结果过滤,将科研申报信息中出现的申报要求信息每一项都单独的放入到申报要求信息集中;
(2-4-3)利用正则表达式提取项目申报截止时间,同时记录当前文章时间,将两个时间放到时间集中;
(2-5)科研申报信息的知识图谱转换过程:
(2-5-1)在科研申报信息的知识图谱中,将步骤(2-4-2)中的申报要求信息集中的每一项申报要求作为“申报要求”类别下的单独个体;
(2-5-2)把步骤(2-4-2)的申报要求结信息集与步骤(2-1)中的申报要求集进行匹配,提取出没有成功匹配的申报要求,并将没有成功匹配到的申报要求的每一项都单独的放入到非申报要求信息集中;
(2-5-3)在科研申报信息的知识图谱中,将步骤(2-5-2)的申报要求信息集的每一项申报要求作为“非申报要求”类别下的单独个体;
(2-5-4)在科研申报信息的知识图谱中,将步骤(2-2-5)做的“申报范围”和“申报级别”标记的关键词分别作为“申报范围”和“申报级别”类下的个体;
(3)语义逻辑逆推理过程:
(3-1)根据步骤(2)所转换完成的科研申报信息知识图谱可以可以得出一下关系:IndividualOf(I,C1)→IndividualOf(I,C2)or IndividualOf(I,C3),其中,I为个人信息知识图谱中的“工作单位”下的个体,C1为“工作单位”,C2为“申报范围”,C3为“申报性质”;
(3-2)通过步骤(2-3-2)中的定义,我们可以得出两种结果:①ContainOf(I,C2,C3),此时个人条件满足申报范围与申报性质;②NotContainOf(I,C2,C3),此时个人条件不满足申报范围与申报性质;
(4)可满足性的语义推理过程:
(4-1)将步骤(1)所转换完成的个人信息知识图谱和步骤(2)所转换完成的科研申报信息知识图谱进行推理;
(4-2)根据步骤(2-3-2)所提出的定义其推理过程如下:
(4-2-1)根据步骤(1-3)与步骤(2-5-3)的可以得出以下关系IndividualOf(I,C1)→IndividualOf(I,C2)or IndividualOf(I,C3),其中,I为个人信息知识图谱中的”申报条件”下的个体,C1为个人信息知识图谱中的“申报条件”,C2为科研申报信息中的“申报要求”,C3为科研申报信息中的“非申报要求”;
(4-2-2)由步骤(4-2-1)的关系与在步骤(2-3-2)中的定义可以得出两种推理结果:①SatisfiablilityOf(I,C2),NotSatisfiablilityOf(I,C3),此时个人信息申报条件与科研申报信息申报要求相符,则在步骤(1-5)中定义的Conform的值加1;②NotSatisfiablilityOf(I,C2),SatisfiablilityOf(I,C3),此时个人信息申报条件与科研申报信息申报要求不符,则在步骤(1-5)中定义的Conform的值加0;
(5)计算科研申报信息剩余时间分数:
(5-1)将步骤(2-4-3)的时间集中截止时间与当前时间,以天为单位相减得到剩余时间TimeLeft=剩余时间=截止时间-当前时间;
(5-2)时间剩余分数计算公式:其中dx为中心值设置函数;
(5-3)将步骤(5-2)计算出的TimeLeftScore的值放入分数集中;
(6)语义推荐方法
(6-1)主动推荐方法
(6-1-1)当有新的科研申报信息被采集,经过步骤(2)转换成科研申报信息知识图谱后,分别将步骤(1)转换完成的个人申报信息知识图谱进行匹配;
(6-1-2)通过步骤(3)的语义逻辑逆推理过程,我们可以得出两种结果:①当个人条件不满足时,将不再进行推荐过程;②当个人条件满足时,将进行以下推荐过程;
(6-1-3)将科研申报信息知识图谱与个人申报信息知识图谱进行步骤(3)的可满足性的语义推理,可得出共满足条件数Conform;
(6-1-4)将步骤(6-1-3)得出的Conform与步骤(1-5)的Condition进行以下计算得出Score:
(6-1-5)将步骤(6-1-3)计算出的Score的值放入分数集中;
(6-1-6)将时间集中的当前时间与申报截止时间根据步骤(5)的定义剩余时间分数得出TimeLeftScore;
(6-1-8)通过步骤(6-1-5)和步骤(6-1-6)所计算得出的Score和TimeLeftScore进行以下判断,对Score的分支评定为相关和不相关等级,对TimeLeftScore分值评定为紧急、警告、一般等级:①TimeLeftScore>=X为紧急,②X>TimeLeftScore>=Y为警告,③Y>TimeLeftScore>0为一般,其中X>Y;6-1-8)(一)当Score的等级为相关时,①当TimeLeftScore等级为紧急时,系统将该科研申报信息以短信形式推荐给科研人员;②当TimeLeftScore等级为警告时,系统将该科研申报信息以邮件形式推荐给科研人员;③当TimeLeftScore等级为一般时,系统将该科研申报信息以站内信形式推荐给科研人员;(二)当Score的等级为不相关时,系统不对该科研申报信息进行推荐;
(6-2)被动推荐方法
(6-2-1)在已有的检索结果相关性打分公式上加入剩余时间分数得到新的相关性分数;
(6-2-2)根据步骤(5)重新计算剩余时间分数并放入时间集中;
(6-2-3)定义相关性打分公式:其中为查询向量,为文档向量,TimeLeftScore为剩余时间分数。
(6-2-4)根据步骤(6-2-3)定义的公式可以计算出用户在搜索时的搜索结果相关性分数,将按从高到低进行排序。
以XML语言建立本体模型及推理示例
(7-1)对步骤(1-1)的个人信息集中选取姓名、职称相关信息转换成个人信息知识图谱;
(7-1-1)在个人信息知识图谱中建立“姓名”和“职称”两个类别,同时建立“的职称”的ObjectPropert属性;
(7-1-2)在“姓名”的类别下建立“张三”的个体,在“职称”的类别下建立“讲师”的个体,同时将“张三”与“讲师”以“的职称”为关联属性;
(7-2)对步骤(2-2)的科研申报信息集中选取职称的相关信息转换成科研申报信息知识图谱;
(7-2-1)在科研申报信息知识图谱中建立“姓名”、“中级以上职称”和“中级及以下职称”三个类别,同时建立“的职称”的ObjectPropert属性;
(7-2-2)根据步骤(2-3-1)的定义,在“的职称”的ObjectPropert属性中,将Domain定义为“姓名”,Range定义为“中级以上职称”;
(7-2-3)对步骤(7-2-2)的建立的类别建立以下定义disjointWith(“中级以上职称”,“中级及以下职称");
(7-2-4)在“中级以上职称”的类别下建立“教授”、“副教授”的个体,在“中级以下职称”的类别下建立“讲师”的个体;
(7-3)将步骤(7-1)的所转换完成的个人信息知识图谱和步骤(2)所转换完成的科研申报信息知识图谱进行推理,根据步骤(2-3-2)所提出的定义其推理过程如下:
(7-3-1)根据步骤(7-2)与步骤(7-2-4)的可以得出以下关系IndividualOf(“讲师”,“职称”)→IndividualOf(“讲师”,“中级及以下职称”);
(7-3-2)根据步骤(7-3-2)的关系与步骤(7-2-3)的定义可推理出:①SatisfiablilityOf("讲师","中级及以下职称"),NotSatisfiablilityOf("讲师","中级以上职称"),此时Conform的值将会加1。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,包括以下步骤:
S1:将个人信息转换成知识图谱;
S2:将科研申报信息转换成知识图谱;
S3:将得到的个人信息知识图谱和科研申报信息知识图谱进行语义逻辑逆推理;
S4:计算科研申报信息剩余时间分数;
S5:利用步骤S4得到的结果进行语义推荐。
2.根据权利要求1所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S1的具体过程如下:
S11:建立用户的个人信息集,并通过用户所在院校、姓名等信息在知网、万方学术网站收集到用户曾发表的学术论文,将曾发表的学术论文信息整合后建立多个领域关键词,将领域关键词添加到个人信息集形成新的个人信息集;
S12:在个人信息知识图谱中以姓名、性别、职称、学历、研究领域、工作单位关键词建立多个“申报条件”,同时建立“申报符合”的ObjectPropert属性;
S13:将步骤S11建立的个人信息集内容转化为个人信息知识图谱的“申报条件”下的单独个体;
S14:将姓名与其他个人信息分别做个体关联,其中以“申报符合”为关联属性。
S15:定义两个得分变量Conform和Condition,其中Conform为满足科研项目申报条件数,Condition为个人所拥有的科研条件数。
3.根据权利要求2所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S2的具体过程如下:
S21:把常见的职称、年龄、研究领域申报要求类别进行收集整合,根据整合后的申报要求类别的内容定义过滤规则并定义申报要求集;
S22:采集科研申报信息;
S23:在科研申报信息知识图谱中建立:“姓名”、“申报范围”、“申报级别”、申报要求的多个类别、不符合申报要求的多个类别,同时建立“的身份”的ObjectPropert属性;
S24:对步骤S22的科研申报信息集进行申报要求信息提取;
S25:科研申报信息的知识图谱转换。
4.根据权利要求3所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S22的过程是:
S221:对各级别教育厅公告、各大高校科研处和已有的科研项目申报信息网站进行实时监控;
S222:将各级别教育厅下发的公告内容采集后,根据标题、正文内容、发布栏目名称的信息源对公告进行过滤提取出科研项目申报公告,将公告中的科研申报信息放入科研申报信息集中;
S223:将各大高校科研处发布的科研申报信息的公告内容采集后放入科研申报信息集中;
S224:将已有的科研项目申报信息网站所发布的申报信息采集后放入科研申报信息集中;
S225:将步骤S222、步骤S223、步骤S224的科研申报信息集中每一条科研申报信息根据其内容提取范围和级别的关键词作“申报范围”和“申报级别”的标记。
5.根据权利要求4所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S23中在“申报符合”的ObjectPropert属性中,将Domain定义为“姓名”,将Range定义为“申报要求”;对步骤S23中建立的类别做以下定义:disjointWith(C1,C2),其中C1是“申报要求”,C2是“非申报要求”。
6.根据权利要求5所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S24的过程是:
S241:将科研申报信息的标题、正文逐句进行词语拆分放入到一个结果集中;
S242:对步骤S241中的结果集使用步骤S21中定义的过滤规则进行结果过滤,将科研申报信息中出现的申报要求信息每一项都单独的放入到申报要求信息集中;
S243:利用正则表达式提取项目申报截止时间,同时记录当前文章时间,将两个时间放到时间集中。
7.根据权利要求6所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S25的过程是:
S251:在科研申报信息的知识图谱中,将步骤S242中的申报要求信息集中的每一项申报要求作为“申报要求”类别下的单独个体;
S252:把步骤S242的申报要求结信息集与步骤S21中的申报要求集进行匹配,提取出没有成功匹配的申报要求,并将没有成功匹配到的申报要求的每一项都单独的放入到非申报要求信息集中;
S253:在科研申报信息的知识图谱中,将步骤S252的申报要求信息集的每一项申报要求作为“非申报要求”类别下的单独个体;
S254:在科研申报信息的知识图谱中,将步骤S225做的“申报范围”和“申报级别”标记的关键词分别作为“申报范围”和“申报级别”类下的个体。
8.根据权利要求7所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S3的过程是:
S31:根据步骤S2所转换完成的科研申报信息知识图谱得出以下关系:IndividualOf(I,C1)→IndividualOf(I,C2)or IndividualOf(I,C3),其中,I为个人信息知识图谱中的“工作单位”下的个体,C1为“工作单位”,C2为“申报范围”,C3为“申报性质”‘’
S32:通过步骤S232中的定义,我们可以得出两种结果:①ContainOf(I,C2,C3),此时个人条件满足申报范围与申报性质;②NotContainOf(I,C2,C3),此时个人条件不满足申报范围与申报性质。
9.根据权利要求8所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S4的过程是:
S41:将步骤S243的时间集中截止时间与当前时间,以天为单位相减得到剩余时间TimeLeft=剩余时间=截止时间-当前时间;
S42:时间剩余分数计算公式:其中dx为中心值设置函数;
S43:将步骤S42计算出的TimeLeftScore的值放入分数集中。
10.根据权利要求9所述的基于知识图谱推理的科研项目申报信息语义推荐方法,其特征在于,所述步骤S5的过程包括主动推荐和被动推荐;
所述主动推荐的过程是:
S511:当有新的科研申报信息被采集,经过步骤S2转换成科研申报信息知识图谱后,分别将步骤S1转换完成的个人申报信息知识图谱进行匹配;
S512:通过步骤S3的语义逻辑逆推理过程,得出两种结果:①当个人条件不满足时,将不再进行推荐过程;②当个人条件满足时,将进行以下推荐过程;
S513:将科研申报信息知识图谱与个人申报信息知识图谱进行步骤S3的可满足性的语义推理,可得出共满足条件数Conform;
S514:将步骤S513得出的Conform与步骤S15的Condition进行以下计算得出Score:
S515:将步骤S513计算出的Score的值放入分数集中;
S516:将时间集中的当前时间与申报截止时间根据步骤S4的定义剩余时间分数得出TimeLeftScore;
S517:通过步骤S515和步骤S516所计算得出的Score和TimeLeftScore进行以下判断,对Score的分支评定为相关和不相关等级,对TimeLeftScore分值评定为紧急、警告、一般等级:①TimeLeftScore>=X为紧急,②X>TimeLeftScore>=Y为警告,③Y>TimeLeftScore>0为一般,其中X>Y;
S518:(一)当Score的等级为相关时,①当TimeLeftScore等级为紧急时,系统将该科研申报信息以短信形式推荐给科研人员;②当TimeLeftScore等级为警告时,系统将该科研申报信息以邮件形式推荐给科研人员;③当TimeLeftScore等级为一般时,系统将该科研申报信息以站内信形式推荐给科研人员;(二)当Score的等级为不相关时,系统不对该科研申报信息进行推荐;
所述被动推荐的过程是:
S521:在已有的检索结果相关性打分公式上加入剩余时间分数得到新的相关性分数;
S522:根据步骤S4重新计算剩余时间分数并放入时间集中;
S523:定义相关性打分公式:其中为查询向量,为文档向量,TimeLeftScore为剩余时间分数。
S524:根据步骤S523定义的公式可以计算出用户在搜索时的搜索结果相关性分数,将按从高到低进行排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710620616.2A CN107423399B (zh) | 2017-07-26 | 2017-07-26 | 一种基于知识图谱推理的科研项目申报信息语义推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710620616.2A CN107423399B (zh) | 2017-07-26 | 2017-07-26 | 一种基于知识图谱推理的科研项目申报信息语义推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107423399A true CN107423399A (zh) | 2017-12-01 |
CN107423399B CN107423399B (zh) | 2020-12-15 |
Family
ID=60431173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710620616.2A Active CN107423399B (zh) | 2017-07-26 | 2017-07-26 | 一种基于知识图谱推理的科研项目申报信息语义推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107423399B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109062961A (zh) * | 2018-06-27 | 2018-12-21 | 淮阴工学院 | 一种基于知识图谱的专家组合推荐方法 |
CN110458522A (zh) * | 2019-08-02 | 2019-11-15 | 镇江方略科技咨询有限公司 | 一种科技项目智能咨询系统及方法 |
CN111008809A (zh) * | 2019-07-18 | 2020-04-14 | 宁波大学 | 基于科研能力数据的科研项目申报智能匹配推送方法 |
CN112800243A (zh) * | 2021-02-04 | 2021-05-14 | 天津德尔塔科技有限公司 | 一种基于知识图谱的项目预算分析方法及系统 |
CN114925190A (zh) * | 2022-05-30 | 2022-08-19 | 南瑞集团有限公司 | 一种基于规则推理与gru神经网络推理的混合推理方法 |
CN117236754A (zh) * | 2023-09-12 | 2023-12-15 | 杭州湘云信息技术有限公司 | 高校科研数据管理方法、装置、计算机设备及存储介质 |
CN117633255A (zh) * | 2024-01-25 | 2024-03-01 | 中国标准化研究院 | 一种基于主动标识的科技资源标识解析方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323622A (ja) * | 2006-05-31 | 2007-12-13 | Tokuaki Matsuo | 研究者支援システム |
RU2008140331A (ru) * | 2008-10-10 | 2010-04-20 | Иван Васильевич Коваль (RU) | Социолого-управленческий способ актуализации инновационно-изобретательского потенциала студентов инженерного профиля |
CN106383876A (zh) * | 2016-09-09 | 2017-02-08 | 上海润吧信息技术有限公司 | 一种智能化的项目匹配系统 |
CN106600232A (zh) * | 2016-12-19 | 2017-04-26 | 广东技术师范学院 | 一种个性化的项目申报信息推送系统与方法 |
-
2017
- 2017-07-26 CN CN201710620616.2A patent/CN107423399B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323622A (ja) * | 2006-05-31 | 2007-12-13 | Tokuaki Matsuo | 研究者支援システム |
RU2008140331A (ru) * | 2008-10-10 | 2010-04-20 | Иван Васильевич Коваль (RU) | Социолого-управленческий способ актуализации инновационно-изобретательского потенциала студентов инженерного профиля |
CN106383876A (zh) * | 2016-09-09 | 2017-02-08 | 上海润吧信息技术有限公司 | 一种智能化的项目匹配系统 |
CN106600232A (zh) * | 2016-12-19 | 2017-04-26 | 广东技术师范学院 | 一种个性化的项目申报信息推送系统与方法 |
Non-Patent Citations (2)
Title |
---|
吴仁克: ""科技项目评审专家智能检索与推荐系统的研究与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
潘颖: ""科研项目申报管理系统的研究与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109062961A (zh) * | 2018-06-27 | 2018-12-21 | 淮阴工学院 | 一种基于知识图谱的专家组合推荐方法 |
CN111008809A (zh) * | 2019-07-18 | 2020-04-14 | 宁波大学 | 基于科研能力数据的科研项目申报智能匹配推送方法 |
CN111008809B (zh) * | 2019-07-18 | 2023-04-18 | 宁波大学 | 基于科研能力数据的科研项目申报智能匹配推送方法 |
CN110458522A (zh) * | 2019-08-02 | 2019-11-15 | 镇江方略科技咨询有限公司 | 一种科技项目智能咨询系统及方法 |
CN110458522B (zh) * | 2019-08-02 | 2022-12-09 | 江苏方略科技信息有限公司 | 一种科技项目智能咨询系统及方法 |
CN112800243A (zh) * | 2021-02-04 | 2021-05-14 | 天津德尔塔科技有限公司 | 一种基于知识图谱的项目预算分析方法及系统 |
CN114925190A (zh) * | 2022-05-30 | 2022-08-19 | 南瑞集团有限公司 | 一种基于规则推理与gru神经网络推理的混合推理方法 |
CN114925190B (zh) * | 2022-05-30 | 2023-08-04 | 南瑞集团有限公司 | 一种基于规则推理与gru神经网络推理的混合推理方法 |
CN117236754A (zh) * | 2023-09-12 | 2023-12-15 | 杭州湘云信息技术有限公司 | 高校科研数据管理方法、装置、计算机设备及存储介质 |
CN117633255A (zh) * | 2024-01-25 | 2024-03-01 | 中国标准化研究院 | 一种基于主动标识的科技资源标识解析方法及系统 |
CN117633255B (zh) * | 2024-01-25 | 2024-04-05 | 中国标准化研究院 | 一种基于主动标识的科技资源标识解析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107423399B (zh) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107423399A (zh) | 一种基于知识图谱推理的科研项目申报信息语义推荐方法 | |
Deng et al. | Smart generation system of personalized advertising copy and its application to advertising practice and research | |
Schultz | Strategies for promoting proenvironmental behavior | |
RU2700191C1 (ru) | Способ и устройство выявления сходства | |
CN107133214A (zh) | 一种基于评论信息的产品需求偏好特征挖掘及其质量评估方法 | |
Zand Hessami et al. | Investigation of major factors influencing green purchasing behavior: Interactive approach | |
Prabhakaran et al. | Detection of paradigm shifts and emerging fields using scientific network: A case study of Information Technology for Engineering | |
Li et al. | Based on computational communication paradigm: simulation of public opinion communication process of panic buying during the COVID-19 pandemic | |
Lian et al. | Practical lessons for job recommendations in the cold-start scenario | |
Goldberg et al. | On the relationship between attitudes and environmental behaviors of key Great Barrier Reef user groups | |
Shen et al. | The research of motivation for word-of-mouth: Based on the self-determination theory | |
Dragoni | A three-phase approach for exploiting opinion mining in computational advertising | |
CN111191099B (zh) | 一种基于社交媒体的用户活动类型识别方法 | |
Demirbaş | An overview on traditional and electronic word of mouth communication (WOM) | |
Li et al. | How framing effect impact on decision making on internet shopping | |
Wilson et al. | ‘Bad for the penguins… because they need ice and that to live on’: an exploratory study into the environmental views, concerns and knowledge of socially disadvantaged young people | |
Svensson | Achieving sustainable lifestyles? Socio-cultural dispositions, collective action and material culture as problems and possibilities | |
Li et al. | Environmental disaster and public rescue: A social media perspective | |
Utama et al. | Worth eat: An intelligent application for restaurant recommendation based on customer preference (Case study: Five types of restaurant in Tangerang Selatan region, Indonesia) | |
CN109919721A (zh) | 一种实时自动生成商品描述文本的方法 | |
Sreen et al. | Eco-friendly products purchase intention: a comparison of theory of planned behaviour and social cognitive theory | |
Chen et al. | Effects of green appeals and message framing on green consumption | |
Puiras et al. | Shopping Intentions during COVID-19: What Can Canadian Businesses Learn to Encourage Future Consumer Support? | |
Meng et al. | RETRACTED ARTICLE: Modelling of the impact of Internet of things technology on consumer behavioural tendency | |
CN113362034A (zh) | 一种职位推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |