CN112417870A - 一种专家信息的筛选方法及系统 - Google Patents
一种专家信息的筛选方法及系统 Download PDFInfo
- Publication number
- CN112417870A CN112417870A CN202011454346.0A CN202011454346A CN112417870A CN 112417870 A CN112417870 A CN 112417870A CN 202011454346 A CN202011454346 A CN 202011454346A CN 112417870 A CN112417870 A CN 112417870A
- Authority
- CN
- China
- Prior art keywords
- expert
- information
- expert information
- scientific
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012216 screening Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012163 sequencing technique Methods 0.000 claims abstract description 10
- 230000011218 segmentation Effects 0.000 claims description 41
- 238000000605 extraction Methods 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 10
- 238000011160 research Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000012552 review Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种专家信息的筛选方法及系统,该方法为:获取专家信息筛选条件;分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;根据科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型;利用物元知识表示模型,构建包含专家信息的索引库;根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件;确定每个专家信息索引文件与专家信息筛选条件的匹配度;按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工筛选的方式选择评审专家,提高评审专家的筛选准确度和提高筛选客观性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种专家信息的筛选方法及系统。
背景技术
电网科技业务在选择科技项目和科技成果的评审专家时,通常由科技工作者以人工筛选的方式选择相应的评审专家。但是一方面专家库信息量庞大,另一方面人工遴选的方式主观性较强,受到前述两方面原因的影响,会导致遴选出来的专家并不能满足实际的评审需求,即人工筛选专家的方式的准确度较差和客观性较差。
发明内容
有鉴于此,本发明实施例提供一种专家信息的筛选方法及系统,以解决目前人工筛选评审专家的方式存在的准确度较差和客观性较差等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种专家信息的筛选方法,所述方法包括:
获取专家信息筛选条件;
分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;
根据所述科技项目关键词集、所述科技成果关键词集和所述专家关键词集,构建相应的物元知识表示模型;
利用所述物元知识表示模型,构建包含专家信息的索引库;
根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,每个所述专家信息索引文件对应一个专家;
确定每个所述专家信息索引文件与所述专家信息筛选条件的匹配度;
按照所述匹配度由高至低的顺序,对所述专家信息索引文件进行排序并展示。
优选的,所述分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集,包括:
利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。
优选的,所述利用所述物元知识表示模型,构建包含专家信息的索引库,包括:
利用ApacheLucene对所述物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,所述索引库所包含的信息为支持快速检索的格式。
优选的,所述根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,包括:
根据所述专家信息筛选条件在所述索引库进行索引,在指定的目录文件夹中生成与所述专家信息筛选条件对应的专家信息索引文件,其中,每个所述专家信息索引文件以文件夹的形式保存在所述指定的目录文件夹中,每个所述专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。
优选的,所述生成与所述专家信息筛选条件对应的专家信息索引文件之后,还包括:
在指定的检索系统界面中展示每个所述专家信息索引文件。
优选的,所述在指定的检索系统界面中展示每个所述专家信息索引文件之后,还包括:
接收查看所述专家信息索引文件对应的专家信息的指令,在所述检索系统界面中展示被查看的所述专家信息索引文件对应的专家信息,被查看的所述专家信息索引文件对应的专家信息至少包括:论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果。
本发明实施例第二方面公开一种专家信息的筛选系统,所述系统包括:
获取单元,用于获取专家信息筛选条件;
提取单元,用于分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;
第一构建单元,用于根据所述科技项目关键词集、所述科技成果关键词集和所述专家关键词集,构建相应的物元知识表示模型;
第二构建单元,用于利用所述物元知识表示模型,构建包含专家信息的索引库;
索引单元,用于根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,每个所述专家信息索引文件对应一个专家;
确定单元,用于确定每个所述专家信息索引文件与所述专家信息筛选条件的匹配度;
处理单元,用于按照所述匹配度由高至低的顺序,对所述专家信息索引文件进行排序并展示。
优选的,所述提取单元具体用于:利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。
优选的,所述第二构建单元具体用于:利用ApacheLucene对所述物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,所述索引库所包含的信息为支持快速检索的格式。
优选的,所述索引单元具体用于:根据所述专家信息筛选条件在所述索引库进行索引,在指定的目录文件夹中生成与所述专家信息筛选条件对应的专家信息索引文件,其中,每个所述专家信息索引文件以文件夹的形式保存在所述指定的目录文件夹中,每个所述专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。
基于上述本发明实施例提供的一种专家信息的筛选方法及系统,该方法为:获取专家信息筛选条件;分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;根据科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型;利用物元知识表示模型,构建包含专家信息的索引库;根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件;确定每个专家信息索引文件与专家信息筛选条件的匹配度;按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工筛选的方式选择评审专家,提高评审专家的筛选准确度和提高筛选客观性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种专家信息的筛选方法的流程图;
图2为本发明实施例提供的获取专家信息筛选条件的示意图;
图3为本发明实施例提供的展示专家信息索引文件的示意图;
图4为本发明实施例提供的展示专家信息索引文件排序结果的示意图;
图5为本发明实施例提供的一种专家信息的筛选系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,目前电网科技业务在选择评审专家时,通常是由科技人员以人工筛选的方式选择相应的评审专家。但是人工筛选评审专家的主观性较强,且专家信息库的信息量庞大,人工无法准确的从专家信息库中筛选出符合实际需求的评审需求,即人工筛选专家的方式的准确度较差和客观性较差。
因此,本发明实施例提供一种专家信息的筛选方法及系统,获取专家信息筛选条件。根据关键词提取得到的科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型,并利用物元知识表示模型构建包含专家信息的索引库。根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。确定每个专家信息索引文件与专家信息筛选条件的匹配度,并按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工遴选的方式选择评审专家,以提高评审专家的筛选准确度和提高筛选客观性。
参见图1,示出了本发明实施例提供的一种专家信息的筛选方法的流程图,该筛选方法包括:
步骤S101:获取专家信息筛选条件。
在具体实现步骤S101的过程中,获取用户设置的专家信息筛选条件,该专家信息筛选条件为多条。
可以理解的是,可在设置以检索输入框,提示用户在检索输入框中输入相应的信息,响应用户所输入的信息生成对应的专家信息筛选条件。
比如:参见图2示出的获取专家信息筛选条件的示意图,设置一“专家遴选”按钮,响应于用户点击该“专家遴选”按钮,提示用户设定“回避专家姓名”、“回避单位”、“专家年龄(段)”、“系统内外”、“研究领域”和“专家领域”等信息,当用户点击“确定”按钮后,获取相应的专家信息筛选条件(“回避专家姓名”、“回避单位”、“专家年龄(段)”、“系统内外”、“研究领域”和“专家领域”等对应的专家信息筛选条件)。
步骤S102:分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集。
在具体实现步骤S102的过程中,利用IKAnalyzer进行关键词提取,并结合电力专业词库进行分词,分别对科技项目信息(科技项目的建议书、项目可研报告信息和项目过程材料信息等)、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。
也就是说,对科技项目信息进行关键词提取和分词得到科技项目关键词集,对科技成果信息进行关键词提取和分词得到科技成果关键词集,对专家信息进行关键词提取和分词得到专家关键词集。
需要说明的是,IKAnalyzer是基于java语言开发的中文分词工具包,关键词是指停用词过滤后和信息提取后保留下的有用信息词。
步骤S103:根据科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型。
在具体实现步骤S103的过程中,在提取得到科技项目关键词集、科技成果关键词集和专家关键词集之后,根据该科技项目关键词集、科技成果关键词集和专家关键词集所包含的关键词,结合组织知识表示方法和可拓学模型,构建相应的物元知识表示模型。
需要说明的是,知识载体可以将事物的多种特征项属性种类囊括在其中,只需要考虑相关的特征项属性,与研究属性不相关的特征项属性不加入知识载体,故在本发明实施例中使用可拓学物元模型和向量空间模型相结合的方式改善领域信息的知识表示。
步骤S104:利用物元知识表示模型,构建包含专家信息的索引库。
在具体实现步骤S104的过程中,利用ApacheLucene对上述构建得到的物元知识表示模型进行索引库构建,得到包含专家信息的索引库,该索引库作为进行专家信息检索(或推荐)的样本库,其中,索引库所包含的信息(文本信息)为支持快速检索的格式。
需要说明的是,ApacheLucene是一全文检索引擎工具包,索引库所包含的信息即为前述提及的物元知识表示模型中文档内容的文本信息。
步骤S105:根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。
需要说明的是,每个专家信息索引文件对应一个专家。
在具体实现步骤S105的过程中,根据专家信息筛选条件在索引库进行索引,在指定的目录文件夹中生成与专家信息筛选条件对应的专家信息索引文件(一个及以上),其中,每个专家信息索引文件以文件夹的形式保存在该指定的目录文件夹中,每个专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计(对分词后的字或词的出现情况进行权重统计)且被停用词过滤后的分词结果。
需要说明的是,停用词过滤是指:为提高检索效率和节约存储空间,在处理数据之前需过滤掉的字或词。
优选的,在执行步骤S105得到多个专家信息索引文件之后,可将每个专家信息索引文件以专家信息条目(与专家信息索引文件对应)的方式在指定的检索系统界面中展示,并且,可在该指定的检索系统界面中展示每个专家信息条目对应的专家信息索引文件是否被创建。
优选的,在指定的检索系统界面中展示每个专家信息索引文件之后,用户可在该指定的检索系统界面中点击需要查看的专家信息索引文件对应的专家信息条目,此时接收到查看专家信息索引文件对应的专家信息的指令,在检索系统界面中展示被查看的专家信息索引文件对应的专家信息,被查看的专家信息索引文件对应的专家信息至少包括:论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果。
可以理解的是,专家信息索引文件还包括对应的专家姓名、工作单位、年龄和学历等基础信息。
需要说明的是,对于专家信息中的字段,若字段未被输入信息,则相应的信息为空且不在检索系统界面中展示该字段。
为更好解释说明上述关于查看专家信息索引文件对应的专家信息的内容,通过图3示出的展示专家信息索引文件的示意图进行举例说明。
在图3中示出的检索系统界面示意图中,专家1至专家10按序号排列,勾选需要查看专家信息索引文件对应的专家选项(序号左边的矩形),并点击“查看专家特征索引结果”按钮,从上述构建的索引库中读取所勾选的专家对应的专家信息索引文件,展示所勾选的专家对应的专家信息索引文件中的论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果等信息。
步骤S106:确定每个专家信息索引文件与专家信息筛选条件的匹配度。
在具体实现步骤S106的过程中,计算每个专家信息索引文件与专家信息筛选条件的匹配度,得到各个专家信息索引文件对应的匹配度。
步骤S107:按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。
在具体实现步骤S107的过程中,按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示排序后的专家信息索引文件对应的专家信息,展示专家信息索引文件的同时也展示相应的匹配度。
为更好解释说明上述对专家信息索引文件进行排序并展示,通过图4示出的展示专家信息索引文件排序结果的示意图进行举例说明,需要说明的是,图4是以匹配度降序的方式展示专家信息索引文件排序结果。
在图4示出的专家信息索引文件排序结果中,专家1至专家10按照各自对应的专家信息索引文件与专家信息筛选条件的匹配度进行降序排序,其中专家1对应的专家信息索引文件与专家信息筛选条件的匹配度最高,其次为专家2,以此类推,匹配度最低的为专家10。
在图4中,“操作”一栏中的内容包括:向对应的专家发送短信和发送邮件两个选项。
在本发明实施例中,获取专家信息筛选条件。根据关键词提取得到的科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型,并利用物元知识表示模型构建包含专家信息的索引库。根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。确定每个专家信息索引文件与专家信息筛选条件的匹配度,并按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工筛选的方式选择评审专家,提高评审专家的筛选准确度和提高筛选客观性。
与上述本发明实施例提供的一种专家信息的筛选方法相对应,参见图5,本发明实施例还提供了一种专家信息的筛选系统的结构框图,该筛选系统包括:获取单元501、提取单元502、第一构建单元503、第二构建单元504、索引单元505、确定单元506和处理单元507;
获取单元501,用于获取专家信息筛选条件。
提取单元502,用于分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集。
在具体实现中,提取单元502具体用于:利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。
第一构建单元503,用于根据科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型。
第二构建单元504,用于利用物元知识表示模型,构建包含专家信息的索引库。
在具体实现中,第二构建单元505具体用于:利用ApacheLucene对物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,索引库所包含的信息为支持快速检索的格式。
索引单元505,用于根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件,每个专家信息索引文件对应一个专家。
在具体实现中,索引单元505具体用于:根据专家信息筛选条件在索引库进行索引,在指定的目录文件夹中生成与专家信息筛选条件对应的专家信息索引文件,其中,每个专家信息索引文件以文件夹的形式保存在指定的目录文件夹中,每个专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。
确定单元506,用于确定每个专家信息索引文件与专家信息筛选条件的匹配度。
处理单元507,用于按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。
优选的,结合图5示出的内容,该筛选系统还包括:
第一展示单元,用于在指定的检索系统界面中展示每个专家信息索引文件。
优选的,结合图5示出的内容,该筛选系统还包括:
第二展示单元,用于接收查看专家信息索引文件对应的专家信息的指令,在检索系统界面中展示被查看的专家信息索引文件对应的专家信息,被查看的专家信息索引文件对应的专家信息至少包括:论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果。
综上所述,本发明实施例提供一种专家信息的筛选方法及系统,获取专家信息筛选条件。根据关键词提取得到的科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型,并利用物元知识表示模型构建包含专家信息的索引库。根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。确定每个专家信息索引文件与专家信息筛选条件的匹配度,并按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工遴选的方式选择评审专家,以提高评审专家的筛选准确度和提高筛选客观性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种专家信息的筛选方法,其特征在于,所述方法包括:
获取专家信息筛选条件;
分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;
根据所述科技项目关键词集、所述科技成果关键词集和所述专家关键词集,构建相应的物元知识表示模型;
利用所述物元知识表示模型,构建包含专家信息的索引库;
根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,每个所述专家信息索引文件对应一个专家;
确定每个所述专家信息索引文件与所述专家信息筛选条件的匹配度;
按照所述匹配度由高至低的顺序,对所述专家信息索引文件进行排序并展示。
2.根据权利要求1所述的方法,其特征在于,所述分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集,包括:
利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。
3.根据权利要求1所述的方法,其特征在于,所述利用所述物元知识表示模型,构建包含专家信息的索引库,包括:
利用ApacheLucene对所述物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,所述索引库所包含的信息为支持快速检索的格式。
4.根据权利要求1所述的方法,其特征在于,所述根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,包括:
根据所述专家信息筛选条件在所述索引库进行索引,在指定的目录文件夹中生成与所述专家信息筛选条件对应的专家信息索引文件,其中,每个所述专家信息索引文件以文件夹的形式保存在所述指定的目录文件夹中,每个所述专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。
5.根据权利要求1所述的方法,其特征在于,所述生成与所述专家信息筛选条件对应的专家信息索引文件之后,还包括:
在指定的检索系统界面中展示每个所述专家信息索引文件。
6.根据权利要求5所述的方法,其特征在于,所述在指定的检索系统界面中展示每个所述专家信息索引文件之后,还包括:
接收查看所述专家信息索引文件对应的专家信息的指令,在所述检索系统界面中展示被查看的所述专家信息索引文件对应的专家信息,被查看的所述专家信息索引文件对应的专家信息至少包括:论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果。
7.一种专家信息的筛选系统,其特征在于,所述系统包括:
获取单元,用于获取专家信息筛选条件;
提取单元,用于分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;
第一构建单元,用于根据所述科技项目关键词集、所述科技成果关键词集和所述专家关键词集,构建相应的物元知识表示模型;
第二构建单元,用于利用所述物元知识表示模型,构建包含专家信息的索引库;
索引单元,用于根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,每个所述专家信息索引文件对应一个专家;
确定单元,用于确定每个所述专家信息索引文件与所述专家信息筛选条件的匹配度;
处理单元,用于按照所述匹配度由高至低的顺序,对所述专家信息索引文件进行排序并展示。
8.根据权利要求7所述的系统,其特征在于,所述提取单元具体用于:利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。
9.根据权利要求7所述的系统,其特征在于,所述第二构建单元具体用于:利用ApacheLucene对所述物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,所述索引库所包含的信息为支持快速检索的格式。
10.根据权利要求7所述的系统,其特征在于,所述索引单元具体用于:根据所述专家信息筛选条件在所述索引库进行索引,在指定的目录文件夹中生成与所述专家信息筛选条件对应的专家信息索引文件,其中,每个所述专家信息索引文件以文件夹的形式保存在所述指定的目录文件夹中,每个所述专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011454346.0A CN112417870A (zh) | 2020-12-10 | 2020-12-10 | 一种专家信息的筛选方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011454346.0A CN112417870A (zh) | 2020-12-10 | 2020-12-10 | 一种专家信息的筛选方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112417870A true CN112417870A (zh) | 2021-02-26 |
Family
ID=74776511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011454346.0A Pending CN112417870A (zh) | 2020-12-10 | 2020-12-10 | 一种专家信息的筛选方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417870A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879829A (zh) * | 2023-02-21 | 2023-03-31 | 广东省科技基础条件平台中心 | 一种应用于平台创新能力审核的评审专家筛选方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605665A (zh) * | 2013-10-24 | 2014-02-26 | 杭州电子科技大学 | 一种基于关键词的评审专家智能检索与推荐方法 |
CN103631859A (zh) * | 2013-10-24 | 2014-03-12 | 杭州电子科技大学 | 一种面向科技项目的评审专家智能推荐方法 |
CN108846056A (zh) * | 2018-06-01 | 2018-11-20 | 云南电网有限责任公司电力科学研究院 | 一种科技成果评审专家推荐方法及装置 |
-
2020
- 2020-12-10 CN CN202011454346.0A patent/CN112417870A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605665A (zh) * | 2013-10-24 | 2014-02-26 | 杭州电子科技大学 | 一种基于关键词的评审专家智能检索与推荐方法 |
CN103631859A (zh) * | 2013-10-24 | 2014-03-12 | 杭州电子科技大学 | 一种面向科技项目的评审专家智能推荐方法 |
CN108846056A (zh) * | 2018-06-01 | 2018-11-20 | 云南电网有限责任公司电力科学研究院 | 一种科技成果评审专家推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
吴仁克: "科技项目评审专家智能检索与推荐系统的研究及实现", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 09, pages 138 - 1268 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879829A (zh) * | 2023-02-21 | 2023-03-31 | 广东省科技基础条件平台中心 | 一种应用于平台创新能力审核的评审专家筛选方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7634503B2 (en) | Method and system for selecting answers in answer set using a customizable table | |
US7236968B2 (en) | Question-answering method and question-answering apparatus | |
US8078545B1 (en) | System, method and computer program product for collecting strategic patent data associated with an identifier | |
KR101582108B1 (ko) | 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램 | |
CN109857938B (zh) | 基于企业信息的搜索方法、搜索装置及计算机存储介质 | |
US20020022974A1 (en) | Display of patent information | |
US20040117354A1 (en) | Process for tagging and measuring quality | |
CN110908891A (zh) | 一种测试数据生成方法、装置、电子设备及存储介质 | |
KR101566153B1 (ko) | 포렌식 시스템 및 포렌식 방법 및 포렌식 프로그램 | |
CN112417870A (zh) | 一种专家信息的筛选方法及系统 | |
TW201508525A (zh) | 文件分類系統、文件分類方法及文件分類程式 | |
JP5827206B2 (ja) | 文書管理システムおよび文書管理方法並びに文書管理プログラム | |
JP6025487B2 (ja) | フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム | |
US20110276866A1 (en) | Method of multi-document aggregation and presentation | |
CN114676231A (zh) | 一种目标信息检测方法、设备和介质 | |
US20100114851A1 (en) | Searching for user interface controls | |
CN115858598A (zh) | 基于企业大数据的目标信息筛选匹配方法及相关设备 | |
CN113077362A (zh) | 规章制度文件的处理方法及装置 | |
CN114780408A (zh) | 软件用户行为路径分析方法及装置 | |
EP1850246A1 (en) | Data retrieval system, method and program | |
CN113539457A (zh) | 医疗资源的推荐方法及装置、电子设备、存储介质 | |
US8224838B2 (en) | Database search method, program, and apparatus | |
EP4006743A1 (en) | Information search system | |
CN117271782B (zh) | Sdk组件的动态集成方法及系统 | |
CN115827855A (zh) | 代办事项主题推送方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |