CN108021628B - 一种科技主题的管理系统 - Google Patents

一种科技主题的管理系统 Download PDF

Info

Publication number
CN108021628B
CN108021628B CN201711174056.9A CN201711174056A CN108021628B CN 108021628 B CN108021628 B CN 108021628B CN 201711174056 A CN201711174056 A CN 201711174056A CN 108021628 B CN108021628 B CN 108021628B
Authority
CN
China
Prior art keywords
entry
scientific
technological
achievement
entries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711174056.9A
Other languages
English (en)
Other versions
CN108021628A (zh
Inventor
汤德佑
霍晨鹏
刘朝刚
奚建清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201711174056.9A priority Critical patent/CN108021628B/zh
Publication of CN108021628A publication Critical patent/CN108021628A/zh
Application granted granted Critical
Publication of CN108021628B publication Critical patent/CN108021628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种科技主题的管理系统,科技成果以成果所属研究范畴及比值方式被关联到科技词条,科技人员以研究成果所涉及的研究范畴及成果水平被关联到科技词条;词条的管理交由领域专家采用带权投票机制实现,非领域专家不具有管理功能;新词入库和词条间结构变更均需要领域专家团投票,且需要参与投票领域专家权值之和达到设定的阈值。科技词条管理系统实现了上述思路,提供了用户管理、成果管理、词条管理和新词管理等功能模块,可为科技数据的进一步分析提供基础。

Description

一种科技主题的管理系统
技术领域
本发明涉及信息管理技术领域,特别涉及一种以树图结构形式组织的科技主题管理系统。
背景技术
目前对科学技术研究范畴的界定通常使用粗粒度的学科、技术领域和中图分类等方法,不能够精确反映科技工作中的各个研究分支,限制了科技大数据分析工作的开展。
主题揭示与某一事物内容有关的部分或全部问题,或是反映某一事物内容的概念,并用规范的词语来表示。科技活动中,每项研究均存在一个或多个研究主题,每个主题都有很多在研的科技人员,产生了很多资助项目和研究成果,如能将界定规范细化到研究主题水平,并将科技成果和研究人员与之关联,将有助于科技大数据的分析和科技服务业的服务延伸。
发明内容
为了能更好地解决当今的科技研究范畴分类规范不够系统,科技成果和研究人员与研究范畴映射不够精确的缺陷,本发明提供一种科技主题的管理系统,基于科技词条这个术语规范科技主题的管理,可为科技数据的进一步分析提供基础。
本发明的目的通过以下的技术方案实现:
一种科技主题的管理系统,包括服务模块01、计算模块02和数据模块03;
系统的运行基于科技词条,科技词条是对科技活动中每项理论和技术研究的研究范畴的抽象,反映研究的范畴及分类关系,若科技词条te1研究范畴是由科技词条te2的研究范畴细化而来,称te2强包含te1;若科技词条te1的研究范畴与科技词条te2的研究范畴存在交集,称te2弱包含te1
所有科技词条构成有向无环树图,记为TG,其中:科技词条构成图中的顶点;科技词条tej强包含科技词条tei时用一条从tej到tei的有向边表示,记为tej→tei,并称tej为tei的主属词;科技词条tek弱包含科技词条tei时用一条从tek到tei的有向边表示,记为
Figure BDA0001477844970000021
并称tek为tei的从属词;
所述科技词条无环树图中,每个顶点只能具有一个强包含关系的前驱顶点,可以有零到多个强包含关系分支顶点,每个顶点可有零到多个弱包含关系的前驱顶点,可以有零到多个弱包含关系分支顶点;
科技词条设置一个评判研究人员在该词条上成果水平的领域专家阈值TH:对专家X及科技词条t,令PX(t)表示专家X的成果在词条t上的评价分,THt表示词条t的领域专家阈值,若PX(t)>THt,称X为科技词条t的领域专家,词条t的所有领域专家记为Ae(t);
科技词条的管理强调领域专家的作用,限定只有领域专家才能调整树图结构,采用点赞/投票方式参与词条的管理,每个领域专家投票时具有一个与专家在词条上成果贡献大小成正比的权值,权值计算方法如下:给定词条tej,对领域专家Xk,Xk∈Ae(tej),1≤k≤|Ae(tej)|,若Xk的成果在tej上的评价分为pkj,则领域专家Xk对词条tej投票时具有的权值为:
Figure BDA0001477844970000022
科技词条树图的维护包括:(1)修改科技词条的基本信息,不涉及图结构变更;(2)向系统中增加新的科技词条,涉及在图中增加新顶点;(3)修改科技词条间的包含关系,涉及修改树图中顶点间关系;
带权投票树图维护需要多名领域专家参与投票且在词条上的权值之和超过调整阈值才能完成修改:设待审核的包含关系中的主属词或从属词为tej,领域专家集为Ae(tej),wlj表示领域专家Xl在词条tej上具有的投票权值,树图结构审核通过的前提是:
Figure BDA0001477844970000023
其中th表示修改树图结构必须满足的阈值,为大于0的实数,Xl表示已对词条tej投票的专家。
优选的,科技词条在研究范畴上的关系不限于强包含和若包含两种包含关系,还可扩充到同义词或者衍生词。
优选的,服务模块01包括用户管理模块011、新词管理模块012、词条管理模块013和成果管理模块014。
具体的,用户管理模块011提供对用户操作的功能,包括用户注册、登录、用户资料编辑、用户邀请和多邮箱关联;新词管理模块012提供平台用户对新词操作的功能,包括新词的增删改查、新词榜和新词跟踪等功能;词条管理模块013提供平台用户对科技词条操作的功能,包括词条浏览、词条搜索、词条编辑、搜索热词榜、词条点赞、点赞热词榜、词条关注、关注热词榜、候选词推荐、词条分享、候选词审核、词条入库审核和词条编辑审核等模块;成果管理模块014实现将成果关联到平台,支持项目、论文、专利、获奖、著作、报告、鉴定、技术标准等类型成果的管理,包括成果导入、成果编辑和成果确认。
具体的,关注热词榜功能支持用户查看指定时段内的关注热词排名,支持全库热词和用户关注词条下的热词;缺省关注词条计算方法如下:设用户X的成果包含的科技词条集合为S(X),
Figure BDA0001477844970000031
在树图中逆向遍历至入度为零顶点为止,所得到的路径为p(t)={t1t2…t},所有词条产生的路径集合为P,将P划分为m个子集,P1,P2,…,Pm
Figure BDA0001477844970000032
p1∩p2≠Φ,即Pi中的路径存在公共路径,记Pi中最长公共路径所在词条为tei,则te1,te2,…,tem构成用户X的缺省关注词条。
优选的,计算模块包括02包括成果计算模块021和词条计算模块022。
具体的,成果计算模块021为平台提供与科技成果获取和分析有关的基础功能,包括词条分析、成果归位、成果评价、成果发现、成果人发现和其他涉及成果的计算模块;词条计算模块022为平台提供与科技词条分析有关的基础功能,包括领域专家计算、关联词计算、热词计算和新词计算。
具体的,成果计算模块021:
1)词条分析功能对每一项成果材料,分析成果所属的科技词条集合及每个词条对应的权重等;2)成果评价功能分析以量化指标体系对成果的技术水平进行量化,给出评价分,结合成果分析功能给出成果人在成果科技词条上的得分等;3)成果归位对每一项成果材料,分析成果人的组成并将成果归位到正确的成果所有人等;4)成果人发现根据采集到的科技成果,将未入库的成果人信息保存到数据库,若平台获得了成果人联系方式,则启动用户邀请功能等;5)成果发现功能自动对互联网各类型成果数据库进行数据采集,将最新成果整合到平台;6)其他分析功能根据用户要求对成果进行分析。
具体的,词条计算模块022:
1)领域专家计算是根据平台中专家在各词条上的成果和词条上的总成果得分,计算用户是否达到领域专家的要求及投票时具有的权值;
2)新词计算是对当前科技领域可能出现的新词进行自动分析与计算;
3)科技词条te的关联词是指以te所在顶点为起点,逆向及正向遍历树图所能达到的词条集合;关联词计算对给定的科技词条,计算其在科技词条树图中的关联词集合,给定科技成果,若成果属于科技词条te的研究范畴,成果评分将扩展到所有关联词;
4)热词计算包括点赞热词、搜索热词和关注热词的计算,热词的时间跨度以天为单位,同时受用户的关注范围限定。
优选的,数据模块03包括科技词条库、科技成果库、成果人库和用户库;科技词条库存储科技词条信息;科技成果库存储科技成果、成果包含的词条列表及评分;成果人库存储科技成果贡献人、成果人的词条列表及得分;用户库存储平台的用户及领域专家的科技词条列表。
优选的,科技词条进入科技词条库的途径包括:
途径一、领域专家设置跟踪网址后,平台自动跟踪指定网址下内容,将计算出的科技新词推荐给专家审核,通过领域专家审核后科技新词成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库;
途径二、普通用户手动输入科技新词,一位以上领域专家同意后科技新词成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库;
途径三、领域专家手动输入新词,新词直接成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库。
优选的,编辑科技词条的方式按用户角色具有不同流程:
普通用户:可编辑科技词条基本信息,且编辑后需一位以上领域专家审核;
领域专家:直接修改基本信息,但在变更词条间包含关系时需要由专家团采用带权投票决定是否修改成功。
本发明与现有技术相比,具有如下优点和有益效果:
使用树图结构组织科技词条,展现科技主题之间的关联性;使用带权投票维护树图结构,强调领域专家的作用,领域专家的投票具有的权值与其成果评分有关,成果评分越高,所占权重越大,否则越小;以上两种特征,树图结构是基础,带权投票是保证,两者相辅相成,让最具有话语权的领域专家作为科技主题管理的主角,构成科技主题的管理方法;科技词条管理系统可及时反映研究范畴的扩展、科技成果的聚集和科技人员的研究主题演变;围绕科技词条展开理论和技术研究,可有效推动研究热点、主题变迁、创新性、先进性和成果质量等与成果内容相关的科技成果分析,领军人物、创新创业团队、专家遴选等与成果人相关的科技人员分析技术的发展,促进科技数据分析水平的提升。
附图说明
图1为科技词条树图模型示意图。
图2为筛选领域专家使用的子图。
图3为词条管理的业务流图。
图4为科技词条管理系统的主要功能模块组成示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
结合科学技术研究的特征和对主题的理解,本发明用科技词条(TechnicalEntry,TE)这个规范化的词语描述科技活动中每项理论和技术研究的研究范畴。科技词条提供一种比学科、技术领域等分类更为精确,更能真实反映科技工作中理论和技术研究范畴的分类方法和管理模式。科技词条系统在对研究范畴分类的基础上,将科技活动中的科技人员和科技成果关联到科技词条,便于对科技数据的进一步分析和处理。
科技词条是对科技活动中每项理论和技术研究的研究范畴的抽象,反映研究的范畴及分类关系,若科技词条te1研究范畴是由科技词条te2的研究范畴细化而来,称te2强包含te1,若科技词条te1的研究范畴与科技词条te2的研究范畴存在交集,或te1的研究范畴在某种程度上也属于te2的研究范畴,称te2弱包含te1;所有科技词条构成有向无环树图,记为TG,其中:
科技词条构成图中的顶点;
科技词条tej强包含科技词条tei时用一条从tej到tei的有向边表示,记为tej→tei,并称tej为tei的主属词;
科技词条tek弱包含科技词条tei时用一条从tek到tei的有向边表示,记为
Figure BDA0001477844970000061
并称tek为tei的从属词;
所述科技词条无环树图中,每个顶点只能具有一个强包含关系的前驱顶点,可以有零到多个强包含关系分支顶点(后继),每个顶点可有零到多个弱包含关系的前驱顶点,可以有零到多个弱包含关系分支顶点(后继)。
科技词条在研究范畴上的关系不限于上述两种包含关系,还可扩充到同义词、衍生词等。
科技词条设置一个评判研究人员在该词条上成果水平的领域专家阈值TH:对专家X及科技词条t,令PX(t)表示专家X的成果在词条t上的评价分,THt表示词条t的领域专家阈值,若PX(t)>THt,称X为科技词条t的领域专家,词条t的所有领域专家记为Ae(t)。
科技词条的管理强调领域专家的作用,限定只有领域专家才能调整树图结构,采用点赞/投票方式参与词条的管理,每个领域专家投票时具有一个与专家在词条上成果贡献大小成正比的权值,权值计算方法如下:给定词条tej,对领域专家Xk(Xk∈Ae(tej),1≤k≤|Ae(tej)|)),若Xk的成果在tej上的评价分为pkj,则领域专家Xk对词条tej投票时具有的权值为:
Figure BDA0001477844970000062
进一步地,带权投票树图维护方法需要多名领域专家参与投票且在词条上的权值之和超过调整阈值才能完成修改:设待审核的包含关系中的主属词或从属词为tej,领域专家集为Ae(tej),wlj表示领域专家Xl在词条tej上具有的投票权值,树图结构审核通过的前提是:
Figure BDA0001477844970000063
其中th表示修改树图结构必须满足的阈值,为大于0的实数,Xl表示已对词条tej投票的专家。
科技词条树图的维护包括:(1)修改科技词条的基本信息,不涉及图结构变更;(2)向系统中增加新的科技词条,涉及在图中增加新顶点;(3)修改科技词条间的包含关系,涉及修改树图中顶点间关系。
科技词条基本信息修改后只需要一位领域专家认可即可修改成功;领域专家可以直接修改科技词条的基本信息。
科技词条树图中增加新词条的流程如下:
发现新词:科技新词进入平台,由用户手动输入或平台自动发现;
产生候选词:一位以上领域专家对新词点赞后,新词转为候选词;
入库审核:多位领域专家带权投票,当投票的领域专家团权值之和达到入库阈值时候选词加入到科技词条库。
科技词条树图修改词条间的包含关系流程如下:
发起修改:某领域专家发起词条间结构的修改,邀请其他领域专家投票;
修改审核:多位领域专家带权投票,当投票的领域专家团权值之和达到入库阈值时词条修改成功。
一种科技主题的管理系统,实现上述科技主题管理方法,系统包括服务模块01、计算模块02和数据模块03;
服务模块01包括用户管理模块011、新词管理模块012、词条管理模块013和成果管理014;
计算模块包括02包括成果计算模块021和词条计算模块022。
具体的,用户管理模块011提供对用户操作的功能,包括用户注册、登录、用户资料编辑、用户邀请和多邮箱关联;新词管理模块012提供平台用户对新词操作的功能,包括新词的增删改查、新词榜和新词跟踪等功能;词条管理模块013提供平台用户对科技词条操作的功能,包括词条浏览、词条搜索、词条编辑、搜索热词榜、词条点赞、点赞热词榜、词条关注、关注热词榜、候选词推荐、词条分享、候选词审核、词条入库审核和词条编辑审核等模块;成果管理模块014实现将成果关联到平台,支持项目、论文、专利、获奖、著作、报告、鉴定、技术标准等类型成果的管理,包括成果导入、成果编辑和成果确认。
用户管理模块011:
平台用户角色分非注册用户、普通用户和领域专家用户三类;1)非注册用户角色是指在平台中没有账户的用户,仅能执行用户注册、词条浏览、词条搜索和搜索热词榜等基本功能;2)普通用户和领域专家用户均为平台的注册用户,可以是个人或团队,划分判据是其在具体词条上的成果水准,任何用户都只能在满足领域专家条件的若干词条上成为领域专家用户,而在其他词条上为普通用户。普通用户角色可执行登录、用户资料编辑、用户邀请、多邮箱关联、成果导入、成果编辑、成果确认、词条浏览、词条搜索、词条编辑、搜索热词榜、词条点赞、点赞热词榜、词条关注、关注热词榜、新词增删改查、新词榜等功能;领域专家用户可执行用户管理、新词管理、成果管理和词条管理等功能。
1)用户注册采用代表性成果关联方式,待注册的用户需从项目、论文、专利、获奖、著作、报告、鉴定、技术标准等类型成果中选择一项成果上传,成果需包含可提取的邮件地址,平台分析成果并核对邮件地址后将邮件地址作为用户名,将密码发至用户邮箱,用户在指定时间限度内点击登录链接完成注册;2)用户登录功能使用户获得平台普通用户或领域专家用户角色,至少需提供邮箱名/密码/验证码,支持密码丢失后的找回密码;3)用户邀请功能是指平台对未注册为平台用户的成果人,利用成果人提供的联系方式发出注册邀请,邀请用户进入平台完成账号激活;4)用户资料编辑功能允许用户登录成功后修改除用户名外的关于用户的资料,如密码、职称等;5)多邮箱关联功能允许用户将多个邮箱绑定到一个账户,绑定后可使用任意个人邮箱登录平台,关联流程是:用户登录平台后,平台根据成果分析的结果,将用户使用过的邮箱推送给用户,用户同意关联后向待关联邮箱发送确认链接,用户点击后关联成功。
新词管理模块012:
1)新词增删改查功能分别表示向平台增加、删除、编辑和浏览科技新词,新词的元数据包括但不限于词条名称、英文名、入库时间、主属词、从属词等,新词提交成功后平台自动向领域专家发出邀请,任意一位专家审核后新词成为候选词条;2)新词榜功能列出用户所关注的科技词条下出现的新词;3)新词跟踪功能在用户设定待跟踪的网址后,平台跟踪和分析对应网址下内容,识别出新词,推荐给用户。
词条管理模块013:
1)词条浏览功能向用户展示词条具体内容,既包括词条名称、英文名、入库时间、主属词、从属词等词条基本信息,也包括词条的领域专家,词条对应的成果及成果人等;2)词条搜索支持关键词、导航式、高级搜索等方式,以列表形式展示搜索结果,用户点击具体词条后可以查看词条内容;3)词条编辑功能包括不涉及树图结构变更的基本信息编辑和树图结构变更,基本信息编辑后只需有领域专家同意即可生效,树图结构变更则需要多位领域专家投票审核并达到相应阈值后才能生效;4)搜索热词榜可以查看用户指定时段内的搜索热词排名,支持全库热词和用户关注词条下的热词;5)词条点赞表示用户对该词条所描述的研究范畴和词条间关系的认可,可以查看支持该词条的领域专家名单;6)点赞热词榜支持用户查看指定时段内的点赞热词排名,支持全库热词和用户关注词条下的热词;7)词条关注为用户提供当某词条的后继顶点中发生更新后,平台向用户提示有更新,引导用户浏览,平台在分析用户成果后将给出用户缺省情况下关注的词条,但用户也可以修改感兴趣的词条集合;8)关注热词榜功能,支持用户查看指定时段内的关注热词排名,支持全库热词和用户关注词条下的热词;缺省关注词条计算方法如下:设用户X的成果包含的科技词条集合为S(X),
Figure BDA0001477844970000091
在树图中逆向遍历至入度为零顶点为止,所得到的路径为p(t)={t1t2…t},所有词条产生的路径集合为P,将P划分为m个子集,P1,P2,…,Pm
Figure BDA0001477844970000092
p1∩p2≠Φ,即Pi中的路径存在公共路径,记Pi中最长公共路径所在词条为tei,则te1,te2,…,tem构成用户X的缺省关注词条;9)候选词推荐是指领域专家同意将新词推荐为候选词,词条成为候选词后,平台自动向所有领域专家发出邀请;10)词条分享提供将科技词条信息分析到各种类型社交网络,如微信、微博等;10)候选词审核是指新词提交后,领域专家审核后新词转为候选词;11)词条入库审核是指领域专家对候选词的投票;12)词条编辑审核包括基本信息编辑审核和词条间关系变更审核;词条基本信息编辑审核只需一位专家认可即通过,若修改基本信息的用户本身为领域专家,则直接修改成功;词条间关系变更审核采用领域专家带权投票方法。
成果管理模块014:
1)成果导入功能允许用户将科技成果手动导入到平台,提供在线和离线批量成果导入,在线成果导入需按成果元数据模型要求填入相应信息,离线方式下平台提供成果模板下载,用户按模板填写完成后文件形式导入;2)成果编辑功能允许用户修改成果的元数据信息及成果附件;3)成果确认功能将获取的成果信息以用户提供的联系方式发送给用户进行确认,在系统规定时间内无回复的自动确认,确认后的成果用户可以继续编辑。
具体的,成果计算模块021为平台提供与科技成果获取和分析有关的基础功能,包括词条分析、成果归位、成果评价、成果发现、成果人发现和其他涉及成果的计算模块;词条计算模块022为平台提供与科技词条分析有关的基础功能,包括领域专家计算、关联词计算、热词计算和新词计算。
成果计算模块021:
1)词条分析功能对每一项成果材料,分析成果所属的科技词条集合及每个词条对应的权重等;2)成果评价功能分析以量化指标体系对成果的技术水平进行量化,给出评价分,结合成果分析功能给出成果人在成果科技词条上的得分等;3)成果归位对每一项成果材料,分析成果人的组成并将成果归位到正确的成果所有人等;4)成果人发现根据采集到的科技成果,将未入库的成果人信息保存到数据库,若平台获得了成果人联系方式,则启动用户邀请功能等;5)成果发现功能自动对互联网各类型成果数据库进行数据采集,将最新成果整合到平台;6)其他分析功能根据用户要求对成果进行分析。
词条计算模块022:
1)领域专家计算是根据平台中专家在各词条上的成果和词条上的总成果得分,计算用户是否达到领域专家的要求及投票时具有的权值;
2)新词计算是对当前科技领域可能出现的新词进行自动分析与计算;
3)科技词条te的关联词是指以te所在顶点为起点,逆向及正向遍历树图所能达到的词条集合;关联词计算对给定的科技词条,计算其在科技词条树图中的关联词集合,给定科技成果,若成果属于科技词条te的研究范畴,成果评分将扩展到所有关联词;
4)热词计算包括点赞热词、搜索热词和关注热词的计算,热词的时间跨度以天为单位,同时受用户的关注范围限定。
具体的,数据模块03包括科技词条库、科技成果库、成果人库和用户库。科技词条库存储科技词条信息;科技成果库存储科技成果、成果包含的词条列表及评分;成果人库存储科技成果贡献人、成果人的词条列表及得分;用户库存储平台的用户及领域专家的科技词条列表。
图1中为便于标识,每项科技词条均设置一个可唯一标识的编码ID,图中每个顶点表示一条科技词条及其同义词,对每个词条仅列出其词条编码,词条间的强包含关系用I型有向边表示,弱包含关系用II型有向边表示。
科技词条关联了科技成果和科技成果人,图1中用虚线表示科技词条的关联到的科技成果或成果人,如成果人A的成果经分析后涉及的科技词条有ID111和ID211,成果人B涉及的科技词条有ID21312和ID512,专利C主要属于ID211的研究范畴(63%),同时涉及ID212(37%);
图2是图1中成果人B所熟悉词条产生的关联词集,以此为基础计算成果人B在达到领域专家要求的科技词条列表。
专家构成词条te的领域专家的充分必要条件是专家的成果包含词条te或te的关联词,且成果在该词条上的评价分达到领域专家阈值,如图2中,设ID31的领域专家阈值为th31,若专家B的成果在ID31上的成果评分大于th31,专家B即为词条ID31的领域专家;
图3为科技词条入库和编辑流程,科技词条进入词条库的途径有三:
途径一、领域专家设置跟踪网址后,平台自动跟踪指定网址下内容,将计算出的科技新词推荐给专家审核,通过领域专家审核后科技新词成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库;
途径二、普通用户手动输入科技新词,一位以上领域专家同意后科技新词成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库;
途径三、领域专家手动输入新词,新词直接成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库;
编辑科技词条的方式按用户角色具有不同流程:
普通用户:可编辑科技词条基本信息,且编辑后需一位以上领域专家审核;
领域专家:直接修改基本信息,但在变更词条间包含关系时需要由专家团采用带权投票决定是否修改成功。
图4为所述科技词条管理系统的功能模块图,包括01服务模块、02计算模块和03数据模块。
所述01服务模块包括011用户管理模块、012新词管理模块、013词条管理模块和014成果管理模块;
所述011用户模块包括用户注册、登录、用户资料编辑、用户邀请和多邮箱关联等功能;
所述012新词管理模块包括新词的增删改查、新词榜和新词跟踪等功能;
所述013词条管理模块包括词条浏览、词条搜索、词条编辑、搜索热词榜、词条点赞、点赞热词榜、词条关注、关注热词榜、候选词推荐、词条分享、候选词审核、词条入库审核和词条编辑审核等功能;
所述014成果管理模块包括成果导入、成果编辑和成果确认等功能。
所述02计算模块包括021成果计算模块和022词条计算模块;
所述021成果计算模块包括词条分析、成果归位、成果评价、成果发现、成果人发现和其他涉及成果的计算;
所述022词条计算模块包括领域专家计算、关联词计算、热词计算和新词计算等功能。
所述03数据模块包括科技词条库、科技成果库、成果人库和用户库。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种科技主题的管理系统,其特征在于,包括服务模块、计算模块和数据模块;
系统的运行基于科技词条,科技词条是对科技活动中每项理论和技术研究的研究范畴的抽象,反映研究的范畴及分类关系,若科技词条te1研究范畴是由科技词条te2的研究范畴细化而来,称te2强包含te1;若科技词条te1的研究范畴与科技词条te2的研究范畴存在交集,称te2弱包含te1
所有科技词条构成有向无环树图,记为TG,其中:科技词条构成图中的顶点;科技词条tej强包含科技词条tei时用一条从tej到tei的有向边表示,记为tej→tei,并称tej为tei的主属词;科技词条tek弱包含科技词条tei时用一条从tek到tei的有向边表示,记为
Figure FDA0003283650630000011
并称tek为tei的从属词;
所述科技词条无环树图中,每个顶点只能具有一个强包含关系的前驱顶点,有零到多个强包含关系分支顶点,每个顶点有零到多个弱包含关系的前驱顶点,有零到多个弱包含关系分支顶点;
科技词条设置一个评判研究人员在该词条上成果水平的领域专家阈值TH:对专家X及科技词条t,令PX(t)表示专家X的成果在词条t上的评价分,THt表示词条t的领域专家阈值,若PX(t)>THt,称X为科技词条t的领域专家,词条t的所有领域专家记为Ae(t);
科技词条的管理强调领域专家的作用,限定只有领域专家才能调整树图结构,采用点赞/投票方式参与词条的管理,每个领域专家投票时具有一个与专家在词条上成果贡献大小成正比的权值,权值计算方法如下:给定词条tej,对领域专家Xk,Xk∈Ae(tej),1≤k≤|Ae(tej)|,若Xk的成果在tej上的评价分为pkj,则领域专家Xk对词条tej投票时具有的权值为:
Figure FDA0003283650630000012
科技词条树图的维护包括:(1)修改科技词条的基本信息,不涉及图结构变更;(2)向系统中增加新的科技词条,涉及在图中增加新顶点;(3)修改科技词条间的包含关系,涉及修改树图中顶点间关系;
带权投票树图维护需要多名领域专家参与投票且在词条上的权值之和超过调整阈值才能完成修改:设待审核的包含关系中的主属词或从属词为tej,领域专家集为Ae(tej),wlj表示领域专家Xl在词条tej上具有的投票权值,树图结构审核通过的前提是:
Figure FDA0003283650630000013
其中th表示修改树图结构必须满足的阈值,为大于0的实数,Xl表示已对词条tej投票的专家;
服务模块包括用户管理模块、新词管理模块、词条管理模块和成果管理模块;
计算模块包括包括成果计算模块和词条计算模块;成果计算模块为平台提供与科技成果获取和分析有关的基础功能,包括词条分析、成果归位、成果评价、成果发现、成果人发现和其他涉及成果的计算模块;词条计算模块为平台提供与科技词条分析有关的基础功能,包括领域专家计算、关联词计算、热词计算和新词计算;
数据模块包括科技词条库、科技成果库、成果人库和用户库;科技词条库存储科技词条信息;科技成果库存储科技成果、成果包含的词条列表及评分;成果人库存储科技成果贡献人、成果人的词条列表及得分;用户库存储平台的用户及领域专家的科技词条列表。
2.根据权利要求1所述的科技主题的管理系统,其特征在于,科技词条在研究范畴上的关系不限于强包含和若包含两种包含关系,还可扩充到同义词或者衍生词。
3.根据权利要求1所述的科技主题的管理系统,其特征在于,用户管理模块提供对用户操作的功能,包括用户注册、登录、用户资料编辑、用户邀请和多邮箱关联;新词管理模块提供平台用户对新词操作的功能,包括新词的增删改查、新词榜和新词跟踪;词条管理模块提供平台用户对科技词条操作的功能,包括词条浏览、词条搜索、词条编辑、搜索热词榜、词条点赞、点赞热词榜、词条关注、关注热词榜、候选词推荐、词条分享、候选词审核、词条入库审核和词条编辑审核模块;成果管理模块实现将成果关联到平台,支持项目、论文、专利、获奖、著作、报告、鉴定、技术标准类型成果的管理,包括成果导入、成果编辑和成果确认。
4.根据权利要求3所述的科技主题的管理系统,其特征在于,关注热词榜功能支持用户查看指定时段内的关注热词排名,支持全库热词和用户关注词条下的热词;缺省关注词条计算方法如下:设用户X的成果包含的科技词条集合为S(X),
Figure FDA0003283650630000021
在树图中逆向遍历至入度为零顶点为止,所得到的路径为p(t)={t1t2…t},所有词条产生的路径集合为P,将P划分为m个子集,P1,P2,…,Pm
Figure FDA0003283650630000022
p1∩p2≠Φ,即Pi中的路径存在公共路径,记Pi中最长公共路径所在词条为tei,则te1,te2,…,tem构成用户X的缺省关注词条。
5.根据权利要求1所述的科技主题的管理系统,其特征在于,成果计算模块中:
1)词条分析功能对每一项成果材料,分析成果所属的科技词条集合及每个词条对应的权重;2)成果评价功能分析以量化指标体系对成果的技术水平进行量化,给出评价分,结合成果分析功能给出成果人在成果科技词条上的得分;3)成果归位对每一项成果材料,分析成果人的组成并将成果归位到正确的成果所有人;4)成果人发现根据采集到的科技成果,将未入库的成果人信息保存到数据库,若平台获得了成果人联系方式,则启动用户邀请功能;5)成果发现功能自动对互联网各类型成果数据库进行数据采集,将最新成果整合到平台;6)其他分析功能根据用户要求对成果进行分析;
词条计算模块中:
1)领域专家计算是根据平台中专家在各词条上的成果和词条上的总成果得分,计算用户是否达到领域专家的要求及投票时具有的权值;
2)新词计算是对当前科技领域可能出现的新词进行自动分析与计算;
3)科技词条te的关联词是指以te所在顶点为起点,逆向及正向遍历树图所能达到的词条集合;关联词计算对给定的科技词条,计算其在科技词条树图中的关联词集合,给定科技成果,若成果属于科技词条te的研究范畴,成果评分将扩展到所有关联词;
4)热词计算包括点赞热词、搜索热词和关注热词的计算,热词的时间跨度以天为单位,同时受用户的关注范围限定。
6.根据权利要求1所述的科技主题的管理系统,其特征在于,科技词条进入科技词条库的途径包括:
途径一、领域专家设置跟踪网址后,平台自动跟踪指定网址下内容,将计算出的科技新词推荐给专家审核,通过领域专家审核后科技新词成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库;
途径二、普通用户手动输入科技新词,一位以上领域专家同意后科技新词成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库;
途径三、领域专家手动输入新词,新词直接成为候选词条,再由候选词条的主属词和从属词上领域专家采用带权投票决定是否加入到科技词条库。
7.根据权利要求1所述的科技主题的管理系统,其特征在于,编辑科技词条的方式按用户角色具有不同流程:
普通用户:可编辑科技词条基本信息,且编辑后需一位以上领域专家审核;
领域专家:直接修改基本信息,但在变更词条间包含关系时需要由专家团采用带权投票决定是否修改成功。
CN201711174056.9A 2017-11-22 2017-11-22 一种科技主题的管理系统 Active CN108021628B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711174056.9A CN108021628B (zh) 2017-11-22 2017-11-22 一种科技主题的管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711174056.9A CN108021628B (zh) 2017-11-22 2017-11-22 一种科技主题的管理系统

Publications (2)

Publication Number Publication Date
CN108021628A CN108021628A (zh) 2018-05-11
CN108021628B true CN108021628B (zh) 2021-12-21

Family

ID=62080836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711174056.9A Active CN108021628B (zh) 2017-11-22 2017-11-22 一种科技主题的管理系统

Country Status (1)

Country Link
CN (1) CN108021628B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633350B (zh) * 2019-09-24 2023-05-05 中国航空工业集团公司沈阳飞机设计研究所 一种无人机系统术语管理方法和系统
CN111221971B (zh) * 2020-01-07 2023-04-21 华南理工大学 一种基于科技词条的批量任务专家自动遴选方法
CN113032680A (zh) * 2021-04-19 2021-06-25 南京点橙互联网科技有限公司 基于用户订阅热词模式的推荐方法
CN112990798B (zh) * 2021-05-19 2021-07-16 广州市简筱网络科技有限公司 一种基于企业科技信息成果管理系统
CN114492402A (zh) * 2021-12-28 2022-05-13 北京航天智造科技发展有限公司 一种科技新词识别方法及装置
CN117670488B (zh) * 2024-01-31 2024-04-16 山东立信华创大数据科技有限公司 一种基于大数据的科技成果分析预测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574003A (zh) * 2014-10-10 2016-05-11 华东师范大学 一种基于评论文本和评分分析的信息推荐方法
CN105740452A (zh) * 2016-02-03 2016-07-06 北京工业大学 基于PageRank和时间衰减的科技文献重要度评价方法
CN105741204A (zh) * 2016-02-03 2016-07-06 佛山市融信通企业咨询服务有限公司 一种软件著作权价值评估的系统
CN106294330A (zh) * 2015-05-11 2017-01-04 清华大学 一种科技文本挑选方法及装置
CN106484839A (zh) * 2016-10-08 2017-03-08 大连理工大学 一种基于学术大数据的期刊影响力评估方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8136028B1 (en) * 2007-02-02 2012-03-13 Loeb Enterprises Llc System and method for providing viewers of a digital image information about identifiable objects and scenes within the image
US8122061B1 (en) * 2010-11-10 2012-02-21 Robert Guinness Systems and methods for information management using socially constructed graphs
CN102682001B (zh) * 2011-03-09 2016-12-28 阿里巴巴集团控股有限公司 一种确定推荐词的方法及设备
CN105045858B (zh) * 2015-07-10 2018-04-13 湖南科技大学 基于投票的出租车载客点推荐方法
US20170116536A1 (en) * 2015-10-27 2017-04-27 Pulse Energy Inc. Dictionary reduction technique for business name categorization

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574003A (zh) * 2014-10-10 2016-05-11 华东师范大学 一种基于评论文本和评分分析的信息推荐方法
CN106294330A (zh) * 2015-05-11 2017-01-04 清华大学 一种科技文本挑选方法及装置
CN105740452A (zh) * 2016-02-03 2016-07-06 北京工业大学 基于PageRank和时间衰减的科技文献重要度评价方法
CN105741204A (zh) * 2016-02-03 2016-07-06 佛山市融信通企业咨询服务有限公司 一种软件著作权价值评估的系统
CN106484839A (zh) * 2016-10-08 2017-03-08 大连理工大学 一种基于学术大数据的期刊影响力评估方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
新型农业科技成果评价体系建设探讨;乔德华;《农业科技管理》;20161020;第35卷(第5期);第39-44页 *

Also Published As

Publication number Publication date
CN108021628A (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
CN108021628B (zh) 一种科技主题的管理系统
US9773043B2 (en) Implicit profile for use with recommendation engine and/or question router
Oard et al. Evaluation of information retrieval for E-discovery
AU2005209586B2 (en) Systems, methods, and interfaces for providing personalized search and information access
US8977644B2 (en) Collaborative search results
US7860852B2 (en) Systems and apparatuses for seamless integration of user, contextual, and socially aware search utilizing layered approach
US11386510B2 (en) Method and system for integrating web-based systems with local document processing applications
Biega et al. Overview of the TREC 2019 fair ranking track
US20070233672A1 (en) Personalizing search results from search engines
JP2000113064A (ja) 最適行為者選定支援システム
Crescenzi et al. Crowdsourcing for data management
CN111159559A (zh) 根据用户需求和用户行为构建推荐引擎的方法
CN105975508A (zh) 个性化元搜索引擎检索结果合成排序方法
Dailiati et al. Tourism and Environmental Policy Strategies: Promoting Local Destination in Riau Province
Vancauwenbergh et al. The Flemish research discipline classification standard: A practical approach
RU2305314C1 (ru) Способ поиска и выборки информации из различных баз данных
Matthies et al. Document selection for knowledge discovery in texts: Framework development and demonstration
Ibrahim et al. A Scientometric Approach for Personalizing Research Paper Retrieval.
Lowry et al. Internet portal for participation of large groups in transportation programming decisions
Arifin et al. A systematic literature review on community financing: Avenues for further research
Rigopoulos A group decision support system for collaborative decisions within business intelligence context
Zhou et al. Evaluation of Text Semantic Features using Latent Dirichlet Allocation Model
RU2555232C2 (ru) Способ формирования и эксплуатации базы данных
Berrios et al. metaBUS: A Tool for Informing HRD Theory, Practice, and Research
Jensen et al. Retrospective Enhancement of Thesis Cataloging and the Match Rate of Authors in National Authority Files

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant