CN111090801A - 一种专家人脉关系图谱绘制方法及系统 - Google Patents

一种专家人脉关系图谱绘制方法及系统 Download PDF

Info

Publication number
CN111090801A
CN111090801A CN201911305691.5A CN201911305691A CN111090801A CN 111090801 A CN111090801 A CN 111090801A CN 201911305691 A CN201911305691 A CN 201911305691A CN 111090801 A CN111090801 A CN 111090801A
Authority
CN
China
Prior art keywords
expert
academic
relationship
preset rule
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911305691.5A
Other languages
English (en)
Other versions
CN111090801B (zh
Inventor
龚才春
张发恩
张婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innovation Qizhi (qingdao) Technology Co Ltd
Original Assignee
Innovation Qizhi (qingdao) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innovation Qizhi (qingdao) Technology Co Ltd filed Critical Innovation Qizhi (qingdao) Technology Co Ltd
Priority to CN201911305691.5A priority Critical patent/CN111090801B/zh
Publication of CN111090801A publication Critical patent/CN111090801A/zh
Application granted granted Critical
Publication of CN111090801B publication Critical patent/CN111090801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种专家人脉关系图谱绘制方法及系统,涉及互联网技术领域,包括:针对每个专家,于网络中爬取专家关联的若干学术数据;根据第一预设规则对各学术数据进行分析得到专家的师生关系;根据第二预设规则对各学术数据进行分析得到专家的同门关系;根据第三预设规则对各学术数据进行分析得到专家的校友关系;根据第四预设规则对各学术数据进行分析得到专家的同学关系;根据师生关系、同门关系、校友关系和同学关系绘制得到专家的专家人脉关系图谱。本发明节省大量人力物力,提高资源利用率;高效准确推荐人才资源,为社会提供优质人才链;对数据采集主体影响微小,可为社会各领域提供研究价值。

Description

一种专家人脉关系图谱绘制方法及系统
技术领域
本发明涉及互联网技术领域,具体涉及一种专家人脉关系图谱绘制方法及系统。
背景技术
目前专家人脉关系图谱的采集技术局限于人工问卷调查、走访调查等形式,而现社会交通便利,人口流动性太强,导致数据采集普遍率低、采集效率低,存在数据缺失或者数据误判等情况。
现有人脉图谱的来源仅限某些垄断部门(如公安部)专职负责,亲人关系可从户口登记处查看,关系安全保密性系数较高,获取困难且会有更新不及时、造假难防等情况。现阶段各种社交软件层出不穷,纷繁复杂,一人多应用,一人多账号,千人千面,用户登记信息不真实,多重身份难辨,给人际关系的采集和处理带来极大的困难。因人际关系涉及网络广,同一个人的人脉关系极其有限,覆盖率不全,信息收集量较少,不利于人脉关系图谱的绘制。
发明内容
本发明的目的在于提供一种专家人脉关系图谱绘制方法及系统。
为达此目的,本发明采用以下技术方案:
提供一种专家人脉关系图谱绘制方法,包括以下步骤:
步骤S1,针对每个专家,于网络中爬取所述专家关联的若干学术数据;
步骤S2,根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;
步骤S3,根据第二预设规则对各所述学术数据进行分析得到所述专家的同门关系;
步骤S4,根据第三预设规则对各所述学术数据进行分析得到所述专家的校友关系;
步骤S5,根据第四预设规则对各所述学术数据进行分析得到所述专家的同学关系;
步骤S6,根据所述师生关系、所述同门关系、所述校友关系和所述同学关系绘制得到所述专家的专家人脉关系图谱。
作为发明的一种优选方案,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第一预设规则为通过导师与指导学生的所述对应关系分析得到所述专家的师生关系;
和/或所述学术数据为所述专家关联的学术文章,则所述第一预设规则为通过将所述学术文章中的联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第一相似度,并在所述第一相似度大于预设的一第一相似度阈值时判定所述专家与对应的所述其他学术文章的作者为师生关系;
和/或所述学术数据为所述专家关联的若干学术成果,则所述第一预设规则为统计各所述学术成果中关联的致谢人员名单,计算各所述致谢人员名单中每个致谢人员的姓名出现的频率,并在所述频率大于预设的第一频率阈值时判定所述专家与对应的所述致谢人员为师生关系;
和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第一预设规则为计算所述出版社的出版内容与所述学术成果的第二相似度,并在所述第二相似度大于预设的第二相似度阈值时判定所述专家与所述出版内容的作者为师生关系;
和/或所述学术数据为所述专家的网页浏览记录,则所述第一预设规则为获取所述专家的IP地址,并判定与所述IP地址处于同一局域网的具有相同所述网页浏览记录且浏览频率相同的人员和所述专家为师生关系;
和/或所述学术数据为所述专家参加的学术交流活动的团队人员名单,则所述第一预设规则为通过所述团队人员名单分析得到所述专家的师生关系;
和/或所述学术数据为所述专家关联的学位论文,则所述第一预设规则为通过所述学位论文中记录的作者及指导教师得到所述专家的师生关系。
作为发明的一种优选方案,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第二预设规则为通过导师与指导学生的所述对应关系分析得到与所述专家具有同一导师的指导学生和所述专家为同门关系;
和/或所述学术数据为所述专家关联的学术文章,则所述第二预设规则为通过获取所述学术文章的共同作者,并判定所述共同作者与所述专家为同门关系;
和/或所述学术数据为所述专家关联的学术成果,则所述第二预设规则为将所述学术成果中与所述专家并列提及的作者判定为和所述专家为同门关系;
和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第二预设规则为计算所述出版社的出版内容与所述学术成果的第三相似度,并在所述第三相似度大于预设的第三相似度阈值时判定所述专家与所述出版内容的作者为同门关系;
和/或所述学术数据为所述专家关联的学术文章中的联系方式,则所述第二预设规则为将所述联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第四相似度,并在所述第四相似度大于预设的一第四相似度阈值时判定所述专家与对应的所述其他学术文章的作者为同门关系;
和/或所述学术数据为所述专家的网页浏览记录,则所述第二预设规则为为获取所述专家的IP地址,并判定与所述IP地址处于同一局域网的具有相同所述网页浏览记录且浏览频率不同的人员和所述专家为同门关系;所述浏览频率小于第二频率阈值;
和/或所述学术数据为所述专家参加的学术交流活动的团队人员名单,则所述第二预设规则为通过所述团队人员名单分析得到所述专家的同门关系;
和/或所述学术数据为所述专家的学术文章,则所述第二预设规则为计算所述学术文章与网络中的其他学术文章之间的第五相似度,并在所述第五相似度大于预设的第五相似度阈值时判定所述专家与对应的所述其他学术文章的作者为同门关系。
作为发明的一种优选方案,所述学术数据为所述专家参加的高校官网校园活动,则所述第三预设规则为通过获取所述高效官网校园活动的参与人员,并判定所述专家与所述参与人员为校友关系;
和/或所述学术数据为所述专家的关联院校,则所述第三预设规则为获取各大公司官网的人才资源信息,并判定所述人才资源信息中具有相同所述关联院校的人员与所述专家为校友关系;
和/或所述学术数据为所述专家的网页浏览记录,则所述第三预设规则为根据所述网页浏览记录关联的IP地址获取与所述IP地址相似的若干相似IP地址,计算所述IP地址与各所述相似IP地址之间的第六相似度,并在所述第六相似度大于预设的第六相似度阈值时判定所述专家与对应的所述相似IP地址的使用者为校友关系;
和/或所述学术数据为所述专家的人才官网信息,则所述第三预设规则为根据所述人才官网信息提取所述专家的教育经历,并判定具有相同教育经历的人群与所述专家为校友关系;
和/或所述学术数据为所述专家的学术文章,则所述第三预设规则为根据所述学术文章的出处,判定具有相同所述出处的其他学术文章的作者与所述专家为校友关系。
作为发明的一种优选方案,所述学术数据为所述专家的学位论文,则所述第四预设规则为根据所述学位论文关联的毕业院校,和/或专业,和/或学历,和/或毕业时间分析得到所述专家的同学关系。
一种专家人脉关系图谱绘制系统,应用以上任意一项所述的专家人脉关系图谱绘制方法,所述专家人脉关系图谱绘制系统具体包括:
数据获取模块,用于针对每个专家,于网络中爬取所述专家关联的若干学术数据;
第一处理模块,连接所述数据获取模块,用于根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;
第二处理模块,连接所述数据获取模块,用于根据第二预设规则对各所述学术数据进行分析得到所述专家的同门关系;
第三处理模块,连接所述数据获取模块,用于根据第三预设规则对各所述学术数据进行分析得到所述专家的校友关系;
第四处理模块,连接所述数据获取模块,用于根据第四预设规则对各所述学术数据进行分析得到所述专家的同学关系;
图谱绘制模块,分别连接所述第一处理模块、所述第二处理模块、所述第三处理模块和所述第四处理模块,用于根据所述师生关系、所述同门关系、所述校友关系和所述同学关系绘制得到所述专家的专家人脉关系图谱。
本发明的有益效果:
1)节省大量人力物力,提高资源利用率;
2)高效准确推荐人才资源,为社会提供优质人才链;
3)对数据采集主体影响微小,可为社会各领域提供研究价值。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例所述的一种专家人脉关系图谱绘制方法的流程示意图。
图2是本发明一实施例所述的一种专家人脉关系图谱绘制系统的模块框图。
图3是本发明一实施例所述的一种专家人脉关系图谱绘制系统的结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
针对现有技术中存在的技术问题,本发明提供一种专家人脉关系图谱绘制方法,如图1所示,包括以下步骤:
步骤S1,针对每个专家,于网络中爬取专家关联的若干学术数据;
步骤S2,根据第一预设规则对各学术数据进行分析得到专家的师生关系;
步骤S3,根据第二预设规则对各学术数据进行分析得到专家的同门关系;
步骤S4,根据第三预设规则对各学术数据进行分析得到专家的校友关系;
步骤S5,根据第四预设规则对各学术数据进行分析得到专家的同学关系;
步骤S6,根据师生关系、同门关系、校友关系和同学关系绘制得到专家的专家人脉关系图谱。
具体地,本实施例中,本发明通过学术文献数据库(万方、知网、维普等)和互联网途径采集分析专家的人脉关系图谱,包括但不局限于师生关系、同学关系、同门关系、校友关系、亲人关系等;对个人、对公安政府等组织没有任何影响,节省时间,提高效率;节省人力物力及财力的开支,将社会资源合理分配,为国家和各地方政府提供优秀人才网络资源,基于机器学习的平台为国家(教育、文化、医学、历史)等各方面提供搜索推荐与预测并决策的一手资料。本发明能够应用于计算机信息检索、社会关系、风险投资、企业管理、医学研究、学术交流、人才引进、历史研究、机器学习、NLP等领域。
具体地,首先于网络中爬取专家关联的若干学术数据,该学术数据优选通过学术文献数据库和互联网途径采集,各学术数据形成数据集。随后根据该数据集分析专家的人脉关系,如图2所示,具体包括但不限于:
1、师生关系,本发明中根据获取的学术数据的不同,根据不同的第一预设规则分析得到专家的师生关系,更为具体地,主要包括:
1)通过检索高校官网科研模块科研人才团队模块,可以看到导师们及其指导的学生信息,从而推测专家的师生关系;
2)通过检索学术文章中作者的联系方式,匹配多篇文章中相同的联系方式(比如实验室的公共电子邮箱、公用电话等),相似程度越高说明文章的作者可能来源于同一实验室,由此可判断师生关系;上述相似程度的高低的评定标准优选通过设置一第一相似度阈值判定;
3)通过检索学术文章的尾页致谢人员和作者的其他资料,例如新闻介绍、媒体报道、出版书籍、科研成果中的署名人员、致谢人员,以及其他诸如‘老师’‘感激帮助’,‘培养’等关键词附近提到的人物名称比较同一姓名提到的频率,频率越高表明对方对作者的培养意义重大,由此预测师生关系;上述频率的高低的评定标准优选通过设置一第一频率阈值判定;
4)通过比较同一家出版社的同一领域文章、作者出处等相似程度高的人群,可判断师生关系;上述相似程度高低的评定标准优选通过设置一第二相似度阈值判定;
5)通过匹配使用同一个局域网的ip地址经常注册、浏览相同的网站讯息(如相同的生物信息检索网站,相同的wiki网站,相同的博客网站)的人群,确定同一学校同一科室的范围,师生可能共同维护一个博客网站,分享研究心得;一起更新wiki页面,交流知识,由此可预测师生关系;
6)通过匹配报名参加同一学术交流活动(比如世界华人虾蟹养殖研讨会)的团队人名单列表,可以预测师生关系;
7)根据学位论文的作者和指导教师可以判断师生关系;
2、同门关系,本发明中根据获取的学术数据的不同,根据不同的第二预设规则分析得到专家的同门关系,更为具体地,主要包括:
1)通过检索高校官网科研模块科研人才团队模块,可以看到导师们极其指导的学生信息,同一个导师下的多个学生可判断是同门关系;
2)通过检索学术文献中的共同作者(比如第一作者、第二作者)可判断是同门关系;
3)通过检索高效官网上科研模块科研成果模块或者校园采访发表的学术性新闻、媒体采访发表的科研性文章、项目介绍时并列提到的作者姓名,可判断是同门关系;
4)通过比较同一家出版社的同一领域文章、作者出处等相似程度高的人群,可判断同门关系;上述相似程度高低的评定标准优选通过设置一第三相似度阈值判定;
5)通过比较学术文章的联系电话、邮箱地址,匹配程度高的可能同一年入学,由学校同一购置的电话卡会是同一批次,只有后几位数字不同,由此可判断同门关系;上述匹配程度高低的评定标准优选通过设置一第四相似度阈值判定;
6)通过匹配使用同一个局域网的ip地址(确定同一学校同一科室的范围)经常注册、相近频率浏览相同的网站讯息(如相同的生物信息检索网站,相同的wiki网站,相同的博客网站)的人群,同门双方可能共同维护一个博客网站,分享研究心得;以相近的频率更新wiki页面,交流知识,由此可预测同门关系;上述频率高低的评定标准优选通过设置一第二频率阈值判定;
7)通过匹配报名参加同一科研交流活动(比如北京园艺发展现状研讨会)的团队人名单列表,可以预测同门关系;
8)通过比较多篇学术文章的关键字匹配相似度,文章题目相似度、致谢教师相似度、参考文献相似度、发刊机构相似度,多种综合相似程度越高,表明越有可能是同门关系;上述匹配程度高低的评定标准优选通过设置一第五相似度阈值判定;
3、校友关系,本发明中根据获取的学术数据的不同,根据不同的第三预设规则分析得到专家的校友关系,更为具体地,主要包括:
1)通过比较高校官网中同一种活动(比如社团比赛,夜探校园昆虫公益科普活动)中的参与人员,相似程度高的,可判断是校友关系;
2)通过浏览各大公司官网上人才资源(比如复旦大学的物理学博士头衔),同一学校的表明是校友关系;
3)通过比较不同ip访问不同网站使用同一ip地址(一般高校会有自己统一访问外网的代理地址)的相似程度,相似程度高的与预测是校友关系;上述相似程度高低的评定标准优选通过设置一第六相似度阈值判定;
4)通过比较注册信息为同一教育经历的人才官网信息(比如Boss直聘,拉勾网等),同一学校毕业的人群可表明是校友关系;
5)通过解析论文的出处是同一地点推测可能是校友关系;
4、同学关系,本发明中通过第四预设规则解析学位论文的作者的毕业院校、专业、学历、毕业时间推测可能是同学关系。
作为发明的一种优选方案,学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则第一预设规则为通过导师与指导学生的对应关系分析得到专家的师生关系;
和/或学术数据为专家关联的学术文章,则第一预设规则为通过将学术文章中的联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第一相似度,并在第一相似度大于预设的一第一相似度阈值时判定专家与对应的其他学术文章的作者为师生关系;
和/或学术数据为专家关联的若干学术成果,则第一预设规则为统计各学术成果中关联的致谢人员名单,计算各致谢人员名单中每个致谢人员的姓名出现的频率,并在频率大于预设的第一频率阈值时判定专家与对应的致谢人员为师生关系;
和/或学术数据为专家的学术成果发表的出版社,则第一预设规则为计算出版社的出版内容与学术成果的第二相似度,并在第二相似度大于预设的第二相似度阈值时判定专家与出版内容的作者为师生关系;
和/或学术数据为专家的网页浏览记录,则第一预设规则为获取专家的IP地址,并判定与IP地址处于同一局域网的具有相同网页浏览记录且浏览频率相同的人员和专家为师生关系;
和/或学术数据为专家参加的学术交流活动的团队人员名单,则第一预设规则为通过团队人员名单分析得到专家的师生关系;
和/或学术数据为专家关联的学位论文,则第一预设规则为通过学位论文中记录的作者及指导教师得到专家的师生关系。
作为发明的一种优选方案,学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则第二预设规则为通过导师与指导学生的对应关系分析得到与专家具有同一导师的指导学生和专家为同门关系;
和/或学术数据为专家关联的学术文章,则第二预设规则为通过获取学术文章的共同作者,并判定共同作者与专家为同门关系;
和/或学术数据为专家关联的学术成果,则第二预设规则为将学术成果中与专家并列提及的作者判定为和专家为同门关系;
和/或学术数据为专家的学术成果发表的出版社,则第二预设规则为计算出版社的出版内容与学术成果的第三相似度,并在第三相似度大于预设的第三相似度阈值时判定专家与出版内容的作者为同门关系;
和/或学术数据为专家关联的学术文章中的联系方式,则第二预设规则为将联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第四相似度,并在第四相似度大于预设的一第四相似度阈值时判定专家与对应的其他学术文章的作者为同门关系;
和/或学术数据为专家的网页浏览记录,则第二预设规则为为获取专家的IP地址,并判定与IP地址处于同一局域网的具有相同网页浏览记录且浏览频率不同的人员和专家为同门关系;浏览频率小于第二频率阈值;
和/或学术数据为专家参加的学术交流活动的团队人员名单,则第二预设规则为通过团队人员名单分析得到专家的同门关系;
和/或学术数据为专家的学术文章,则第二预设规则为计算学术文章与网络中的其他学术文章之间的第五相似度,并在第五相似度大于预设的第五相似度阈值时判定专家与对应的其他学术文章的作者为同门关系。
作为发明的一种优选方案,学术数据为专家参加的高校官网校园活动,则第三预设规则为通过获取高效官网校园活动的参与人员,并判定专家与参与人员为校友关系;
和/或学术数据为专家的关联院校,则第三预设规则为获取各大公司官网的人才资源信息,并判定人才资源信息中具有相同关联院校的人员与专家为校友关系;
和/或学术数据为专家的网页浏览记录,则第三预设规则为根据网页浏览记录关联的IP地址获取与IP地址相似的若干相似IP地址,计算IP地址与各相似IP地址之间的第六相似度,并在第六相似度大于预设的第六相似度阈值时判定专家与对应的相似IP地址的使用者为校友关系;
和/或学术数据为专家的人才官网信息,则第三预设规则为根据人才官网信息提取专家的教育经历,并判定具有相同教育经历的人群与专家为校友关系;
和/或学术数据为专家的学术文章,则第三预设规则为根据学术文章的出处,判定具有相同出处的其他学术文章的作者与专家为校友关系。
作为发明的一种优选方案,学术数据为专家的学位论文,则第四预设规则为根据学位论文关联的毕业院校,和/或专业,和/或学历,和/或毕业时间分析得到专家的同学关系。
一种专家人脉关系图谱绘制系统,应用以上任意一项的专家人脉关系图谱绘制方法,如图3所示,专家人脉关系图谱绘制系统具体包括:
数据获取模块1,用于针对每个专家,于网络中爬取专家关联的若干学术数据;
第一处理模块2,连接数据获取模块1,用于根据第一预设规则对各学术数据进行分析得到专家的师生关系;
第二处理模块3,连接数据获取模块1,用于根据第二预设规则对各学术数据进行分析得到专家的同门关系;
第三处理模块4,连接数据获取模块1,用于根据第三预设规则对各学术数据进行分析得到专家的校友关系;
第四处理模块5,连接数据获取模块1,用于根据第四预设规则对各学术数据进行分析得到专家的同学关系;
图谱绘制模块6,分别连接第一处理模块2、第二处理模块3、第三处理模块4和第四处理模块5,用于根据师生关系、同门关系、校友关系和同学关系绘制得到专家的专家人脉关系图谱。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (6)

1.一种专家人脉关系图谱绘制方法,其特征在于,包括以下步骤:
步骤S1,针对每个专家,于网络中爬取所述专家关联的若干学术数据;
步骤S2,根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;
步骤S3,根据第二预设规则对各所述学术数据进行分析得到所述专家的同门关系;
步骤S4,根据第三预设规则对各所述学术数据进行分析得到所述专家的校友关系;
步骤S5,根据第四预设规则对各所述学术数据进行分析得到所述专家的同学关系;
步骤S6,根据所述师生关系、所述同门关系、所述校友关系和所述同学关系绘制得到所述专家的专家人脉关系图谱。
2.根据权利要求1所述的专家人脉关系图谱绘制方法,其特征在于,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第一预设规则为通过导师与指导学生的所述对应关系分析得到所述专家的师生关系;
和/或所述学术数据为所述专家关联的学术文章,则所述第一预设规则为通过将所述学术文章中的联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第一相似度,并在所述第一相似度大于预设的一第一相似度阈值时判定所述专家与对应的所述其他学术文章的作者为师生关系;
和/或所述学术数据为所述专家关联的若干学术成果,则所述第一预设规则为统计各所述学术成果中关联的致谢人员名单,计算各所述致谢人员名单中每个致谢人员的姓名出现的频率,并在所述频率大于预设的第一频率阈值时判定所述专家与对应的所述致谢人员为师生关系;
和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第一预设规则为计算所述出版社的出版内容与所述学术成果的第二相似度,并在所述第二相似度大于预设的第二相似度阈值时判定所述专家与所述出版内容的作者为师生关系;
和/或所述学术数据为所述专家的网页浏览记录,则所述第一预设规则为获取所述专家的IP地址,并判定与所述IP地址处于同一局域网的具有相同所述网页浏览记录且浏览频率相同的人员和所述专家为师生关系;
和/或所述学术数据为所述专家参加的学术交流活动的团队人员名单,则所述第一预设规则为通过所述团队人员名单分析得到所述专家的师生关系;
和/或所述学术数据为所述专家关联的学位论文,则所述第一预设规则为通过所述学位论文中记录的作者及指导教师得到所述专家的师生关系。
3.根据权利要求1所述的专家人脉关系图谱绘制方法,其特征在于,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第二预设规则为通过导师与指导学生的所述对应关系分析得到与所述专家具有同一导师的指导学生和所述专家为同门关系;
和/或所述学术数据为所述专家关联的学术文章,则所述第二预设规则为通过获取所述学术文章的共同作者,并判定所述共同作者与所述专家为同门关系;
和/或所述学术数据为所述专家关联的学术成果,则所述第二预设规则为将所述学术成果中与所述专家并列提及的作者判定为和所述专家为同门关系;
和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第二预设规则为计算所述出版社的出版内容与所述学术成果的第三相似度,并在所述第三相似度大于预设的第三相似度阈值时判定所述专家与所述出版内容的作者为同门关系;
和/或所述学术数据为所述专家关联的学术文章中的联系方式,则所述第二预设规则为将所述联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第四相似度,并在所述第四相似度大于预设的一第四相似度阈值时判定所述专家与对应的所述其他学术文章的作者为同门关系;
和/或所述学术数据为所述专家的网页浏览记录,则所述第二预设规则为为获取所述专家的IP地址,并判定与所述IP地址处于同一局域网的具有相同所述网页浏览记录且浏览频率不同的人员和所述专家为同门关系;所述浏览频率小于第二频率阈值;
和/或所述学术数据为所述专家参加的学术交流活动的团队人员名单,则所述第二预设规则为通过所述团队人员名单分析得到所述专家的同门关系;
和/或所述学术数据为所述专家的学术文章,则所述第二预设规则为计算所述学术文章与网络中的其他学术文章之间的第五相似度,并在所述第五相似度大于预设的第五相似度阈值时判定所述专家与对应的所述其他学术文章的作者为同门关系。
4.根据权利要求1所述的专家人脉关系图谱绘制方法,其特征在于,所述学术数据为所述专家参加的高校官网校园活动,则所述第三预设规则为通过获取所述高效官网校园活动的参与人员,并判定所述专家与所述参与人员为校友关系;
和/或所述学术数据为所述专家的关联院校,则所述第三预设规则为获取各大公司官网的人才资源信息,并判定所述人才资源信息中具有相同所述关联院校的人员与所述专家为校友关系;
和/或所述学术数据为所述专家的网页浏览记录,则所述第三预设规则为根据所述网页浏览记录关联的IP地址获取与所述IP地址相似的若干相似IP地址,计算所述IP地址与各所述相似IP地址之间的第六相似度,并在所述第六相似度大于预设的第六相似度阈值时判定所述专家与对应的所述相似IP地址的使用者为校友关系;
和/或所述学术数据为所述专家的人才官网信息,则所述第三预设规则为根据所述人才官网信息提取所述专家的教育经历,并判定具有相同教育经历的人群与所述专家为校友关系;
和/或所述学术数据为所述专家的学术文章,则所述第三预设规则为根据所述学术文章的出处,判定具有相同所述出处的其他学术文章的作者与所述专家为校友关系。
5.根据权利要求1所述的专家人脉关系图谱绘制方法,其特征在于,所述学术数据为所述专家的学位论文,则所述第四预设规则为根据所述学位论文关联的毕业院校,和/或专业,和/或学历,和/或毕业时间分析得到所述专家的同学关系。
6.一种专家人脉关系图谱绘制系统,其特征在于,应用如权利要求1-5中任意一项所述的专家人脉关系图谱绘制方法,所述专家人脉关系图谱绘制系统具体包括:
数据获取模块,用于针对每个专家,于网络中爬取所述专家关联的若干学术数据;
第一处理模块,连接所述数据获取模块,用于根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;
第二处理模块,连接所述数据获取模块,用于根据第二预设规则对各所述学术数据进行分析得到所述专家的同门关系;
第三处理模块,连接所述数据获取模块,用于根据第三预设规则对各所述学术数据进行分析得到所述专家的校友关系;
第四处理模块,连接所述数据获取模块,用于根据第四预设规则对各所述学术数据进行分析得到所述专家的同学关系;
图谱绘制模块,分别连接所述第一处理模块、所述第二处理模块、所述第三处理模块和所述第四处理模块,用于根据所述师生关系、所述同门关系、所述校友关系和所述同学关系绘制得到所述专家的专家人脉关系图谱。
CN201911305691.5A 2019-12-18 2019-12-18 一种专家人脉关系图谱绘制方法及系统 Active CN111090801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911305691.5A CN111090801B (zh) 2019-12-18 2019-12-18 一种专家人脉关系图谱绘制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911305691.5A CN111090801B (zh) 2019-12-18 2019-12-18 一种专家人脉关系图谱绘制方法及系统

Publications (2)

Publication Number Publication Date
CN111090801A true CN111090801A (zh) 2020-05-01
CN111090801B CN111090801B (zh) 2023-06-09

Family

ID=70395671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911305691.5A Active CN111090801B (zh) 2019-12-18 2019-12-18 一种专家人脉关系图谱绘制方法及系统

Country Status (1)

Country Link
CN (1) CN111090801B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053174A (zh) * 2020-09-29 2020-12-08 中国银行股份有限公司 一种银行客户和柜员关系的确定方法、装置及设备
WO2023019452A1 (zh) * 2021-08-17 2023-02-23 益家宝体育科技(深圳)有限公司 社会人物活动永续记录重现互动的方法和系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090204469A1 (en) * 2006-05-30 2009-08-13 Frontiers Media S.A. Internet Method, Process and System for Publication and Evaluation
CN102880657A (zh) * 2012-08-31 2013-01-16 电子科技大学 基于搜索者的专家推荐方法
CN103020302A (zh) * 2012-12-31 2013-04-03 中国科学院自动化研究所 基于复杂网络的学术核心作者挖掘及相关信息抽取方法和系统
CN103870517A (zh) * 2012-12-09 2014-06-18 祁勇 一种获取用户个性化特征的方法和系统
CN104361102A (zh) * 2014-11-24 2015-02-18 清华大学 一种基于群组匹配的专家推荐方法及系统
CN105468605A (zh) * 2014-08-25 2016-04-06 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
WO2017190668A1 (zh) * 2016-05-05 2017-11-09 腾讯科技(深圳)有限公司 身份验证方法和装置
CN109377375A (zh) * 2018-09-03 2019-02-22 平安科技(深圳)有限公司 基金关系图谱生成方法、系统、计算机设备和存储介质
CN109543738A (zh) * 2018-11-16 2019-03-29 大连理工大学 一种基于网络表征学习的师生关系识别方法
CN109684483A (zh) * 2018-12-11 2019-04-26 平安科技(深圳)有限公司 知识图谱的构建方法、装置、计算机设备及存储介质
CN109905873A (zh) * 2019-02-25 2019-06-18 国家计算机网络与信息安全管理中心 一种基于特征标识信息的网络账号关联方法
CN109948154A (zh) * 2019-03-12 2019-06-28 南京邮电大学 一种基于邮箱名的人物获取及关系推荐系统和方法
CN110134800A (zh) * 2019-04-17 2019-08-16 深圳壹账通智能科技有限公司 一种文档关系可视化处理方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090204469A1 (en) * 2006-05-30 2009-08-13 Frontiers Media S.A. Internet Method, Process and System for Publication and Evaluation
CN102880657A (zh) * 2012-08-31 2013-01-16 电子科技大学 基于搜索者的专家推荐方法
CN103870517A (zh) * 2012-12-09 2014-06-18 祁勇 一种获取用户个性化特征的方法和系统
CN103020302A (zh) * 2012-12-31 2013-04-03 中国科学院自动化研究所 基于复杂网络的学术核心作者挖掘及相关信息抽取方法和系统
CN105468605A (zh) * 2014-08-25 2016-04-06 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
CN104361102A (zh) * 2014-11-24 2015-02-18 清华大学 一种基于群组匹配的专家推荐方法及系统
WO2017190668A1 (zh) * 2016-05-05 2017-11-09 腾讯科技(深圳)有限公司 身份验证方法和装置
CN109377375A (zh) * 2018-09-03 2019-02-22 平安科技(深圳)有限公司 基金关系图谱生成方法、系统、计算机设备和存储介质
CN109543738A (zh) * 2018-11-16 2019-03-29 大连理工大学 一种基于网络表征学习的师生关系识别方法
CN109684483A (zh) * 2018-12-11 2019-04-26 平安科技(深圳)有限公司 知识图谱的构建方法、装置、计算机设备及存储介质
CN109905873A (zh) * 2019-02-25 2019-06-18 国家计算机网络与信息安全管理中心 一种基于特征标识信息的网络账号关联方法
CN109948154A (zh) * 2019-03-12 2019-06-28 南京邮电大学 一种基于邮箱名的人物获取及关系推荐系统和方法
CN110134800A (zh) * 2019-04-17 2019-08-16 深圳壹账通智能科技有限公司 一种文档关系可视化处理方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
栾美惠;赵辰光;: "基于社会网络分析法和共词分析法的高校筹资热点分析", 继续教育研究, no. 12 *
王文秀等: "面向网络社区知识交流与共享的用户关系图谱构建与可视化研究", 《情报科学》, no. 11 *
魏力更;: "大数据时代下高校图书馆的知识发现服务――基于超星发现、中国知网发现功能的研究", 高师理科学刊, no. 11 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053174A (zh) * 2020-09-29 2020-12-08 中国银行股份有限公司 一种银行客户和柜员关系的确定方法、装置及设备
CN112053174B (zh) * 2020-09-29 2024-03-29 中国银行股份有限公司 一种银行客户和柜员关系的确定方法、装置及设备
WO2023019452A1 (zh) * 2021-08-17 2023-02-23 益家宝体育科技(深圳)有限公司 社会人物活动永续记录重现互动的方法和系统

Also Published As

Publication number Publication date
CN111090801B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
De Schrijver et al. Prevalence of sexual violence in migrants, applicants for international protection, and refugees in Europe: a critical interpretive synthesis of the evidence
Campbell et al. A systematic review of the relationship between religion and attitudes toward transgender and gender-variant people
Krings et al. Environmental social work in the disciplinary literature, 1991–2015
Rusk et al. Tracing the size, reach, impact, and breadth of positive psychology
Mollen et al. What is normative in health communication research on norms? A review and recommendations for future scholarship
Truong Pro-poor tourism: Looking backward as we move forward
Williams et al. Enacting forensics in homicide investigations
Hemphill et al. Rates of bullying perpetration and victimisation: A longitudinal study of secondary school students in Victoria, Australia
Kafonek et al. An examination of strategies for the prevention of gender-based violence at four-year institutions of higher education
CN111090801A (zh) 一种专家人脉关系图谱绘制方法及系统
Hudson et al. Nonclinical best practices for creating LGBTQ-inclusive care environments: A scoping review of gray literature
Vu et al. Challenges to international students in work-integrated learning: a scoping review
Yang et al. Anti-doping in China: an analysis of the policy implementation processes through stakeholders’ perspectives
Panciroli et al. Mapping RRI dimensions and sustainability into regional development policies and urban planning instruments
Gao Information use in communication research: A citation analysis of faculty publication at the University of Houston
Flynn et al. Trafficking in women for sexual exploitation: Building Australian knowledge
Grant et al. Sexual abuse and exploitation of preK-12 students by school personnel
Kringen et al. Assessing the relevance of statistics and crime analysis courses for working crime analysts
Hutton et al. Children and young people with harmful sexual behaviours: First analysis of data from a Scottish sample
Stevens et al. An exploratory investigation of important qualities and characteristics of Alcoholics Anonymous sponsors
Charman et al. Collective happiness: labour union membership and life satisfaction
Randall et al. The psychological impact of the COVID-19 pandemic on postsecondary students: an analysis of self-determination
Kumar et al. Quantitative demands, burnout, and allied outcomes for Indian police officers
Munro et al. Encouraging pre-registration of research studies
Herold Digital archival image collections: Who are the users?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant