CN113722424A - 一种基于新闻事件的科研方向推荐方法及系统 - Google Patents

一种基于新闻事件的科研方向推荐方法及系统 Download PDF

Info

Publication number
CN113722424A
CN113722424A CN202110820854.4A CN202110820854A CN113722424A CN 113722424 A CN113722424 A CN 113722424A CN 202110820854 A CN202110820854 A CN 202110820854A CN 113722424 A CN113722424 A CN 113722424A
Authority
CN
China
Prior art keywords
subject
hot
term
subject term
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110820854.4A
Other languages
English (en)
Other versions
CN113722424B (zh
Inventor
马艳
邹立达
韩英昆
马雷
刘新
刘科
秦佳峰
李贞�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110820854.4A priority Critical patent/CN113722424B/zh
Publication of CN113722424A publication Critical patent/CN113722424A/zh
Application granted granted Critical
Publication of CN113722424B publication Critical patent/CN113722424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种基于新闻事件的科研方向推荐方法及系统,所述方案包括获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;基于获得的逻辑依赖链实现科研方向的推荐。

Description

一种基于新闻事件的科研方向推荐方法及系统
技术领域
本公开属于计算机技术领域,尤其涉及一种基于新闻事件的科研方向推荐方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
科技工作者经常沉浸在日常的研发工作中,关注社会新闻的时间与机会较少。科技工作者研发目标的确定,常依赖于市场人员的反馈,二手信息导致科技与应用需求的脱节;又或者自己查阅科技文献,科技文献有一定的滞后性,无法给予科技人员最新的科技应用场景。
目前,科技工作者常以浏览新闻的方式了解自身科技领域的需求与发展。较为先进的方法是通过主题的订阅,系统再基于推荐算法推送相关领域的文章给科技工作者。然而,这种被动接收信息的方式,使得科技工作者不易洞察与分析其中应用市场与科学技术联系及关联脉络;同时,也不易对热点事件的重要程度形成客观的认识。即使有人总结,科技工作者也会因为偶然阅读,不能了解其重要程度,从而错失了优先开展研究的机会。因此,亟需设计一种科技情报逻辑依赖链生成系统,可以对当前的社会经济新闻收集、分析,进而对科技工作者进行有效的科研方向推荐。
发明内容
本公开为了解决上述问题,提供了一种基于新闻事件的科研方向推荐方法及系统,所述方案基于新闻事件生成与科研人员科研方向间关联的逻辑依赖链,使科研工作人员实时快速地跟踪与自己研究领域相关的社会热点事件,同时,使科研工作人员更加容易的了解热点事件与自身关注技术的逻辑关系,更加容易总结热点事件在技术领域的应用需求。
根据本公开实施例的第一个方面,提供了一种基于新闻事件的科研方向推荐方法,包括:
获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;
基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;
获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;
基于获得的逻辑依赖链实现科研方向的推荐。
进一步的,所述获取当前热点主题词对应的主题文章,具体为基于获取的每个热点主题词,通过数据爬虫爬取包含有当前热点主题词的文章;基于LDA 方法确定当前热点主题词在文章中的权重;当所述权重满足第一预设阈值要求时,则该文章为当前热点主题词的主题文章。
进一步的,所述根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链,具体为:计算当前热点主题词及其相关的其他关键词热量最高时刻;以每个共有主题词作为逻辑依赖链最后一个主题词,基于直接依赖词查找方法依次生成所述共有主题词的直接依赖词及间接依赖词,直至间接依赖词为当前热点主题词,获得最终的逻辑依赖链。
根据本公开实施例的第二个方面,提供了一种基于新闻事件的科研方向推荐系统,包括:
热点事件获取模块,其用于获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;
主题矩阵模块,其用于基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;
逻辑依赖链生成模块,其用于获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;
科研方向推荐模块,其用于基于获得的逻辑依赖链实现科研方向的推荐。
根据本公开实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种基于新闻事件的科研方向推荐方法。
根据本公开实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种基于新闻事件的科研方向推荐方法。
与现有技术相比,本公开的有益效果是:
(1)本公开所述方案提供了一种基于新闻事件的科研方向推荐方法及系统,所述方案基于新闻事件中的热点主题词,利用热量传导原理生成与其相关的其他主题词,并根据时序及主题词关联度生成所述热点主题词与科研工作人员订阅主题词间的逻辑依赖链;基于获得的逻辑依赖链实现科研方向的推荐;可以使科研工作人员实时快速地跟踪与自己研究领域相关的社会热点事件。
(2)所述方案通过逻辑依赖链可以使科研工作人员更加容易的了解热点事件与自身关注技术的逻辑关系,更加容易总结热点事件在技术领域的应用需求。
本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为本公开实施例一中所述的基于新闻事件的科研方向推荐方法流程图;
图2为本公开实施例二中所述的基于新闻事件的科研方向推荐系统结构示意图。
具体实施方式
下面结合附图与实施例对本公开做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
实施例一:
本实施例的目的是提供一种基于新闻事件的科研方向推荐方法。
如图1所示,一种基于新闻事件的科研方向推荐方法,包括:
获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;
基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;
获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;
基于获得的逻辑依赖链实现科研方向的推荐。
具体的,为了便于理解,以下结合具体实例对本公开所述方案进行详细说明:
步骤1:获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;其主要获得当前社会热点事件的热点主题词,以及该以热点主题词为主要主题的文章。例如,获得当前一个周期的一个热点搜索词,将该热点搜索词推送给主题矩阵模块。并收集以该热点搜索词为主要主题词的新闻文章。
具体的,所述步骤1包括:
(1)在搜索引擎网站,获取一个周期的关键词搜索排名。对排名前n的每个关键词做以下步骤:
(2)设其中一个关键词为ki,利用爬虫工具搜索下载该周期内含有ki的新闻文章。
(3)设h为一篇含有ki的新闻文章。基于LDA技术对h进行分析,若h中ki的权重最高,则认为h是ki的主题文章。
(4)若h是ki的主题文章,将h标识为
Figure RE-GDA0003315050310000061
并加入主题文章库。设ki的主题文章的集合为
Figure RE-GDA0003315050310000062
(5)设主题词ki的热量为ei,则
Figure RE-GDA0003315050310000063
其中,wh为ki在文章h中的 LDA权重,ch为文章h的浏览量。
(6)设γ为主题词最小热量阈值(即第一预设阈值,可根据实际需求自行设定)。若ei>γ,则认为ki是一个关注度较高事件的主题词,对ki的逻辑依赖链进行挖掘,将ki传递依次给主题矩阵模块;否则舍弃ki
步骤2:基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;其主要负责生成与当前热点主题词相关的其他主题词,并将其他主题词对应的主题文章加入主题文章库。
具体的,所述步骤2具体包括:
(1)用W表示待为传导主题词库,待传导主题词库W是临时词库,用以存储初始的热点主题关键词与间接传导的主题关键词。W初始为空。将接收的一个热点主题关键词kx加入待传导主题词库W。将kx加入事件主题词库Kx
(2)若W为空,结束。
(3)若W不为空,从W取出一个主题词,设为ki。将ki的热量传导到其他主题词。设kj为任意一个主题词,kj∈K-ki,其中K为全部主题词库。所述全部主题词库是指自然语言中所有的词语,可以通过国家语委现代汉语语料库获取,也可以通过第三方的自然语言科研机构获得。其中,kj被ki传导的热量设为ej,则
Figure RE-GDA0003315050310000071
其中wi、wj为ki在文章h中ki、kj的LDA权重。
(4)若
Figure RE-GDA0003315050310000072
(其中,
Figure RE-GDA0003315050310000073
即第二预设阈值),则认为kj是ki的一个传递主题词,将其加入主题词库Kx;同时,通过爬虫系统搜索下载该周期内含有kj的新闻文章,形成kj的主题文章的集合为
Figure RE-GDA0003315050310000074
其中g为主题传导的代次数,例如kj是通过搜索引擎排序获得主题词直接传递得到的,则g=1;若kj是通过搜索引擎排序获得主题词两次传递(间接)得到的,则g=2。若
Figure RE-GDA0003315050310000075
则舍弃kj
(5)将kj加入W,返回2)继续执行。
步骤结束后得到的Kx即为kx相关的其他主题词,将Kx发送给逻辑依赖链生成模块生成kx的逻辑依赖链。
步骤3:获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;其主要负责生成从热点词到科技工作者关注领域的逻辑依赖链。形成“热点词》X1》X2》…》Xn》技术领域词”形成的逻辑依赖链供科技工作者参考。
具体的,所述步骤3具体包括:
(1)设科技工作者的订阅的主题词集合为S。
(2)若
Figure RE-GDA0003315050310000076
则说明kx代表的新闻事件与科技工作者所涉及的领域相关。应挖掘Kx∩S中主题词与kx的逻辑依赖链。
(3)若
Figure RE-GDA0003315050310000077
则说明kx代表的新闻事件与科技工作者所涉及的领域不相关。不再挖掘kx与科技工作者所涉及的领域的依赖关系。转到主题矩阵模块挖掘继续挖掘其他的kx
(4)对于所有的ks∈Kx∩S(即所述共有主题词)执行5)至8)步骤。
(5)设kx为此次挖掘的热点事件的主题词,设H为kx以及kx相关主题词的主题文章集合,即
Figure RE-GDA0003315050310000081
(6)计算所有Kx中主题词热量最高时刻,设kj|kj∈Kx热量最高的时刻为tj。把周期分为若干个时间段,在ty时间段内,kj的热量为
Figure RE-GDA0003315050310000082
Figure RE-GDA0003315050310000083
是指在 ty时间段内含主题kj的文章。热量最高时刻即为tj=ty|max(ey)。
(7)设Ls为ks的依赖链,ks为Ls最后一个主题词,也即科技工作者订阅的主题词。基于直接依赖词查找方法(在第8步说明)依次生成ks直接依赖词、第一间接依赖、第二间接依赖……,直到依赖词为kx,则Ls结束完成。Ls生成完毕后,其形式为Ls=kx>>…ki>>…>>ks。其中,ki是ki+1的直接依赖主题词。
其中,所述ki的直接依赖词查找方法如下:
a)Kx=Kx-ki
b)对于所有kj∈Kx且tj<ti,计算kj与时间ki关联度mi,j
Figure RE-GDA0003315050310000084
其中,Hi,j为H中在(tj-α,ti+α)时段同时含有ki与kj主题文章的集合,α是时间松弛系数。hi,j为Hi,j一篇文章,wi与wj为hi,j中ki与kjLDA 权重。其中,Ti,j=tj-ti+2α。其中,
Figure RE-GDA0003315050310000085
为hi,j的点击量。
c)ki的直接依赖词为kd=kj|max(mi,j),kj∈Kx
步骤4:基于获得的逻辑依赖链实现科研方向的推荐,其主要负责根据逻辑依赖链推荐科研方向,即将逻辑依赖链推送给科技工作者,并附上该主题的热门文章。
实施例二:
本实施例的目的是提供一种基于新闻事件的科研方向推荐系统。
一种基于新闻事件的科研方向推荐系统,包括:
热点事件获取模块,其用于获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;
主题矩阵模块,其用于基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;
逻辑依赖链生成模块,其用于获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;
科研方向推荐模块,其用于基于获得的逻辑依赖链实现科研方向的推荐。
具体的,为了便于理解,以下结合附图对本公开所述方案进行详细说明:
如图2所示,本公开所述系统实现主要依赖热点事件获取模块、主题矩阵模块、逻辑依赖生成模块、科研方向推荐模块。
热点事件获取模块负责获得当前社会热点事件的热点主题词,以及该以热点主题词为主要主题的文章。所述热点事件获取模块用主题词代表热点事件,搜索下载以主题词ki为主要主题的文章,然后计算ki的热量,对于热量较大的ki才进行后续的挖掘;热量小的关键词说明其代表热点事件并不是一个具有广泛社会效应的事件,从而舍弃。
主题矩阵模块负责生成与热点主题词相关的其他主题词,并将与热点事件的相关的新闻加入主题文章库。所述主题矩阵模块接收热点事件获取模块的热点主题关键词,并模拟热量传导原理寻找与该热点主题关键词相关的其他主题词。
逻辑依赖链生成模块负责生成从热点词到科技工作者关注领域的逻辑依赖链。形成“热点词》X1》X2》…》Xn》技术领域词”形成的逻辑依赖链供科技工作者参考。所述逻辑依赖链生成模块首先计算各主题词热量最高的时刻,再根据时序及主题相关度形成kx与科技工作者关注主题的逻辑依赖链。
科研方向推荐负责管理科技工作者的关注领域,并根据逻辑依赖链推荐科研方向文章。所述科研方向推荐模块向科技工作者推送基于前面介绍的三个模块生成的逻辑依赖链。具体的,若ks为科技工作者订阅主题词,且Ls成功生成,则推送。在推送的时候,Ls上每个主题词可以附上点击量较大且与前后主题密切相关的文章超链接。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASI C,现成可编程门阵列 FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一中所述的方法。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
上述实施例提供的一种基于新闻事件的科研方向推荐方法及系统可以实现,具有广阔的应用前景。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种基于新闻事件的科研方向推荐方法,其特征在于,包括:
获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;
基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;
获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;
基于获得的逻辑依赖链实现科研方向的推荐。
2.如权利要求1所述的一种基于新闻事件的科研方向推荐方法,其特征在于,所述获取当前热点主题词对应的主题文章,具体为基于获取的每个热点主题词,通过数据爬虫爬取包含有当前热点主题词的文章;基于LDA方法确定当前热点主题词在文章中的权重;当所述权重满足第一预设阈值要求时,则该文章为当前热点主题词的主题文章。
3.如权利要求1所述的一种基于新闻事件的科研方向推荐方法,其特征在于,所述根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链,具体为:计算当前热点主题词及其相关的其他关键词热量最高时刻;以每个共有主题词作为逻辑依赖链最后一个主题词,基于直接依赖词查找方法依次生成所述共有主题词的直接依赖词及间接依赖词,直至间接依赖词为当前热点主题词,获得最终的逻辑依赖链。
4.如权利要求1所述的一种基于新闻事件的科研方向推荐方法,其特征在于,所述热量传导原理中传导热量值的计算公式具体如下:
Figure FDA0003171886970000021
其中,wi、wj为在热点主题词ki所对应主题文章h中,主题词ki、kj的LDA权重。
5.如权利要求1所述的一种基于新闻事件的科研方向推荐方法,其特征在于,所述热点主题词的获取基于搜索引擎网站的关键词搜索排名数据,选择排名靠前预定数量的关键词作为热点主题词。
6.如权利要求1所述的一种基于新闻事件的科研方向推荐方法,其特征在于,所述基于所述主题文章计算热点主题词的热量值,具体公式如下:
Figure FDA0003171886970000022
其中,wh为关键词ki在文章h中的LDA权重,ch为文章h的浏览量,
Figure FDA0003171886970000023
为关键ki的主题文章集合。
7.一种基于新闻事件的科研方向推荐系统,其特征在于,包括:
热点事件获取模块,其用于获取新闻事件中的热点主题词,并获取热点主题词对应的主题文章;
主题矩阵模块,其用于基于所述主题文章计算热点主题词的热量值;对于热量值超过预设阈值的每个热点主题词,基于热量传导原理生成与其相关的其他主题词;
逻辑依赖链生成模块,其用于获取其他主题词集合与待推荐人员所订阅主题词集合的共有主题词;对于每个共有主题词,根据时序及主题词关联度形成所述热点主题词与所述共有主题词间的逻辑依赖链;
科研方向推荐模块,其用于基于获得的逻辑依赖链实现科研方向的推荐。
8.如权利要求7所述的一种基于新闻事件的科研方向推荐系统,其特征在于,所述获取当前热点主题词对应的主题文章,具体为基于获取的每个热点主题词,通过数据爬虫爬取包含有当前热点主题词的文章;基于LDA方法确定当前热点主题词在文章中的权重;当所述权重满足第一预设阈值要求时,则该文章为当前热点主题词的主题文章。
9.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-6任一项所述的一种基于新闻事件的科研方向推荐方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-6任一项所述的一种基于新闻事件的科研方向推荐方法。
CN202110820854.4A 2021-07-20 2021-07-20 一种基于新闻事件的科研方向推荐方法及系统 Active CN113722424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110820854.4A CN113722424B (zh) 2021-07-20 2021-07-20 一种基于新闻事件的科研方向推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110820854.4A CN113722424B (zh) 2021-07-20 2021-07-20 一种基于新闻事件的科研方向推荐方法及系统

Publications (2)

Publication Number Publication Date
CN113722424A true CN113722424A (zh) 2021-11-30
CN113722424B CN113722424B (zh) 2024-02-02

Family

ID=78673648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110820854.4A Active CN113722424B (zh) 2021-07-20 2021-07-20 一种基于新闻事件的科研方向推荐方法及系统

Country Status (1)

Country Link
CN (1) CN113722424B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354333A (zh) * 2015-12-07 2016-02-24 天云融创数据科技(北京)有限公司 一种基于新闻文本的话题提取方法
US9477747B2 (en) * 2013-02-25 2016-10-25 Tencent Technology (Shenzhen) Company Limited Method and apparatus for acquiring hot topics
CN106528755A (zh) * 2016-10-28 2017-03-22 东软集团股份有限公司 热点话题的生成方法及装置
CN109214562A (zh) * 2018-08-24 2019-01-15 国网山东省电力公司电力科学研究院 一种基于rnn的电网科研热点预测与推送方法
CN111198897A (zh) * 2018-11-19 2020-05-26 中国农业大学 科研热点主题分析方法、装置与电子设备
CN111400483A (zh) * 2020-03-17 2020-07-10 重庆邮电大学 基于时间加权的三部图新闻推荐方法
CN111832815A (zh) * 2020-07-02 2020-10-27 山东电力研究院 科研热点预测方法及系统
CN112287102A (zh) * 2019-08-29 2021-01-29 北京京东尚科信息技术有限公司 数据挖掘方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9477747B2 (en) * 2013-02-25 2016-10-25 Tencent Technology (Shenzhen) Company Limited Method and apparatus for acquiring hot topics
CN105354333A (zh) * 2015-12-07 2016-02-24 天云融创数据科技(北京)有限公司 一种基于新闻文本的话题提取方法
CN105354333B (zh) * 2015-12-07 2018-11-06 天云融创数据科技(北京)有限公司 一种基于新闻文本的话题提取方法
CN106528755A (zh) * 2016-10-28 2017-03-22 东软集团股份有限公司 热点话题的生成方法及装置
CN109214562A (zh) * 2018-08-24 2019-01-15 国网山东省电力公司电力科学研究院 一种基于rnn的电网科研热点预测与推送方法
CN111198897A (zh) * 2018-11-19 2020-05-26 中国农业大学 科研热点主题分析方法、装置与电子设备
CN112287102A (zh) * 2019-08-29 2021-01-29 北京京东尚科信息技术有限公司 数据挖掘方法和装置
CN111400483A (zh) * 2020-03-17 2020-07-10 重庆邮电大学 基于时间加权的三部图新闻推荐方法
CN111832815A (zh) * 2020-07-02 2020-10-27 山东电力研究院 科研热点预测方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
吕鹏辉;李晶晶;杨善林;: "科学创新视角下的学科共词网络演化研究", 情报学报, no. 11 *
张宇航;姚文娟;姜姗;: "个性化推荐系统综述", 价值工程, no. 02 *
程肖;陆蓓;谌志群;: "热点主题词提取方法研究", 现代图书情报技术, no. 10 *
马艳: "基于标准时序生成的科研热点预测及加速方法", 山东电力技术 *

Also Published As

Publication number Publication date
CN113722424B (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
Rahman et al. Improving ir-based bug localization with context-aware query reformulation
Sharma et al. A comparative analysis of web page ranking algorithms
Varelas et al. Semantic similarity methods in wordnet and their application to information retrieval on the web
US8321424B2 (en) Bipartite graph reinforcement modeling to annotate web images
JP5494454B2 (ja) 検索結果生成方法、検索結果生成プログラムおよび検索システム
US9251274B2 (en) Grouping search results into a profile page
US20100010982A1 (en) Web content characterization based on semantic folksonomies associated with user generated content
JPWO2014050002A1 (ja) クエリ類似度評価システム、評価方法、及びプログラム
CN111522905A (zh) 一种基于数据库的文档搜索方法和装置
US20080091672A1 (en) Process for analyzing interrelationships between internet web sited based on an analysis of their relative centrality
Zhuang et al. What's there and what's not? Focused crawling for missing documents in digital libraries
Jiang et al. Chronological citation recommendation with information-need shifting
US20110131536A1 (en) Generating and ranking information units including documents associated with document environments
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
US20160299972A1 (en) Providing app store search results
TW201820181A (zh) 累加檢索處理方法和裝置
Khalid et al. Supporting scholarly search by query expansion and citation analysis
Deng et al. Improving personalized search with dual-feedback network
CN113722424A (zh) 一种基于新闻事件的科研方向推荐方法及系统
Ren et al. Role-explicit query extraction and utilization for quantifying user intents
Cameron et al. Semantics-empowered text exploration for knowledge discovery
Ceroni et al. Towards an entity–based automatic event validation
JP5538459B2 (ja) 情報処理装置及び方法
Khan Comparative study of information retrieval models used in search engine
Amin et al. A score based web page ranking algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220119

Address after: 250003 No. 2000, Wang Yue Road, Shizhong District, Ji'nan, Shandong

Applicant after: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID SHANDONG ELECTRIC POWER Co.

Applicant after: STATE GRID CORPORATION OF CHINA

Address before: 250003 No. 2000, Wang Yue Road, Shizhong District, Ji'nan, Shandong

Applicant before: SHANDONG ELECTRIC POWER Research Institute

Applicant before: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID SHANDONG ELECTRIC POWER Co.

Applicant before: STATE GRID CORPORATION OF CHINA

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant