CN109800288A - 一种基于知识图谱的科学研究热点分析与预测方法 - Google Patents

一种基于知识图谱的科学研究热点分析与预测方法 Download PDF

Info

Publication number
CN109800288A
CN109800288A CN201910058235.9A CN201910058235A CN109800288A CN 109800288 A CN109800288 A CN 109800288A CN 201910058235 A CN201910058235 A CN 201910058235A CN 109800288 A CN109800288 A CN 109800288A
Authority
CN
China
Prior art keywords
theme
word
keyword
research
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910058235.9A
Other languages
English (en)
Other versions
CN109800288B (zh
Inventor
张子柯
李丽霞
任卓明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Normal University
Original Assignee
Hangzhou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Normal University filed Critical Hangzhou Normal University
Priority to CN201910058235.9A priority Critical patent/CN109800288B/zh
Publication of CN109800288A publication Critical patent/CN109800288A/zh
Application granted granted Critical
Publication of CN109800288B publication Critical patent/CN109800288B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于知识图谱的科学研究热点分析与预测方法。本发明方法通过关键词的共词关系确定研究主题,并根据高频的核心词,中、高频的突变词和新生词分布情况划分热点研究主题、突变研究主题、新兴研究主题和一般研究主题,最后从主题间的内在交叉关系和主题的变化情况两个角度出发,解读知识图谱的研究主题结构和趋势以预测其中三大研究主题的未来发展。本发明方法首先进行关键词提取与对齐,然后分析关键词共现网络,确定研究主题,构建完整科学知识图谱,最后解读知识图谱,探测主题演进趋势。本发明方法对主题趋势的挖掘更有针对性,分析结果更加客观准确。

Description

一种基于知识图谱的科学研究热点分析与预测方法
技术领域
本发明属于计算机技术领域,具体属于数据分析技术领域,涉及一种基于知识图谱的科学研究热点分析与预测方法。
背景技术
快速、准确地掌握学科研究领域的发展动态,了解科学研究现状、最新势态以及未来趋势从而找到科技创新的突破口,是所有研究人员的迫切需求。
近些年,科学知识图谱作为一种追踪现实科学知识发展动态、探测知识结构、识别热点领域的新手段正在蓬勃兴起,并成为科学计量学最具前景的研究方向。科学知识图谱技术能刻画知识元或知识群之间的网络、结构、互动、交叉、演化或衍生等诸多复杂关系,相对于传统的知识体系具备了知识推理的逻辑结构能力,使分析结果更加客观准确。
自陈悦、刘则渊在《科学学研究》杂志上发表《悄然兴起的科学知识图谱》之后,迅速掀起国内知识图谱研究热潮。众多学者利用知识图谱技术从不同角度展开了“科学研究前沿分析”的研究,但是现有的研究大多以关键词的角度分析研究主题的演化趋势,可研究主题的演化受多种因素影响,如研究主题关注程度,研究人员相互影响,学科之间相互渗透等。
近代和现代科学发展的历史表明,科学上的重大突破、新的生长点乃至新研究主题的产生,常常在不同的学科彼此交叉和相互渗透的过程中实现,所以学科之间相互渗透是影响研究主题未来发展趋势的重要因素。结合强调主题间交叉关系的研究主题结构研究和强调主题变化情况的研究主题趋势研究,可以更好地揭示某一领域研究主题在过去的发展状况并预测未来的发展趋势。
发明内容
本发明的目的就是提供一种基于知识图谱的科学研究热点分析与预测方法。
本发明方法通过关键词的共词关系确定研究主题,并根据高频的核心词,中、高频的突变词和新生词分布情况划分热点研究主题、突变研究主题、新兴研究主题和一般研究主题,最后从主题间的内在交叉关系和主题的变化情况两个角度出发,解读知识图谱的研究主题结构和趋势以预测其中三大研究主题的未来发展。
本发明方法具体包括如下步骤:
步骤1.关键词提取与对齐,方法如下:
(1-1)关键词提取:
根据已提供的关键词创建关键词表,对英文的题目、摘要进行分词和去停用词,以双向最大匹配算法匹配关键词表从而抽取关键词词串;双向最大匹配法算法使用正向最大匹配法和逆向最大匹配法进行切分,以大粒度词优先、非词表词最少为原则的分词结果选取关键词;
(1-2)关键词对齐:
a.以经过分词、去停用词处理的摘要作为word2vec的训练数据,生成词向量,计算每个关键词词组中每个词的词向量x加权平均和作为关键词向量,得到任意两个关键词实体ei、ej的词相似性simKW
simKW(ei,ej)=simKWi,1xi,1+…+αi,mxi,mj,1xj,1+…+αj,nxj,n);
两个关键词词组ei、ej分别由m、n个单词构成,α为每个词在关键词词组中的权重占比;
b.构建关键词共词网络,计算相似关键词集W中任意两个关键词实体ei、ej的邻居相似性simNB,根据simNB对相似关键词集进行初步划分,选取simNB大于设定值的关键词集作为备选词集,进一步通过关键词的内部单词结构和在共现网络中共现邻居结构相似度高的两个关键词为对齐关系,使关键词准确对齐:其中,ei′、ej′为关键词实体ei、ej对应的所有邻居关键词,N为参与计算的邻居关键词对个数,设定值为0.5~1。
步骤2.分析关键词共现网络,确定研究主题:
(2-1)词频计算:
结合词频g指数和实际数据的词频分布情况作为选取中高频词的依据,以1~5年的等长时间距离划分时间窗,统计每个时间窗中出现的中高频词词频次数并计算词频变化情况,并按核心词,新兴词,突变词本身的特点进行识别;
所述的核心词为共词网络中居于核心位置的高频词;
所述的突变词为在不同的时间窗下,词频发生显著变化的中、高频词;
所述的新兴词为具有新兴趋势,快速出现并进入中高频区域呈稳定状态的中、高频词;
(2-2)确定研究主题:
中高频关键词在同一个项目中的频率作为关键词之间的联系密切程度,利用ochiia系数计算关键词相关矩阵;以欧式距离衡量点间距离,聚类关键词形成词簇,确定研究主题;A关键词与B关键词的ochiia系数:(2-3)可视化主题结构:
计算衡量主题T与其他主题间关键词相互作用情况的向心度ST和主题T内关键词紧密程度的密度DT,并通过战略坐标图可视化所有研究主题的主题结构,战略坐标图以向心度ST为横坐标,以密度DT为纵坐标:
其中,O为ochiia系数,k和l为主题T的内部关键词,w为不属于主题T的关键词,Q为总词数,q为主题T内的关键词数量;
通过度量在不同时间窗下主题所处象限情况和主题内核心词、新兴词、突变词分布情况,确定热点研究主题、突变研究主题和新兴研究主题:在战略坐标图中,位于第一象限的主题为核心研究主题,其主题内部联系紧密,内部结构稳定;第二象限的主题为成熟研究主题,内部结构稳定,但与其他主题联系松散;第三象限的主题内部结构松散,研究不够成熟;第四象限的主题为活跃主题,但与其他主题联系比较紧密,是潜在的发展主题;通过向心度和密度了解所有研究主题的结构概况。
步骤3.构建完整科学知识图谱:
对项目所属学科、项目申请时间等其他结构化数据进行数据融合,保证每个关键词对应到其所属学科,构建完整的科学知识图谱,涉及的知识加工手段包括知识推理、质量评估。
步骤4.解读知识图谱,探测主题演进趋势:
(4-1)挖掘主题间交叉关系和内部结构变化:
所有主题下的关键词频率将通过该主题涉及的总关键词频率进行归一化,利用KL散度计算主题之间的信息增益;KL值为0时,两大研究主题的关键词分布则完全相同;
通过观察每个时间窗下三大研究主题类型中所有主题的KL值,得到任意两个主题在不同时间窗下的主题交叉情况和所有主题在演进过程中的内部结构变化幅度,挖掘出三大类型的研究主题演进存在的规律和内部共性以预测未来的主题交叉情况;
(4-2)分析包含主题间因果关系的主题变化情况:
对存在显著Granger因果关系的主题对,对所有主题对应用霍克斯过程模型,通过建立某一主题历史行为与另一主题当前行为的关系计算主题之间的影响强度,构建主题影响网络;表示因果关系的影响显著性的P值小于0.05的,表示主题对存在显著Granger因果关系;
不同时间窗的主题影响网络通过对比和追踪核心词、突变词、新生词的变化,识别核心主题、突变主题以及新兴主题的变化情况和趋势,通过社会网络分析法可视化三大类型演进的内部影响结构,对研究主题变化情况的分析和对未来趋势进行推断。
本发明通过精细的划分热点研究主题、突变研究主题、新兴研究主题和一般研究主题,并从主题间的内在交叉关系和主题的变化情况两个角度出发解读知识图谱,挖掘其中三大类型研究主题结构和呈现的趋势以预测三大研究主题的未来发展,此为技术方案的关键点。
本发明方法相对于传统的知识体系,科学知识图谱的应用使知识体系具备了知识推理的逻辑结构能力,使知识体系更加完整,分析结果更加客观准确。
本发明方法对热点研究主题、突变研究主题、新兴研究主题和一般研究主题的划分,对主题趋势的挖掘更有针对性。
本发明方法从主题间的内在交叉关系和主题的变化情况两个角度出发解读知识图谱,可挖掘主题结构,主题趋势和主题之间的影响关系,更加有深度地对主题发展展开研究。
附图说明
图1是本发明方法的流程图。
具体实施方式
下面结合附图进一步说明本发明的技术方案:
如图1所示,一种基于知识图谱的科学研究热点分析与预测方法,具体步骤是:
步骤1.关键词提取与对齐:
自然科学基金项目数据提供了部分项目的关键词,对于不包含关键词的项目则需从题目和摘要中提取关键词,通过计算关键词向量相似性和与之关联的邻居关键词实体相似性,实现关键词对齐。
(1)关键词提取:
根据已提供的关键词创建关键词表,对英文的题目、摘要进行分词和去停用词,以双向最大匹配算法匹配关键词表从而抽取关键词词串;双向最大匹配法算法使用正向最大匹配法和逆向最大匹配法进行切分,以大粒度词优先、非词表词最少为原则的分词结果选取关键词。
(2)关键词对齐:
a.以经过分词、去停用词处理的摘要作为word2vec的训练数据,从而生成词向量,计算每个关键词词组中每个词的词向量x加权平均和作为关键词向量,得到任意两个关键词实体ei、ej的词相似性simKW,其中word2vec为用于词向量计算的Google开源工具:
simKW(ei,ej)=simKWi,1xi,1+…+αi,mxi,mj,1xj,1+…+αj,nxj,n);
两个关键词词组ei、ej分别由m、n个单词构成,α为每个词在关键词词组中的权重占比。
b.构建关键词共词网络,共同出现在同一项目中的关键词则存在相邻关系,计算相似关键词集W中任意两个关键词实体ei、ej的邻居相似性simNB,为减少计算工作量,根据simNB对相似关键词集进行初步划分,选取simNB大于设定值的关键词集作为备选词集,进一步通过关键词的内部单词结构和在共现网络中共现邻居结构相似度高的两个关键词为对齐关系,使关键词准确对齐:
其中,ei′、ej′为关键词实体ei、ej对应的所有邻居关键词,N为参与计算的邻居关键词对个数,设定值为0.5~1。
步骤2.分析关键词共现网络,确定研究主题:
计算关键词词频和词频变化,识别核心词、突变词、新兴词,关键词共同出现在同一个项目中的频率作为关键词之间的联系密切程度,将属于同一个主题的关键词聚集在同一个类中,使得类团内属性相似性最大,类团间属性相似性最小,从而确定研究主题。通过度量在不同时间窗下主题所处象限情况和主题内核心词、突变词、新兴词的分布情况划分热点研究主题、突变研究主题和新兴研究主题。战略坐标作为研究主题结构的可视化工具,即可以帮助不同类型研究主题更加清晰划分,并且通过向心度和密度可了解所有研究主题的内部结构概况。
(1)词频计算:
结合词频g指数和实际数据的词频分布情况作为选取中高频词的依据,以1~5年的等长时间距离划分时间窗,统计每个时间窗中出现的中高频词词频次数并计算词频变化情况,并按核心词,新兴词,突变词本身的特点进行识别;
所述的核心词为共词网络中居于核心位置的高频词;
所述的突变词为在不同的时间窗下,词频发生显著变化的中、高频词;
所述的新兴词为具有新兴趋势,快速出现并进入中高频区域呈稳定状态的中、高频词。
(2)确定研究主题:
中高频关键词在同一个项目中的频率作为关键词之间的联系密切程度,利用ochiia系数计算关键词相关矩阵;以欧式距离衡量点间距离,聚类关键词形成词簇,确定研究主题;
A关键词与B关键词的ochiia系数:
(3)可视化主题结构:
计算衡量主题T与其他主题间关键词相互作用情况的向心度ST和主题T内关键词紧密程度的密度DT,并通过战略坐标图可视化所有研究主题的主题结构,战略坐标图以向心度ST为横坐标,以密度DT为纵坐标:
其中,O为ochiia系数,k和l为主题T的内部关键词,w为不属于主题T的关键词,Q为总词数,q为主题T内的关键词数量。
通过度量在不同时间窗下主题所处象限情况和主题内核心词、新兴词、突变词分布情况,确定热点研究主题、突变研究主题和新兴研究主题:在战略坐标图中,位于第一象限的主题为核心研究主题,其主题内部联系紧密,内部结构稳定;第二象限的主题为成熟研究主题,内部结构稳定,但与其他主题联系松散;第三象限的主题内部结构松散,研究不够成熟;第四象限的主题为活跃主题,但与其他主题联系比较紧密,是潜在的发展主题;
热点研究主题由高频核心词聚集而成,是具有一定规模且内部结构稳定的词群;突变主题的词群包含大量突变词,在不同时间窗下变化非常显著;新兴研究主题以新兴词为主,词群内初始分布较为松散,但可能成长为核心主题;
结合主题内不同类型关键词的分布情况,对战略坐标可视化图分析可以清晰的划分不同类型研究主题,并且通过向心度和密度可以了解所有研究主题的结构概况。
步骤3.构建完整科学知识图谱:
对项目所属学科、项目申请时间等其他结构化数据进行数据融合,保证每个关键词对应到其所属学科,构建完整的科学知识图谱,涉及的知识加工手段包括知识推理、质量评估;
步骤4.解读知识图谱,探测主题演进趋势:
从“主题间交叉关系和内部结构变化挖掘”和“包含主题间因果关系的主题变化情况分析”两个方面解读知识图谱。通过KL散度计算主题交叉情况和主题内部结构变化幅度,挖掘三大类型主题演进存在的规律和内部共性以预测未来的主题交叉情况。针对不同时间窗下由主题间影响强度构建的主题影响网络,对比和追踪核心词、突变词、新生词的变化,识别核心主题、突变主题以及新兴主题的变化情况和趋势,并以社会网络分析法可视化三大类型演进的内部影响结构,用以对研究主题变化情况的分析和对未来趋势的推断。
(1)挖掘主题间交叉关系和内部结构变化:
所有主题下的关键词频率将通过该主题涉及的总关键词频率进行归一化,利用KL散度计算主题之间的信息增益;KL值为0时,两大研究主题的关键词分布则完全相同;通过观察每个时间窗下三大研究主题类型中所有主题的KL值,得到任意两个主题在不同时间窗下的主题交叉情况和所有主题在演进过程中的内部结构变化幅度,挖掘出三大类型的研究主题演进存在的规律和内部共性以预测未来的主题交叉情况;
(2)分析包含主题间因果关系的主题变化情况:
为进一步观察主题间交叉关系带来的影响,对存在显著Granger因果关系的主题对,对所有主题对应用HP(Hawkes Process,霍克斯过程)模型,通过建立某一主题历史行为与另一主题当前行为的关系计算主题之间的影响强度,从而构建主题影响网络;表示因果关系的影响显著性的P值小于0.05的,表示主题对存在显著Granger因果关系。
不同时间窗的主题影响网络通过对比和追踪核心词、突变词、新生词的变化,识别核心主题、突变主题以及新兴主题的变化情况和趋势,并通过社会网络分析法可视化三大类型演进的内部影响结构,用以对研究主题变化情况的分析和对未来趋势的推断。

Claims (6)

1.一种基于知识图谱的科学研究热点分析与预测方法,其特征在于该方法具体步骤包括:
步骤1.关键词提取与对齐;
步骤2.分析关键词共现网络,确定研究主题:
(2-1)词频计算:
结合词频g指数和实际数据的词频分布情况作为选取中高频词的依据,以1~5年的等长时间距离划分时间窗,统计每个时间窗中出现的中高频词词频次数并计算词频变化情况,并按核心词,新兴词,突变词本身的特点进行识别;
(2-2)确定研究主题:
中高频关键词在同一个项目中的频率作为关键词之间的联系密切程度,利用ochiia系数计算关键词相关矩阵;以欧式距离衡量点间距离,聚类关键词形成词簇,确定研究主题;
A关键词与B关键词的ochiia系数:
(2-3)可视化主题结构:
计算衡量主题T与其他主题间关键词相互作用情况的向心度ST和主题T内关键词紧密程度的密度DT,并通过战略坐标图可视化所有研究主题的主题结构,战略坐标图以向心度ST为横坐标,以密度DT为纵坐标:
其中,O为ochiia系数,k和l为主题T的内部关键词,w为不属于主题T的关键词,Q为总词数,q为主题T内的关键词数量;
通过度量在不同时间窗下主题所处象限情况和主题内核心词、新兴词、突变词分布情况,确定热点研究主题、突变研究主题和新兴研究主题:在战略坐标图中,位于第一象限的主题为核心研究主题,其主题内部联系紧密,内部结构稳定;第二象限的主题为成熟研究主题,内部结构稳定,但与其他主题联系松散;第三象限的主题内部结构松散,研究不够成熟;第四象限的主题为活跃主题,但与其他主题联系比较紧密,是潜在的发展主题;通过向心度和密度了解所有研究主题的结构概况;
步骤3.构建完整科学知识图谱:
对项目所属学科、项目申请时间等其他结构化数据进行数据融合,保证每个关键词对应到其所属学科,构建完整的科学知识图谱,涉及的知识加工手段包括知识推理、质量评估;
步骤4.解读知识图谱,探测主题演进趋势:
(4-1)挖掘主题间交叉关系和内部结构变化:
所有主题下的关键词频率将通过该主题涉及的总关键词频率进行归一化,利用KL散度计算主题之间的信息增益;KL值为0时,两大研究主题的关键词分布则完全相同;通过观察每个时间窗下三大研究主题类型中所有主题的KL值,得到任意两个主题在不同时间窗下的主题交叉情况和所有主题在演进过程中的内部结构变化幅度,挖掘出三大类型的研究主题演进存在的规律和内部共性以预测未来的主题交叉情况;
(4-2)分析包含主题间因果关系的主题变化情况:
对存在显著Granger因果关系的主题对,对所有主题对应用霍克斯过程模型,通过建立某一主题历史行为与另一主题当前行为的关系计算主题之间的影响强度,构建主题影响网络;表示因果关系的影响显著性的P值小于0.05的,表示主题对存在显著Granger因果关系;
不同时间窗的主题影响网络通过对比和追踪核心词、突变词、新生词的变化,识别核心主题、突变主题以及新兴主题的变化情况和趋势,通过社会网络分析法可视化三大类型演进的内部影响结构,对研究主题变化情况的分析和对未来趋势进行推断。
2.如权利要求1所述的一种基于知识图谱的科学研究热点分析与预测方法,其特征在于:步骤1中所述的关键词提取是根据已提供的关键词创建关键词表,对英文的题目、摘要进行分词和去停用词,以双向最大匹配算法匹配关键词表从而抽取关键词词串;双向最大匹配法算法使用正向最大匹配法和逆向最大匹配法进行切分,以大粒度词优先、非词表词最少为原则的分词结果选取关键词。
3.如权利要求1所述的一种基于知识图谱的科学研究热点分析与预测方法,其特征在于:所述的步骤1中关键词对齐的具体方法是:
a.以经过分词、去停用词处理的摘要作为word2vec的训练数据,生成词向量,计算每个关键词词组中每个词的词向量x加权平均和作为关键词向量,得到任意两个关键词实体ei、ej的词相似性simKW:simKW(ei,ej)=simKWi,1xi,1+…+αi,mxi,mj,1xj,1+…+αj,nxj,n);
两个关键词词组ei、ej分别由m、n个单词构成,α为每个词在关键词词组中的权重占比;
b.构建关键词共词网络,计算相似关键词集W中任意两个关键词实体ei、ej的邻居相似性simNB,根据simNB对相似关键词集进行初步划分,选取simNB大于设定值的关键词集作为备选词集,进一步通过关键词的内部单词结构和在共现网络中共现邻居结构相似度高的两个关键词为对齐关系,使关键词准确对齐:
其中,ei′、ej′为关键词实体ei、ej对应的所有邻居关键词,N为参与计算的邻居关键词对个数,设定值为0.5~1。
4.如权利要求1所述的一种基于知识图谱的科学研究热点分析与预测方法,其特征在于:步骤2中所述的核心词为共词网络中居于核心位置的高频词。
5.如权利要求1所述的一种基于知识图谱的科学研究热点分析与预测方法,其特征在于:步骤2中所述的突变词为在不同的时间窗下,词频发生显著变化的中、高频词。
6.如权利要求1所述的一种基于知识图谱的科学研究热点分析与预测方法,其特征在于:步骤2中所述的新兴词为具有新兴趋势,快速出现并进入中高频区域呈稳定状态的中、高频词。
CN201910058235.9A 2019-01-22 2019-01-22 一种基于知识图谱的科学研究热点分析与预测方法 Active CN109800288B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910058235.9A CN109800288B (zh) 2019-01-22 2019-01-22 一种基于知识图谱的科学研究热点分析与预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910058235.9A CN109800288B (zh) 2019-01-22 2019-01-22 一种基于知识图谱的科学研究热点分析与预测方法

Publications (2)

Publication Number Publication Date
CN109800288A true CN109800288A (zh) 2019-05-24
CN109800288B CN109800288B (zh) 2020-12-15

Family

ID=66559974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910058235.9A Active CN109800288B (zh) 2019-01-22 2019-01-22 一种基于知识图谱的科学研究热点分析与预测方法

Country Status (1)

Country Link
CN (1) CN109800288B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378532A (zh) * 2019-07-19 2019-10-25 中南大学 一种基于随机树的科研主题状态预测方法
CN111160025A (zh) * 2019-12-12 2020-05-15 日照睿安信息科技有限公司 一种基于公安文本的主动发现案件关键词的方法
CN112187890A (zh) * 2020-09-15 2021-01-05 卢霞浩 基于云计算和大数据的信息分发方法及区块链金融云中心
CN112883148A (zh) * 2021-01-15 2021-06-01 上海柏观数据科技有限公司 一种基于研究趋势匹配的学科人才评价控制方法和装置
WO2021128529A1 (zh) * 2019-12-25 2021-07-01 北京中技华软科技服务有限公司 一种技术趋势预测方法和系统
CN113239071A (zh) * 2021-07-08 2021-08-10 北京邮电大学 面向科技资源学科及研究主题信息的检索查询方法及系统
CN113722440A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于关键词识别的显著性分析方法及相关产品
CN115841110A (zh) * 2022-12-05 2023-03-24 武汉理工大学 一种获取科学知识发现的方法及系统
CN116910277A (zh) * 2023-09-13 2023-10-20 之江实验室 知识图谱构建方法、资源查找方法、计算机设备和介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140297644A1 (en) * 2013-04-01 2014-10-02 Tencent Technology (Shenzhen) Company Limited Knowledge graph mining method and system
CN104636424A (zh) * 2014-12-02 2015-05-20 南昌大学 一种基于图谱分析构建文献综述框架的方法
CN105740466A (zh) * 2016-03-04 2016-07-06 百度在线网络技术(北京)有限公司 一种挖掘热点概念之间关联关系的方法和装置
CN106682172A (zh) * 2016-12-28 2017-05-17 江苏大学 一种基于关键词的文献研究热点推荐方法
CN106844603A (zh) * 2017-01-16 2017-06-13 竹间智能科技(上海)有限公司 实体热门度的计算方法及装置、应用方法及装置
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN106960025A (zh) * 2017-03-19 2017-07-18 北京工业大学 一种基于领域知识图谱的个性化文献推荐方法
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
CN108920588A (zh) * 2018-06-26 2018-11-30 北京光年无限科技有限公司 一种用于人机交互的知识图谱更新方法及系统
CN108959378A (zh) * 2018-05-28 2018-12-07 天津大学 文献热点的可视化分析方法
CN108984647A (zh) * 2018-06-26 2018-12-11 北京工业大学 一种基于中文文本的水务领域知识图谱构建方法
CN109033160A (zh) * 2018-06-15 2018-12-18 东南大学 一种知识图谱动态更新方法
US20190012377A1 (en) * 2017-07-05 2019-01-10 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for generating text tag

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
US20140297644A1 (en) * 2013-04-01 2014-10-02 Tencent Technology (Shenzhen) Company Limited Knowledge graph mining method and system
CN104636424A (zh) * 2014-12-02 2015-05-20 南昌大学 一种基于图谱分析构建文献综述框架的方法
CN105740466A (zh) * 2016-03-04 2016-07-06 百度在线网络技术(北京)有限公司 一种挖掘热点概念之间关联关系的方法和装置
CN106682172A (zh) * 2016-12-28 2017-05-17 江苏大学 一种基于关键词的文献研究热点推荐方法
CN106844603A (zh) * 2017-01-16 2017-06-13 竹间智能科技(上海)有限公司 实体热门度的计算方法及装置、应用方法及装置
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN106960025A (zh) * 2017-03-19 2017-07-18 北京工业大学 一种基于领域知识图谱的个性化文献推荐方法
US20190012377A1 (en) * 2017-07-05 2019-01-10 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for generating text tag
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
CN108959378A (zh) * 2018-05-28 2018-12-07 天津大学 文献热点的可视化分析方法
CN109033160A (zh) * 2018-06-15 2018-12-18 东南大学 一种知识图谱动态更新方法
CN108920588A (zh) * 2018-06-26 2018-11-30 北京光年无限科技有限公司 一种用于人机交互的知识图谱更新方法及系统
CN108984647A (zh) * 2018-06-26 2018-12-11 北京工业大学 一种基于中文文本的水务领域知识图谱构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘敏娟: ""基于知识图谱的学科主题识别方法研究"", 《万方数据》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378532B (zh) * 2019-07-19 2021-12-14 中南大学 一种基于随机树的科研主题状态预测方法
CN110378532A (zh) * 2019-07-19 2019-10-25 中南大学 一种基于随机树的科研主题状态预测方法
CN111160025A (zh) * 2019-12-12 2020-05-15 日照睿安信息科技有限公司 一种基于公安文本的主动发现案件关键词的方法
WO2021128529A1 (zh) * 2019-12-25 2021-07-01 北京中技华软科技服务有限公司 一种技术趋势预测方法和系统
CN112187890A (zh) * 2020-09-15 2021-01-05 卢霞浩 基于云计算和大数据的信息分发方法及区块链金融云中心
CN112883148B (zh) * 2021-01-15 2023-03-28 博观创新(上海)大数据科技有限公司 一种基于研究趋势匹配的学科人才评价控制方法和装置
CN112883148A (zh) * 2021-01-15 2021-06-01 上海柏观数据科技有限公司 一种基于研究趋势匹配的学科人才评价控制方法和装置
CN113239071A (zh) * 2021-07-08 2021-08-10 北京邮电大学 面向科技资源学科及研究主题信息的检索查询方法及系统
CN113722440A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于关键词识别的显著性分析方法及相关产品
CN113722440B (zh) * 2021-08-31 2023-06-16 平安科技(深圳)有限公司 基于关键词识别的显著性分析方法及相关产品
CN115841110A (zh) * 2022-12-05 2023-03-24 武汉理工大学 一种获取科学知识发现的方法及系统
CN115841110B (zh) * 2022-12-05 2023-08-11 武汉理工大学 一种获取科学知识发现的方法及系统
CN116910277A (zh) * 2023-09-13 2023-10-20 之江实验室 知识图谱构建方法、资源查找方法、计算机设备和介质
CN116910277B (zh) * 2023-09-13 2024-02-27 之江实验室 知识图谱构建方法、资源查找方法、计算机设备和介质

Also Published As

Publication number Publication date
CN109800288B (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN109800288A (zh) 一种基于知识图谱的科学研究热点分析与预测方法
CN105844709B (zh) 复杂河道地形流域洪水演进虚拟仿真的淹没线追踪方法
Bremer et al. Interactive exploration and analysis of large-scale simulations using topology-based data segmentation
CN108694469A (zh) 一种基于知识图谱的关系预测方法
CN109299811A (zh) 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法
CN103955542B (zh) 文本词间完全加权正负关联模式挖掘方法及其挖掘系统
CN103745191B (zh) 一种基于地形分析的黄土地区塬梁峁自动识别方法
CN107784598A (zh) 一种网络社区发现方法
Liu et al. Identification of rock discontinuity sets based on a modified affinity propagation algorithm
Chen et al. Optimizing parallel performance of streamline visualization for large distributed flow datasets
CN109882164A (zh) 一种裂缝性碳酸盐岩油藏的大尺度酸化模拟方法
CN104462374A (zh) 一种广义最大度随机游走图抽样算法
CN107100611A (zh) 一种地质勘探钻进过程双层智能钻速建模方法
CN109839493A (zh) 地下工程岩体质量评价方法、装置、存储介质及电子设备
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN109492076A (zh) 一种基于网络的社区问答网站答案可信评估方法
Zhong et al. The big data processing algorithm for water environment monitoring of the three gorges reservoir area
CN113255895A (zh) 基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法
CN106844736B (zh) 基于时空网络的时空同现模式挖掘方法
CN112861890A (zh) 一种储层评价模型构建方法及储层识别方法
CN116029618B (zh) 一种电力系统动态安全分区评估方法及系统
CN103235879A (zh) 基于小生境主从式并行遗传算法的双相介质参数反演方法
Nguyen et al. A method for efficient clustering of spatial data in network space
Yan et al. A novel method for identifying geomechanical parameters of rock masses based on a PSO and improved GPR hybrid algorithm
van Walsum et al. Selective visualization of vector fields

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant