CN115080694A - 一种基于知识图谱的电力行业信息分析方法及设备 - Google Patents

一种基于知识图谱的电力行业信息分析方法及设备 Download PDF

Info

Publication number
CN115080694A
CN115080694A CN202210735319.3A CN202210735319A CN115080694A CN 115080694 A CN115080694 A CN 115080694A CN 202210735319 A CN202210735319 A CN 202210735319A CN 115080694 A CN115080694 A CN 115080694A
Authority
CN
China
Prior art keywords
knowledge
entity
data
graph
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210735319.3A
Other languages
English (en)
Inventor
赵金雄
马志程
狄磊
马宏忠
赵红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE
Original Assignee
STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE filed Critical STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE
Priority to CN202210735319.3A priority Critical patent/CN115080694A/zh
Publication of CN115080694A publication Critical patent/CN115080694A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明提供了一种基于知识图谱的电力行业信息分析方法及设备,涉及数据处理技术领域,具体步骤包括:构建知识本体;基于电力科技信息知识本体对原始数据进行数据处理,非结构化数据进行命名实体识别和关系抽取,和结构化数据进行知识融合,进一步构成三元组;将所述三元组导入数据库,构建知识图谱;用户接入所述知识图谱,输入检索语句,将所述检索语句嵌入为词向量并与所述知识图谱中的实体向量进行相似度匹配,获取实体信息及关系信息。本发明提供的电力行业信息分析方法及设备利用知识图谱进行知识融合和知识推理,形成高质量的知识库。检索时能更好地捕捉句子的语义信息,并且能找到知识图谱中与待搜索物品语义强相关的信息。

Description

一种基于知识图谱的电力行业信息分析方法及设备
技术领域
本发明属于数据处理技术领域,特别是涉及一种基于知识图谱的电力行业信息分析方法及设备。
背景技术
面对经济快速发展的趋势,了解并掌握专利数据中包含的科技信息等内容,对推动企业及个人的创业创新有重要影响,对及时接触并深入了解不同领域科技前沿动态也有重要意义。专利相关数据包含了许多科技信息,其中发明创造专利包含了大量前沿技术,具有创新性和市场竞争力,在行业内也有比较高的价值,同时专利也可以帮助用户、企业等详细了解更多的信息与知识数据。
在实际应用中,目前很多公司将知识图谱应用于搜索与推荐领域,已经达到了很好的效果。知识图谱中含有大量专利相关的实体数据,涉及专利的多个属性,通过构建知识图谱可以将从专利文本数据中抽取到的很多知识信息联系在一起,包含了丰富的语义关系。推荐算法在应用过程中缺乏对语义的理解,通过将知识图谱相关内容引入推荐系统中,可以充分利用专利知识图谱中的实体、属性及实体间的关系等数据,进一步实现专利技术领域的推荐,提高准确度。同时,利用知识图谱,还可以将专利数据可视化,直观地将大量专利之间的关系呈现出来,能够方便高效地找到所需数据。
申请号为CN202110600721.6的中国专利提供了一种基于知识图谱的电力文本实体语义理解方法,根据自举法构建电力实体同义词林;通过众包平台构建电力领域知识图谱;根据电力实体同义词林,进行电力文本的实体指代理解;将电力文本的实体指代理解链接到电力领域知识图谱中的特定实体;在电力领域知识图谱中对特定实体进行匹配查询,获取特定实体的语义信息。将电力文本、知识图谱与计算机结合起来,减少了人工处理电力文本所耗费的时间和精力,提高了机器进行文本提取实体语义信息的准确率,可以有效帮助人们对电力文本信息进行批量处理,节省了电力文本信息处理的经济成本,同时使得电力技术更加信息化、智能化。
申请号为CN202010104775.9的中国专利提供了一种知识图谱构建、检索方法及装置,获取至少一个电力终端设备的关系数据表;根据所述关系数据表构建知识图谱概念层及知识图谱实例层;将所述知识图谱概念层与所述知识图谱实例层进行组合形成知识图谱。通过将表格数据转换为概念层和实例层,能够更加清晰的体现关系数据之间的关系,提高用户需求理解和资源描述的准确度。
对于使用数据库的电力行业工作人员来说,是否能够精准地进行搜索和推荐是最关注的问题。传统的搜索一般都是基于字符串匹配,这样的方式第一没有关注搜索语句本身的语义信息,第二是很难搜索到与其带有某种关联但是检索式确差很远的信息。因此需要提供一种对知识的整体性把握更强,并且能展现知识之间的关联,并且相较于常规的字符串匹配搜索,可以将用户的搜索意图和用户可能感兴趣的相似物品一起展示出来的电力行业信息分析方法。
发明内容
基于以上问题,本发明公开了一种基于知识图谱的电力行业信息分析方法及设备。
为实现上述目的,本发明提供如下技术方案:
本发明提供一种基于知识图谱的电力行业信息分析方法,具体步骤包括:
S1、构建电力科技信息知识本体;
S2、基于电力科技信息知识本体对原始数据进行数据处理,所述原始数据包含非结构化数据、半结构化数据和结构化数据,
对所述非结构化数据进行命名实体识别和关系抽取,
将所述非结构化数据、所述半结构化数据进行知识抽取后的数据和结构化数据进行知识融合,进一步构成三元组;
S3、将所述三元组格式导入数据库,构建知识图谱;
将所述知识图谱中的三元组嵌入为稠密向量;
S4、用户接入所述知识图谱,输入检索语句,将所述检索语句嵌入为词向量,与所述知识图谱中的实体进行相似度匹配,将最优匹配结果进行推荐和搜索展示。
优选地,在S1中,构建知识本体的方法为基于三元组本体[实体,关系,实体]的格式,根据使用需求定制,至少包括:[公司,申请,专利]、[人物,发明,专利],[专利,所属领域,IPC分类号]。
优选地,在S2中,对所述非结构化数据进行命名实体识别和关系抽取的方法为:采用UIE算法,利用飞桨开源框架调用其预训练语言模型ERNIE,再进行标准间样本的微淘,训练出实体关系抽取模型;
进行知识融合的方法为:将所述非结构化数据、所述半结构化数据进行知识抽取后的数据和结构化数据中的实体关系进行对齐和去重,生成所有的非重复三元组,对其中的非重复实体和非重复关系进行ID编号形成映射。
优选地,所述半结构化数据和非结构化数据包括声音、图像和视频中的至少一种;所述结构化数据包括运巧数据、气象数据和状态检测数据中的至少一种。
优选地,在S4中,所述知识图谱对所述检索语句进行分词和命名实体识别,将所述检索语句嵌入为词向量,并从所述检索语句中抽取检索实体与所述知识图谱中的实体进行实体链接;
选择出所述检索实体的所述相连三元组作为候选三元组向量;
将所述检索语句的词向量与所述候选三元组向量进行相似度匹配。
优选地,相似度匹配的方法为:将检索语句的嵌入词向量与所有的候选三元组向量使用cos余弦相似度匹配;相应公式为:
Figure BDA0003715106500000031
其中A表示检索语句的嵌入词向量,B表示候选三元组向量。
优选地,在S4中,相似度匹配之后,根据匹配结果,展示最相似的Top-K实体信息及关系信息,并推荐相似度高的实体信息和关系信息。
本发明还提供一种计算机设备,包括至少一个处理器和至少一个存储器,所述所述存储器用于存储可执行程序代码;所述处理器用于读取所述存储器中存储的可执行程序代码,以执行上述任一项所述的一种基于知识图谱的电力行业信息分析方法。
与现有技术相比,本发明有以下优势:
本发明提出了一种基于知识图谱的电力行业信息分析方法及设备,利用知识图谱进行知识融合和知识推理,形成高质量的知识库。采用知识图谱作为底层的知识库,对用户的搜索式进行语义嵌入,然后与知识图谱中的实体向量进行相似度匹配,更好地捕捉句子的语义信息,并且能找到知识图谱中与待搜索物品语义强相关的信息。
附图说明
附图1是本发明一种基于知识图谱的电力行业信息分析方法的流程图;
附图2是本发明用户基于知识图谱的检索和推荐流程图。
具体实施方式
为使本发明实施例的目的和技术方案更加清楚,下面将结合本发明实施例,对本发明的技术方案进行清楚、完整地描述。
知识图谱本质上是一种叫做语义网络的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体或者概念,而图的边代表实体/概念之间的各种语义关系。
本发明提供一种基于知识图谱的电力行业信息分析方法,具体步骤包括:
S1、构建电力科技信息知识本体;
S2、基于电力科技信息知识本体对原始数据进行数据处理,所述原始数据包含非结构化数据、半结构化数据和结构化数据,
对所述非结构化数据进行命名实体识别和关系抽取,
将所述非结构化数据、所述半结构化数据进行知识抽取后的数据和结构化数据进行知识融合,进一步构成三元组;
S3、将所述三元组按照csv文件的格式导入neo4j数据库,构建知识图谱;将所述知识图谱中的三元组嵌入为稠密向量;
S4、用户接入所述知识图谱,输入检索语句,将所述检索语句嵌入为词向量,与所述知识图谱中的实体进行相似度匹配,将最优匹配结果进行推荐和搜索展示。
知识图谱由实体和实体之间的关系构成,在本申请实施例中,实体包括概念实体和对象实体,其中,概念实体是指关系数据表中提取出来的各个概念,对象实体是指关系数据表中提取出来的各个数据或数据集,知识图谱的构建是从多个关系数据表中识别出所有可能的概念实体和对象实体,并构建概念实体和对象实体的关系,最终形成一个三元组集合的过程。
在S1中,知识本体就是相当于电力领域内的数据模型,包含了该领域里面有意义的概念类型以及这些类型的属性。基于三元组本体[实体,关系,实体]的格式,根据使用需求定制,至少包括:[公司,申请,专利]、[人物,发明,专利],[专利,所属领域,IPC分类号]。
在S2中,对非结构化数据实体抽取和关系抽取,实体抽取也称为命名实体学习或命名实体识别,指的是从原始语料中自动识别出命名实体。由于实体是知识图谱中的最基本元素,其抽取的完整性、准确率、召回率等将直接影响到知识库的质量。因此,实体抽取是知识抽取中最为基础与关键的一步。
目前实体抽取方法主要可分为三种:基于规则与词典的方法、基于统计机器学习的方法以及面向开放域的抽取方法。基于规则的方法通常需要为目标实体编写模板,然后在原始语料中进行匹配;基于统计机器学习的方法主要是通过机器学习的方法对原始语料进行训练,然后再利用训练好的模型去识别实体;面向开放域的抽取将是面向海量的Web语料。
关系抽取的目标是解决实体间语义链接的问题,早期的关系抽取主要是通过人工构造语义规则以及模板的方法识别实体关系。随后,实体间的关系模型逐渐替代了人工预定义的语法与规则.但是仍需要提前定义实体间的关系类型。面向开放域的信息抽取框架(open information extraction,0IE)的提出,是抽取模式上的一个巨大进步。但0IE方法在对实体的隐含关系抽取方面性能低下,因此部分研究者提出了基于马尔可夫逻辑网、基于本体推理的深层隐含关系抽取方法。
在本申请中,对非结构化数据实体抽取和关系抽取的方法为:采用UIE算法,利用飞桨开源框架调用其预训练语言模型ERNIE,再进行标准间样本的微淘,训练出实体关系抽取模型;
由于知识图谱中的知识来源广泛,存在知识质量良莠不齐、来自不同数据源的知识重复、知识间的关联不够明确等问题,所以必须要进行知识融合。知识融合是高层次的知识组织,使来自不同知识源的知识在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等步骤,达到数据、信息、方法、经验以及人的思想的融合,形成高质量的知识库。实体对齐也称为实体匹配或实体解析,主要是用于消除异构数据中实体冲突、指向不明等不一致性问题,可以从顶层创建一个大规模的统一知识库,从而帮助机器理解多源异质的数据,形成高质量的知识。
在本申请中,将所述非结构化数据、所述半结构化数据进行知识抽取后的数据和结构化数据进行知识融合,将所述非结构化数据、所述半结构化数据进行知识抽取后的数据和结构化数据中的实体关系进行对齐和去重,生成所有的非重复三元组,对其中的非重复实体和非重复关系进行ID编号形成映射。
然后,通过构建三元组,根据抽取的三元组导入至Neo4j得到目标知识图谱。Neo4j是一个高性能的NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。属于一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性,能满足企业的性能要求。
构建了目标知识图谱后,用户可通过平台接入所述知识图谱,通过检索获取自己所需的信息。
用户接入所述知识图谱,输入检索语句,将所述检索语句嵌入为词向量并与所述知识图谱中的实体向量进行相似度匹配,获取实体信息及关系信息。
所述相似度匹配的方法为,所述知识图谱对所述检索语句进行分词和命名实体识别,将所述检索语句嵌入为词向量,并从所述检索语句中抽取检索实体与所述知识图谱中的实体进行实体链接;
选择出所述检索实体的所述相连三元组作为候选三元组向量;
将所述检索语句的词向量与所述候选三元组向量进行相似度匹配。
优选地,相似度匹配的方法为:将检索语句的嵌入词向量与所有的候选三元组向量使用cos余弦相似度匹配;相应公式为:
Figure BDA0003715106500000061
其中A表示检索语句的嵌入词向量,B表示候选三元组向量。
相似度匹配之后,根据匹配结果,展示最相似的实体信息及关系信息,并推荐相似度高的实体信息。
本发明还提供一种计算机设备,包括至少一个处理器和至少一个存储器,所述所述存储器用于存储可执行程序代码;所述处理器用于读取所述存储器中存储的可执行程序代码,以执行上述任一项所述的一种基于知识图谱的电力行业信息分析方法。
本发明提供的一种基于知识图谱的电力行业信息分析方法,通过构建知识图谱,对知识的整体性把握更强,并且能展现知识之间的关联,并且基于知识图谱数据库的搜索和推荐相较于常规的字符串匹配搜索可以将用户的搜索意图和用户可能感兴趣的相似物品一起展示出来。
以上仅为本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。

Claims (8)

1.一种基于知识图谱的电力行业信息分析方法,其特征在于:
具体步骤包括:
S1、构建电力科技信息知识本体;
S2、基于电力科技信息知识本体对原始数据进行数据处理,
所述原始数据包含非结构化数据、半结构化数据和结构化数据,
对所述非结构化数据进行命名实体识别和关系抽取,
将所述非结构化数据、所述半结构化数据进行知识抽取后的数据和结构化数据进行知识融合,进一步构成三元组;
S3、将所述三元组导入数据库,构建知识图谱;
将所述知识图谱中的三元组嵌入为稠密向量;
S4、用户接入所述知识图谱,输入检索语句,将所述检索语句嵌入为词向量,与所述知识图谱中的实体进行相似度匹配,将匹配结果进行推荐和搜索展示。
2.如权利要求1所述的一种基于知识图谱的电力行业信息分析方法,其特征在于:在S1中,构建知识本体的方法为基于三元组本体[实体,关系,实体]的格式,根据使用需求定制,至少包括:[公司,申请,专利]、[人物,发明,专利],[专利,所属领域,IPC分类号]。
3.如权利要求1所述的一种基于知识图谱的电力行业信息分析方法,其特征在于:在S2中,对所述非结构化数据进行命名实体识别和关系抽取的方法为:采用UIE算法,利用飞桨开源框架调用其预训练语言模型ERNIE,再进行标准间样本的微淘,训练出实体关系抽取模型;
进行知识融合的方法为:将所述非结构化数据、所述半结构化数据进行知识抽取后的数据和结构化数据中的实体关系进行对齐和去重,生成所有的非重复三元组,对其中的非重复实体和非重复关系进行ID编号形成映射。
4.如权利要求1所述的一种基于知识图谱的电力行业信息分析方法,其特征在于:所述半结构化数据和非结构化数据包括声音、图像和视频中的至少一种;所述结构化数据包括运巧数据、气象数据和状态检测数据中的至少一种。
5.如权利要求1所述的一种基于知识图谱的电力行业信息分析方法,其特征在于:在S4中,所述知识图谱对所述检索语句进行分词和命名实体识别,将所述检索语句嵌入为词向量,并从所述检索语句中抽取检索实体与所述知识图谱中的实体进行实体链接;
选择出所述检索实体的相连三元组作为候选三元组向量;
将所述检索语句的词向量与所述候选三元组向量进行相似度匹配。
6.如权利要求5所述的一种基于知识图谱的电力行业信息分析方法,其特征在于:相似度匹配的方法为:将检索语句的嵌入词向量与所有的候选三元组向量使用cos余弦相似度匹配;相应公式为:
Figure FDA0003715106490000021
其中A表示检索语句的嵌入词向量,B表示候选三元组向量。
7.如权利要求1所述的一种基于知识图谱的电力行业信息分析方法,其特征在于:在S4中,相似度匹配之后,根据匹配结果,展示最相似的Top-K实体信息及关系信息,并推荐相似度高的实体信息和关系信息。
8.一种计算机设备,其特征在于:包括至少一个处理器和至少一个存储器,所述存储器用于存储可执行程序代码;所述处理器用于读取所述存储器中存储的可执行程序代码,以执行权利要求1-7中任一项所述的一种基于知识图谱的电力行业信息分析方法。
CN202210735319.3A 2022-06-27 2022-06-27 一种基于知识图谱的电力行业信息分析方法及设备 Pending CN115080694A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210735319.3A CN115080694A (zh) 2022-06-27 2022-06-27 一种基于知识图谱的电力行业信息分析方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210735319.3A CN115080694A (zh) 2022-06-27 2022-06-27 一种基于知识图谱的电力行业信息分析方法及设备

Publications (1)

Publication Number Publication Date
CN115080694A true CN115080694A (zh) 2022-09-20

Family

ID=83254699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210735319.3A Pending CN115080694A (zh) 2022-06-27 2022-06-27 一种基于知识图谱的电力行业信息分析方法及设备

Country Status (1)

Country Link
CN (1) CN115080694A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115577095A (zh) * 2022-12-12 2023-01-06 南方电网科学研究院有限责任公司 一种基于图论的电力标准信息推荐方法
CN116186350A (zh) * 2023-04-23 2023-05-30 浙江大学 基于知识图谱和主题文本的输电线路工程搜索方法和装置
CN116579631A (zh) * 2023-07-11 2023-08-11 中国铁道科学研究院集团有限公司铁道建筑研究所 一种隧道施工地质灾害防控智能分析方法及系统
CN117151659A (zh) * 2023-10-31 2023-12-01 浙江万维空间信息技术有限公司 一种基于大语言模型的生态修复工程全生命周期追溯方法
CN117290563A (zh) * 2023-11-22 2023-12-26 北京小米移动软件有限公司 垂类搜索方法及装置、搜索系统、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674311A (zh) * 2019-09-05 2020-01-10 国家电网有限公司 一种基于知识图谱的电力资产异构数据融合方法
CN111598702A (zh) * 2020-04-14 2020-08-28 徐佳慧 一种基于知识图谱的风险投资语义搜索的方法
CN112131882A (zh) * 2020-09-30 2020-12-25 绿盟科技集团股份有限公司 一种多源异构网络安全知识图谱构建方法及装置
CN112487190A (zh) * 2020-12-13 2021-03-12 天津大学 基于自监督和聚类技术从文本中抽取实体间关系的方法
KR20210064862A (ko) * 2019-11-26 2021-06-03 한국전력공사 지식 그래프 생성 방법 및 이를 이용한 신재생발전 항목 추천 시스템 및 방법
WO2022100233A1 (zh) * 2020-11-12 2022-05-19 全球能源互联网研究院有限公司 一种基于图数据库的电网检索方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674311A (zh) * 2019-09-05 2020-01-10 国家电网有限公司 一种基于知识图谱的电力资产异构数据融合方法
KR20210064862A (ko) * 2019-11-26 2021-06-03 한국전력공사 지식 그래프 생성 방법 및 이를 이용한 신재생발전 항목 추천 시스템 및 방법
CN111598702A (zh) * 2020-04-14 2020-08-28 徐佳慧 一种基于知识图谱的风险投资语义搜索的方法
CN112131882A (zh) * 2020-09-30 2020-12-25 绿盟科技集团股份有限公司 一种多源异构网络安全知识图谱构建方法及装置
WO2022100233A1 (zh) * 2020-11-12 2022-05-19 全球能源互联网研究院有限公司 一种基于图数据库的电网检索方法及系统
CN112487190A (zh) * 2020-12-13 2021-03-12 天津大学 基于自监督和聚类技术从文本中抽取实体间关系的方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115577095A (zh) * 2022-12-12 2023-01-06 南方电网科学研究院有限责任公司 一种基于图论的电力标准信息推荐方法
CN115577095B (zh) * 2022-12-12 2023-05-02 南方电网科学研究院有限责任公司 一种基于图论的电力标准信息推荐方法
CN116186350A (zh) * 2023-04-23 2023-05-30 浙江大学 基于知识图谱和主题文本的输电线路工程搜索方法和装置
CN116579631A (zh) * 2023-07-11 2023-08-11 中国铁道科学研究院集团有限公司铁道建筑研究所 一种隧道施工地质灾害防控智能分析方法及系统
CN117151659A (zh) * 2023-10-31 2023-12-01 浙江万维空间信息技术有限公司 一种基于大语言模型的生态修复工程全生命周期追溯方法
CN117151659B (zh) * 2023-10-31 2024-03-22 浙江万维空间信息技术有限公司 一种基于大语言模型的生态修复工程全生命周期追溯方法
CN117290563A (zh) * 2023-11-22 2023-12-26 北京小米移动软件有限公司 垂类搜索方法及装置、搜索系统、存储介质

Similar Documents

Publication Publication Date Title
CN106776711B (zh) 一种基于深度学习的中文医学知识图谱构建方法
CN111209412B (zh) 一种循环更新迭代的期刊文献知识图谱构建方法
CN108287822B (zh) 一种中文相似问题生成系统与方法
CN110298033B (zh) 关键词语料标注训练提取系统
CN115080694A (zh) 一种基于知识图谱的电力行业信息分析方法及设备
Berardi et al. Word Embeddings Go to Italy: A Comparison of Models and Training Datasets.
CN112487202B (zh) 融合知识图谱与bert的中文医学命名实体识别方法、装置
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN116795973A (zh) 基于人工智能的文本处理方法及装置、电子设备、介质
CN112417161B (zh) 一种基于模式扩充及bert分类的知识图谱上下位关系识别的方法和存储设备
CN115858758A (zh) 一种多非结构化数据识别的智慧客服知识图谱系统
CN111651569B (zh) 一种电力领域的知识库问答方法及系统
CN112541337A (zh) 一种基于递归神经网络语言模型的文档模板自动生成方法及系统
CN114064901B (zh) 一种基于知识图谱词义消歧的书评文本分类方法
CN106897274B (zh) 一种跨语种的点评复述方法
CN117131932A (zh) 基于主题模型的领域知识图谱本体半自动构建方法及系统
Al-Sultany et al. Enriching tweets for topic modeling via linking to the wikipedia
CN114490930A (zh) 一种基于知识图谱的文物问答系统与问答方法
CN111538805A (zh) 一种基于深度学习和规则引擎的文本信息抽取方法及系统
CN113761919A (zh) 一种口语化短文本的实体属性提取方法及电子装置
Varga et al. LELA-A natural language processing system for Romanian tourism
CN112925961A (zh) 一种基于企业实体的智能问答方法及装置
Liu et al. Text Analysis of Community Governance Case based on Entity and Relation Extraction
CN111241827B (zh) 一种基于句子检索模式的属性抽取方法
CN110728148B (zh) 实体关系抽取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220920