CN110598000A - 一种基于深度学习模型的关系抽取及知识图谱构建方法 - Google Patents

一种基于深度学习模型的关系抽取及知识图谱构建方法 Download PDF

Info

Publication number
CN110598000A
CN110598000A CN201910707194.1A CN201910707194A CN110598000A CN 110598000 A CN110598000 A CN 110598000A CN 201910707194 A CN201910707194 A CN 201910707194A CN 110598000 A CN110598000 A CN 110598000A
Authority
CN
China
Prior art keywords
data
model
deep learning
knowledge graph
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910707194.1A
Other languages
English (en)
Other versions
CN110598000B (zh
Inventor
连明杰
陈运文
昝云飞
孙伟伟
徐华伟
纪达麒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daerguan Information Technology (shanghai) Co Ltd
Original Assignee
Daerguan Information Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daerguan Information Technology (shanghai) Co Ltd filed Critical Daerguan Information Technology (shanghai) Co Ltd
Priority to CN201910707194.1A priority Critical patent/CN110598000B/zh
Publication of CN110598000A publication Critical patent/CN110598000A/zh
Application granted granted Critical
Publication of CN110598000B publication Critical patent/CN110598000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种基于深度学习模型的关系抽取及知识图谱构建方法,具体包括以下步骤:利用数据标注平台将语料数据处理成标注数据;将标注数据输入深度学习模型进行训练和测试,生成关系抽取模型;将待抽取文本数据输入关系抽取模型,提取出其实体关系对;利用图数据库,构建出待抽取文本的知识图谱。本发明基于BERT模型与双向长短期记忆网络模型及条件随机场算法构建出关系抽取模型,能够准确抽取出实体关系对,且通过对抽取出的实体关系对进行人工排查,确保了进入图数据库的实体关系对的正确性。

Description

一种基于深度学习模型的关系抽取及知识图谱构建方法
技术领域
本发明涉及知识图谱构建技术领域,尤其涉及一种基于深度学习模型的关系抽取及知识图谱构建方法。
背景技术
目前,知识图谱的构建方法根据原始数据来源而异。原始数据来源主要分为三类:结构化数据、半结构化数据和非结构化数据。通常,结构化数据存储在关系型数据库及非关系型数据库中,可以通过D2R技术将结构化数据转化为RDF数据,以完成知识图谱的构建。半结构化数据指的是具有一定的数据结构、需要进一步分析才能获取的数据,比如百科数据、网页数据等。对于这类数据,可以定制化地分析数据结构,采用正则表达式或网页的爬取分析手段,将数据转化为结构化数据,从而形成知识图谱。而对于非结构数据,因为其数据的非结构化,一般不能直接通过简单地分析转化为结构化数据。通常,对于非结构化数据,可以提取出其中的实体,比如人名、地名、组织结构名、时间等,以及各个实体之间的关系,从而尝试着形成知识图谱。
目前知识图谱的构建过程一般为:对原始数据进行预处理,将其转化为结构化数据,再进行实体对齐,知识融合,知识推理等,构建形成一个完整的知识图谱。
目前针对非结构化数据构建知识图谱的理论研究虽然较多,但都没有给出一种真正可以落地的技术手段。
发明内容
有鉴于此,本发明提供了一种基于深度学习模型的关系抽取及知识图谱构建方法,用以解决上述背景技术中存在的问题。
一种基于深度学习模型的关系抽取及知识图谱构建方法,具体包括以下步骤:
S1,利用数据标注平台将语料数据处理成标注数据;
S2,将标注数据作为输入,进行深度学习模型的训练和测试,生成关系抽取模型;
S3,将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对;
S4,将所述实体关系对导入图数据库,构建出待抽取文本的知识图谱。
优选地,步骤S1中利用数据标注平台将语料数据处理成标注数据的具体步骤为:
S11,通过爬虫系统从互联网中获取网络数据;
S12,将所述网络数据按句子进行切分,形成句子语料集;
S13,利用数据标注平台对句子语料集中的语料数据进行B,I,O标注,形成标注数据。
优选地,所述网络数据为爬虫系统从互联网的不同来源爬取到的多个领域的数据;
获取到网络数据后,按领域类别对网络数据进行人工分类。
优选地,所述网络数据为TXT文本、word文本、PDF文本中的一种或多种格式的非结构化数据。
优选地,所述数据标注平台为网页形式的可视化的数据标注平台。
优选地,步骤S2中生成关系抽取模型的具体步骤为:
S21,从标注数据中获取训练样本和测试样本;
S22,对训练样本进行预处理,将预处理后的数据输入BERT模型进行预训练,得到初始词向量;
S23,采用双向长短期记忆网络模型和条件随机场算法对初始词向量进行训练,直至神经网络收敛,得到初始关系抽取模型;
S24,将测试样本输入初始关系抽取模型进行测试,当测试样本的准确率达到设定值时,得到满足要求的关系抽取模型。
优选地,步骤S3中将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对的具体步骤为:
S31,将待抽取文本数据切分为若干个句子;
S32,将切分得到的所有句子输入关系抽取模型中,提取出若干对实体关系对;
S33,对提取出的若干对实体关系对进行人工排查,剔除错误的实体关系对。
优选地,所述图数据库采用的是Neo4j图数据库。
本发明的有益效果是:
1、本申请采用的语料数据为各种格式、各种来源的语料,且语料的标注以句子为单位,不受语料格式及内容的限制。
2、本申请的关系抽取模型是基于BERT模型与双向长短期记忆网络模型及条件随机场算法的模型,能够准确抽取出实体关系对,且通过对抽取出的实体关系对进行人工排查,确保了进入图数据库的实体关系对的正确性,同时有丰富的可视化展示,能有效提升知识图谱的趣味性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的结构示意图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面通过具体的实施例并结合附图对本申请做进一步的详细描述。
一种基于深度学习模型的关系抽取及知识图谱构建方法,具体包括以下步骤:
S1,利用数据标注平台将语料数据处理成标注数据。
具体地,利用数据标注平台将语料数据处理成标注数据的步骤为:
S11,通过爬虫系统从互联网中获取网络数据;
网络数据可以为爬虫系统从新闻网站、贴吧、博客、小说网站等不同来源爬取到的多个领域的数据,比如新闻、体育、财经、科技、文学等领域的数据。
所述网络数据为TXT文本、word文本、PDF文本中的一种或多种格式的非结构化数据。
爬虫系统爬取到网络数据后,需要人工按领域类别对网络数据进行分类。
S12,将所述网络数据按句子进行切分,形成句子语料集,并将句子语料集中的数据存储在数据库中。
S13,将句子语料集中的语料数据输入数据标注平台,采用BIO标注方式手动标注出每个句子中的主语、谓语、宾语,数据标注平台输出每个句子的实体关系,形成标注数据,并将标注数据存储在相应的数据库中。通常一个句子中可能会存在多个主语、谓语、宾语,数据标注平台会将最邻近的主语、谓语、宾语作为一个三元组进行输出。
所述数据标注平台可以是以网页形式重新搭建而成的可视化的数据标注平台,也可以采用目前市场中现有的数据标注平台。数据标注平台可以对TXT、word、PDF等格式的文本进行标注。
S2,将标注数据作为输入,进行深度学习模型的训练和测试,生成关系抽取模型。
具体地,生成关系抽取模型的具体步骤为:
S21,从标注数据中获取训练样本和测试样本。
S22,对训练样本进行预处理,如去掉无关词语及句子、标点符号,将繁体文字转化为简体文字等,将预处理后的数据输入BERT模型进行预训练,得到初始词向量,形成模型的Embedding层。
S23,在Embedding层的基础上,采用双向长短期记忆网络模型和条件随机场算法(即BiLSTM+CRF结构)对初始词向量进行训练,直至神经网络收敛,得到初始关系抽取模型;
S24,将测试样本输入初始关系抽取模型进行测试,当测试样本的准确率达到设定值时,即得到满足要求的关系抽取模型。
S3,将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对。
具体地,提取待抽取文本的实体关系对的步骤为:
S31,将待抽取文本数据切分为若干个句子;
S32,将切分得到的所有句子输入关系抽取模型中,得到每个句子中的主语、谓语、宾语,提取出若干对实体关系对;
S33,对提取出的若干对实体关系对进行人工排查,剔除错误或有疑问的实体关系对,以确保进入图数据库的实体关系对的准确性。
S4,将人工排查后的实体关系对导入图数据库,构建出待抽取文本的知识图谱。本实施例中,图数据库采用的是Neo4j图数据库。
提取出的知识图谱,可以进行一系列的应用,如人物关系分析,智能问答等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (8)

1.一种基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,具体包括以下步骤:
S1,利用数据标注平台将语料数据处理成标注数据;
S2,将标注数据作为输入,进行深度学习模型的训练和测试,生成关系抽取模型;
S3,将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对;
S4,将所述实体关系对导入图数据库,构建出待抽取文本的知识图谱。
2.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,步骤S1中利用数据标注平台将语料数据处理成标注数据的具体步骤为:
S11,通过爬虫系统从互联网中获取网络数据;
S12,将所述网络数据按句子进行切分,形成句子语料集;
S13,利用数据标注平台对句子语料集中的语料数据进行B,I,O标注,形成标注数据。
3.根据权利要求2所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述网络数据为爬虫系统从互联网的不同来源爬取到的多个领域的数据;
获取到网络数据后,按领域类别对网络数据进行人工分类。
4.根据权利要求3所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述网络数据为TXT文本、word文本、PDF文本中的一种或多种格式的非结构化数据。
5.根据权利要求2所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述数据标注平台为网页形式的可视化的数据标注平台。
6.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,步骤S2中生成关系抽取模型的具体步骤为:
S21,从标注数据中获取训练样本和测试样本;
S22,对训练样本进行预处理,将预处理后的数据输入BERT模型进行预训练,得到初始词向量;
S23,采用双向长短期记忆网络模型和条件随机场算法对初始词向量进行训练,直至神经网络收敛,得到初始关系抽取模型;
S24,将测试样本输入初始关系抽取模型进行测试,当测试样本的准确率达到设定值时,得到满足要求的关系抽取模型。
7.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,步骤S3中将待抽取文本数据输入关系抽取模型,提取出待抽取文本的实体关系对的具体步骤为:
S31,将待抽取文本数据切分为若干个句子;
S32,将切分得到的所有句子输入关系抽取模型中,提取出若干对实体关系对;
S33,对提取出的若干对实体关系对进行人工排查,剔除错误的实体关系对。
8.根据权利要求1所述的基于深度学习模型的关系抽取及知识图谱构建方法,其特征在于,所述图数据库采用的是Neo4j图数据库。
CN201910707194.1A 2019-08-01 2019-08-01 一种基于深度学习模型的关系抽取及知识图谱构建方法 Active CN110598000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910707194.1A CN110598000B (zh) 2019-08-01 2019-08-01 一种基于深度学习模型的关系抽取及知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910707194.1A CN110598000B (zh) 2019-08-01 2019-08-01 一种基于深度学习模型的关系抽取及知识图谱构建方法

Publications (2)

Publication Number Publication Date
CN110598000A true CN110598000A (zh) 2019-12-20
CN110598000B CN110598000B (zh) 2023-06-09

Family

ID=68853349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910707194.1A Active CN110598000B (zh) 2019-08-01 2019-08-01 一种基于深度学习模型的关系抽取及知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN110598000B (zh)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339318A (zh) * 2020-02-29 2020-06-26 西安理工大学 基于深度学习的大学计算机基础知识图谱构建方法
CN111368091A (zh) * 2020-02-13 2020-07-03 中国工商银行股份有限公司 文档翻译方法及装置
CN111444353A (zh) * 2020-04-03 2020-07-24 杭州叙简科技股份有限公司 一种警情知识图谱的构建及使用方法
CN111444704A (zh) * 2020-03-27 2020-07-24 中南大学 基于深度神经网络的网络安全关键词抽取方法
CN111538849A (zh) * 2020-04-29 2020-08-14 华中科技大学 一种基于深度学习的人物关系图谱构建方法及系统
CN111581376A (zh) * 2020-04-17 2020-08-25 中国船舶重工集团公司第七一四研究所 一种知识图谱自动构建系统及方法
CN111753021A (zh) * 2020-06-17 2020-10-09 第四范式(北京)技术有限公司 构建知识图谱的方法、装置、设备和可读存储介质
CN111753022A (zh) * 2020-06-17 2020-10-09 第四范式(北京)技术有限公司 构建知识图谱的方法、装置、设备和可读存储介质
CN111814476A (zh) * 2020-06-09 2020-10-23 北京捷通华声科技股份有限公司 一种实体关系的抽取方法和装置
CN111859922A (zh) * 2020-07-31 2020-10-30 上海银行股份有限公司 实体关系抽取技术在银行风控中的应用方法
CN111984770A (zh) * 2020-07-17 2020-11-24 深思考人工智能科技(上海)有限公司 一种人机对话的方法及装置
CN112036570A (zh) * 2020-07-30 2020-12-04 第四范式(北京)技术有限公司 标注任务的调度方法、装置和可读存储介质
CN112149423A (zh) * 2020-10-16 2020-12-29 中国农业科学院农业信息研究所 一种面向领域实体关系联合抽取的语料标注方法及系统
CN112163097A (zh) * 2020-09-23 2021-01-01 中国电子科技集团公司第十五研究所 一种军事知识图谱构建方法及系统
CN112308492A (zh) * 2020-11-10 2021-02-02 济南浪潮高新科技投资发展有限公司 基于深度学习与知识图谱融合的仓库管理方法及系统
CN112365171A (zh) * 2020-11-16 2021-02-12 广州杰赛科技股份有限公司 基于知识图谱的风险预测方法、装置、设备及存储介质
CN112613315A (zh) * 2020-12-29 2021-04-06 重庆农村商业银行股份有限公司 一种文本知识自动抽取方法、装置、设备及存储介质
CN112818138A (zh) * 2021-04-19 2021-05-18 中译语通科技股份有限公司 知识图谱本体构建方法、装置、终端设备及可读存储介质
CN112966053A (zh) * 2020-09-18 2021-06-15 青岛海洋科学与技术国家实验室发展中心 一种基于知识图谱的海洋领域专家库构建方法及装置
CN113220871A (zh) * 2021-05-31 2021-08-06 北京语言大学 一种基于深度学习的文学人物关系识别方法
CN113254667A (zh) * 2021-06-07 2021-08-13 成都工物科云科技有限公司 基于深度学习模型的科技人物知识图谱构建方法、装置及终端
CN113360678A (zh) * 2021-07-08 2021-09-07 电子科技大学 一种基于Neo4j和大数据的初等数学知识图谱构建方法
CN113449915A (zh) * 2021-06-28 2021-09-28 中国电子科技集团公司第二十八研究所 一种基于知识图谱的航班延误预测方法
CN113468335A (zh) * 2020-03-30 2021-10-01 海信集团有限公司 实体隐含关系抽取方法及设备
CN113571184A (zh) * 2021-07-20 2021-10-29 武汉情智感知科技有限公司 一种用于精神健康测评的对话交互设计方法及系统
CN113609305A (zh) * 2021-07-27 2021-11-05 三峡大学 基于bert的影视作品地域知识图谱构建方法及系统
WO2021254457A1 (zh) * 2020-06-17 2021-12-23 第四范式(北京)技术有限公司 构建知识图谱的方法及装置、计算机装置及存储介质
CN114218333A (zh) * 2021-11-26 2022-03-22 西南交通大学 一种地质知识图谱构建方法、装置、电子设备及存储介质
CN114398492A (zh) * 2021-12-24 2022-04-26 森纵艾数(北京)科技有限公司 一种在数字领域的知识图谱构建方法、终端及介质
CN114398498A (zh) * 2022-01-21 2022-04-26 中国电子科技集团公司第十研究所 一种科技档案知识图谱构建方法及系统
CN114595459A (zh) * 2021-12-22 2022-06-07 中电信数智科技有限公司 基于深度学习的问题整改建议生成方法
CN114723059A (zh) * 2022-06-07 2022-07-08 达而观数据(成都)有限公司 基于知识推理的故障归因系统及方法
CN115495593A (zh) * 2022-10-13 2022-12-20 中原工学院 基于大数据的数学知识图谱构建方法
US11669680B2 (en) 2021-02-02 2023-06-06 International Business Machines Corporation Automated graph based information extraction
CN116975313A (zh) * 2023-09-25 2023-10-31 国网江苏省电力有限公司电力科学研究院 一种基于电力物资语料的语义标签生成方法和装置
CN111581376B (zh) * 2020-04-17 2024-04-19 中国船舶重工集团公司第七一四研究所 一种知识图谱自动构建系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109271529A (zh) * 2018-10-10 2019-01-25 内蒙古大学 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法
CN109871451A (zh) * 2019-01-25 2019-06-11 中译语通科技股份有限公司 一种融入动态词向量的关系抽取方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109271529A (zh) * 2018-10-10 2019-01-25 内蒙古大学 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法
CN109871451A (zh) * 2019-01-25 2019-06-11 中译语通科技股份有限公司 一种融入动态词向量的关系抽取方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曹夏琳等: "国外数字故事研究分析――基于CiteSpace的可视化分析", 《电脑知识与技术》 *

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368091A (zh) * 2020-02-13 2020-07-03 中国工商银行股份有限公司 文档翻译方法及装置
CN111368091B (zh) * 2020-02-13 2023-09-22 中国工商银行股份有限公司 文档翻译方法及装置
CN111339318A (zh) * 2020-02-29 2020-06-26 西安理工大学 基于深度学习的大学计算机基础知识图谱构建方法
CN111444704B (zh) * 2020-03-27 2023-09-19 中南大学 基于深度神经网络的网络安全关键词抽取方法
CN111444704A (zh) * 2020-03-27 2020-07-24 中南大学 基于深度神经网络的网络安全关键词抽取方法
CN113468335A (zh) * 2020-03-30 2021-10-01 海信集团有限公司 实体隐含关系抽取方法及设备
CN111444353B (zh) * 2020-04-03 2023-02-28 杭州叙简科技股份有限公司 一种警情知识图谱的构建及使用方法
CN111444353A (zh) * 2020-04-03 2020-07-24 杭州叙简科技股份有限公司 一种警情知识图谱的构建及使用方法
CN111581376A (zh) * 2020-04-17 2020-08-25 中国船舶重工集团公司第七一四研究所 一种知识图谱自动构建系统及方法
CN111581376B (zh) * 2020-04-17 2024-04-19 中国船舶重工集团公司第七一四研究所 一种知识图谱自动构建系统及方法
CN111538849A (zh) * 2020-04-29 2020-08-14 华中科技大学 一种基于深度学习的人物关系图谱构建方法及系统
CN111538849B (zh) * 2020-04-29 2023-04-07 华中科技大学 一种基于深度学习的人物关系图谱构建方法及系统
CN111814476A (zh) * 2020-06-09 2020-10-23 北京捷通华声科技股份有限公司 一种实体关系的抽取方法和装置
CN111814476B (zh) * 2020-06-09 2024-04-16 北京捷通华声科技股份有限公司 一种实体关系的抽取方法和装置
CN111753022A (zh) * 2020-06-17 2020-10-09 第四范式(北京)技术有限公司 构建知识图谱的方法、装置、设备和可读存储介质
CN111753021A (zh) * 2020-06-17 2020-10-09 第四范式(北京)技术有限公司 构建知识图谱的方法、装置、设备和可读存储介质
WO2021254457A1 (zh) * 2020-06-17 2021-12-23 第四范式(北京)技术有限公司 构建知识图谱的方法及装置、计算机装置及存储介质
EP4170520A4 (en) * 2020-06-17 2023-11-29 The 4th Paradigm Technology Co., Ltd METHOD AND DEVICE FOR CONSTRUCTING A KNOWLEDGE GRAPH, COMPUTER DEVICE AND STORAGE MEDIUM
CN111984770B (zh) * 2020-07-17 2023-10-20 深思考人工智能科技(上海)有限公司 一种人机对话的方法及装置
CN111984770A (zh) * 2020-07-17 2020-11-24 深思考人工智能科技(上海)有限公司 一种人机对话的方法及装置
CN112036570A (zh) * 2020-07-30 2020-12-04 第四范式(北京)技术有限公司 标注任务的调度方法、装置和可读存储介质
CN111859922A (zh) * 2020-07-31 2020-10-30 上海银行股份有限公司 实体关系抽取技术在银行风控中的应用方法
CN111859922B (zh) * 2020-07-31 2023-12-01 上海银行股份有限公司 实体关系抽取技术在银行风控中的应用方法
CN112966053A (zh) * 2020-09-18 2021-06-15 青岛海洋科学与技术国家实验室发展中心 一种基于知识图谱的海洋领域专家库构建方法及装置
CN112966053B (zh) * 2020-09-18 2023-04-18 青岛海洋科学与技术国家实验室发展中心 一种基于知识图谱的海洋领域专家库构建方法及装置
CN112163097A (zh) * 2020-09-23 2021-01-01 中国电子科技集团公司第十五研究所 一种军事知识图谱构建方法及系统
CN112149423B (zh) * 2020-10-16 2024-01-26 中国农业科学院农业信息研究所 一种面向领域实体关系联合抽取的语料标注方法及系统
CN112149423A (zh) * 2020-10-16 2020-12-29 中国农业科学院农业信息研究所 一种面向领域实体关系联合抽取的语料标注方法及系统
CN112308492A (zh) * 2020-11-10 2021-02-02 济南浪潮高新科技投资发展有限公司 基于深度学习与知识图谱融合的仓库管理方法及系统
CN112365171A (zh) * 2020-11-16 2021-02-12 广州杰赛科技股份有限公司 基于知识图谱的风险预测方法、装置、设备及存储介质
CN112365171B (zh) * 2020-11-16 2024-02-09 广州杰赛科技股份有限公司 基于知识图谱的风险预测方法、装置、设备及存储介质
CN112613315A (zh) * 2020-12-29 2021-04-06 重庆农村商业银行股份有限公司 一种文本知识自动抽取方法、装置、设备及存储介质
US11669680B2 (en) 2021-02-02 2023-06-06 International Business Machines Corporation Automated graph based information extraction
CN112818138A (zh) * 2021-04-19 2021-05-18 中译语通科技股份有限公司 知识图谱本体构建方法、装置、终端设备及可读存储介质
CN113220871B (zh) * 2021-05-31 2023-10-20 山东外国语职业技术大学 一种基于深度学习的文学人物关系识别方法
CN113220871A (zh) * 2021-05-31 2021-08-06 北京语言大学 一种基于深度学习的文学人物关系识别方法
CN113254667A (zh) * 2021-06-07 2021-08-13 成都工物科云科技有限公司 基于深度学习模型的科技人物知识图谱构建方法、装置及终端
CN113449915A (zh) * 2021-06-28 2021-09-28 中国电子科技集团公司第二十八研究所 一种基于知识图谱的航班延误预测方法
CN113449915B (zh) * 2021-06-28 2023-10-27 中国电子科技集团公司第二十八研究所 一种基于知识图谱的航班延误预测方法
CN113360678B (zh) * 2021-07-08 2022-07-15 电子科技大学 一种基于Neo4j和大数据的初等数学知识图谱构建方法
CN113360678A (zh) * 2021-07-08 2021-09-07 电子科技大学 一种基于Neo4j和大数据的初等数学知识图谱构建方法
CN113571184A (zh) * 2021-07-20 2021-10-29 武汉情智感知科技有限公司 一种用于精神健康测评的对话交互设计方法及系统
CN113571184B (zh) * 2021-07-20 2023-10-31 武汉情智感知科技有限公司 一种用于精神健康测评的对话交互设计方法及系统
CN113609305B (zh) * 2021-07-27 2024-04-26 三峡大学 基于bert的影视作品地域知识图谱构建方法及系统
CN113609305A (zh) * 2021-07-27 2021-11-05 三峡大学 基于bert的影视作品地域知识图谱构建方法及系统
CN114218333A (zh) * 2021-11-26 2022-03-22 西南交通大学 一种地质知识图谱构建方法、装置、电子设备及存储介质
CN114595459B (zh) * 2021-12-22 2022-08-16 中电信数智科技有限公司 基于深度学习的问题整改建议生成方法
CN114595459A (zh) * 2021-12-22 2022-06-07 中电信数智科技有限公司 基于深度学习的问题整改建议生成方法
CN114398492B (zh) * 2021-12-24 2022-08-30 森纵艾数(北京)科技有限公司 一种在数字领域的知识图谱构建方法、终端及介质
CN114398492A (zh) * 2021-12-24 2022-04-26 森纵艾数(北京)科技有限公司 一种在数字领域的知识图谱构建方法、终端及介质
CN114398498A (zh) * 2022-01-21 2022-04-26 中国电子科技集团公司第十研究所 一种科技档案知识图谱构建方法及系统
CN114723059A (zh) * 2022-06-07 2022-07-08 达而观数据(成都)有限公司 基于知识推理的故障归因系统及方法
CN115495593A (zh) * 2022-10-13 2022-12-20 中原工学院 基于大数据的数学知识图谱构建方法
CN115495593B (zh) * 2022-10-13 2023-08-01 中原工学院 基于大数据的数学知识图谱构建方法
CN116975313B (zh) * 2023-09-25 2023-12-05 国网江苏省电力有限公司电力科学研究院 一种基于电力物资语料的语义标签生成方法和装置
CN116975313A (zh) * 2023-09-25 2023-10-31 国网江苏省电力有限公司电力科学研究院 一种基于电力物资语料的语义标签生成方法和装置

Also Published As

Publication number Publication date
CN110598000B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
CN110598000B (zh) 一种基于深度学习模型的关系抽取及知识图谱构建方法
CN110287334B (zh) 一种基于实体识别和属性抽取模型的学校领域知识图谱构建方法
CN106874378B (zh) 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN106776711B (zh) 一种基于深度学习的中文医学知识图谱构建方法
WO2021114745A1 (zh) 一种基于词缀感知的社交媒体命名实体识别方法
CN111104789B (zh) 文本评分方法、装置和系统
US8301438B2 (en) Method for processing natural language questions and apparatus thereof
US10824816B2 (en) Semantic parsing method and apparatus
CN113806563B (zh) 面向多源异构建筑人文史料的建筑师知识图谱构建方法
Gómez-Adorno et al. Automatic authorship detection using textual patterns extracted from integrated syntactic graphs
CN110609983B (zh) 一种政策文件结构化分解方法
Chan et al. Reproducible extraction of cross-lingual topics (rectr)
CN111783394A (zh) 事件抽取模型的训练方法、事件抽取方法和系统及设备
CN111813874B (zh) 太赫兹知识图谱构建方法及系统
CN114818717A (zh) 融合词汇和句法信息的中文命名实体识别方法及系统
Kudi et al. Online Examination with short text matching
CN116561538A (zh) 问答评分方法、问答评分装置、电子设备及存储介质
Wang et al. Tdjee: A document-level joint model for financial event extraction
CN115270746A (zh) 问题样本生成方法和装置、电子设备及存储介质
CN112241446A (zh) 一种大数据下基于学生画像的精准资助系统
Qiu et al. Detecting geo-relation phrases from web texts for triplet extraction of geographic knowledge: A context-enhanced method
Chen Natural language processing in web data mining
CN114398492B (zh) 一种在数字领域的知识图谱构建方法、终端及介质
Huang et al. A question-answering system over Traditional Chinese Medicine
CN111581376B (zh) 一种知识图谱自动构建系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant