CN111026815B - 基于用户辅助修正下的实体对特定关系抽取方法 - Google Patents
基于用户辅助修正下的实体对特定关系抽取方法 Download PDFInfo
- Publication number
- CN111026815B CN111026815B CN201911235530.3A CN201911235530A CN111026815B CN 111026815 B CN111026815 B CN 111026815B CN 201911235530 A CN201911235530 A CN 201911235530A CN 111026815 B CN111026815 B CN 111026815B
- Authority
- CN
- China
- Prior art keywords
- user
- data
- extraction
- model
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 51
- 238000012937 correction Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 16
- 230000011218 segmentation Effects 0.000 claims abstract description 14
- 238000013136 deep learning model Methods 0.000 claims abstract description 8
- 238000013135 deep learning Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 238000003058 natural language processing Methods 0.000 claims description 3
- 230000007717 exclusion Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 238000002372 labelling Methods 0.000 abstract description 4
- 238000001914 filtration Methods 0.000 abstract description 2
- 238000004140 cleaning Methods 0.000 abstract 1
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明属于信息抽取技术领域,具体涉及基于用户辅助修正下的实体对特定关系抽取方法,包括以下步骤:a、设置人工标注模块,该模块用于按需导入数据,并进行人工标注;b、构建基于深度学习的模型训练模块,其包含多个深度学习模型,训练数据经过不同的深度学习模型找出最优模型并替换抽取模型;c、对人工标注数据及校正数据进行整合以及对特定的过滤清理,并依据分词结果进行数据的预处理;d、构建关系校正模块供用户进行辅助修正,由用户判断抽取是否正确。本发明在保证用户能动性的前提下,让用户对相应数据进行标注,纠正计算机的错误,教会计算机如何产出想要的结果,通过伴随用户的辅助修正不断提高了特定关系抽取的准确率。
Description
技术领域
本发明属于信息抽取技术领域,具体涉及基于用户辅助修正下的实体对特定关系抽取方法。
背景技术
知识图谱的构建,是要将所需领域的实体的相关信息以及关联关系等各类信息,以RDF三元组的形式存储到一个具有存储、高效检索的图数据库中,并根据需求能够实现特定路径的一个过程。对于知识图谱的构建,相应领域的信息抽取是重中之重。知识抽取主要讲的是实体属性和关系的抽取,通常情况下是一个句子级别的抽取过程。在互联网上,大部分句子是无法抽出相应属性和关系的。比如KBP(Knowledge Base Population)比赛中定义的属性槽一共有33种,包括别名、年龄、出生时间、出生地点等这种属性槽。而一个文本种表达这种信息的句子很少。因此,为了提高自由文本的利用率,需要考虑两方面的优化:第一,将不能映射成属性和关系,但是涉及实体的特定信息保存下来;第二根据已有需求,能够快速的构造一个特定关系的抽取器。
2016年,KBP中的slot-filling任务中定义了26种与人物和机构相关的关系槽,同时提供了一份标注语料用于训练和验证。而在不同领域的自然语言抽取系统,核心都是面向特定实体类别、特定实体间关系的抽取系统,只能使用特定的语料训练出的模型,才可以应用在相应系统中。
因此,有必要提出一种应用于不同抽取系统的基于用户辅助修正来不断优化提高抽取模型效果的关系抽取方法。
发明内容
本发明的目的在于:针对现有技术的不足,而提供的基于用户辅助修正下的实体对特定关系抽取方法,该方法能在保证用户能动性的前提下,让用户对相应数据进行标注,纠正计算机的错误,提高了特定关系抽取的准确率。
为实现上述目的,本发明采用如下技术方案:
基于用户辅助修正下的实体对特定关系抽取方法,包括以下步骤:
a、设置人工标注模块,通过该人工标注模块用于按需导入数据,并通过web页面进行人工标注;
b、使用tensorflow工具构建基于深度学习的模型训练模块,其中,所述基于深度学习的模型训练模块中包含多个适用于自然语言处理关系分类的深度学习模型,训练数据经过不同的深度学习模型找出当前批数据中最优模型,并替换掉特定关系抽取模块中的抽取模型;该步骤主要用于在通过不同的分类器训练得到不同的模型与择优的过程,将实体对特定关系的抽取问题转换为实体对特定关系的二分类问题。
c、对互联网上的网页内容对应的正文文本进行整合,使用分词工具对自然语言进行处理,并依据分词结果进行数据的预处理,得到其语义特征,将语义特征作为模型标准输入得出分类结果,并对抽取结果进行汇总验证;
d、构建关系校正模块供用户进行辅助修正,通过前端展示的形式由用户判断抽取是否正确。
需要说明的是,tensorflow是由google公司推出的AI学习系统,目前已经发展到了第二代,其内置了多种神经网络的实现框架。
作为对本发明中所述的基于用户辅助修正下的实体对特定关系抽取方法的改进,所述步骤a具体包括以下步骤:
a1、设置网页,对网页的数据表进行预设;
a2、通过该网页进行人工标注,生成初始标注数据。
通过设置网页,可以有效方便人工标注的操作,提高标注的便利性。
作为对本发明中所述的基于用户辅助修正下的实体对特定关系抽取方法的改进,所述数据表的预设包括提供句子、句子的分词结果和两个实体的位置。
作为对本发明中所述的基于用户辅助修正下的实体对特定关系抽取方法的改进,所述数据表的预设还包括在数据库中增加用户互斥锁,使每条数据只会被用户处理一次。增设互斥锁可以保证多用户同时进行操作,提高适用性。
作为对本发明中所述的基于用户辅助修正下的实体对特定关系抽取方法的改进,所述步骤b具体包括以下步骤:
b1、预处理及标准化,将文本数据进行向量化处理,使文本数据通过低维向量表示;
b2、文本特征的提取,对文本中两个指定实体的物理位置和语义位置特征进行提取;
b3、训练模型的构建,将词向量、两个实体的物理、语义距离拼接,作为训练模型的输入构建模型;
b4、训练与择优选择,通过训练后取最优模型替代默认的模型。
在本发明中,为了保证文本数据的部分语义特征,利用Word Embedding工具来进行文本数据的向量化。同时,由于tensorflow内置多种神经网络的实现框架,而这些框架支持的是实体对之间的特定关系,因此两个被指定的实体的物理位置和语义位置也将在映射成多维数组后作为两个特征传入模型。其中,实体的物理位置代表一个实体在一句话中的词到两个实体的偏移量;语义特征指的是句中词语到两个实体之间的句法依赖的特征,即当前词到实体词句法依赖的最短路径。框架将词向量、两个实体的物理、语义距离拼接,作为训练模型的输入。训练过后取最优模型替换抽取模块中的模型。
作为对本发明中所述的基于用户辅助修正下的实体对特定关系抽取方法的改进,所述步骤c具体包括以下步骤:
c1、依据用户需求,自动获取网络链接到互联网上的网页内容;
c2、将步骤c1中获取的数据,通过相应规则,找出其正文,并使用分词工具对自然语言进行处理,得到其语义特征;
c3、依据步骤c2中的语义特征,加载当前分类模型进行分类;
c4、将抽取出的结果依据索引、存储、更新等不同需求,存放到不同的数据库中。
作为对本发明中所述的基于用户辅助修正下的实体对特定关系抽取方法的改进,所述步骤c1中获取的内容包括html源码和javascript代码。
作为对本发明中所述的基于用户辅助修正下的实体对特定关系抽取方法的改进,所述步骤d包括对当前的结果进行评估,若输出结果正确,则将当前句子的抽取结果标记为正例;若输出结果错误,则将当前句子的抽取结果标记为反例,同时在数据库中标记删除,下次数据将不再显示。
与现有技术相比,本发明的有益效果在于:本发明在保证用户能动性的前提下,让用户对相应数据进行标注,纠正计算机的错误,教会计算机如何产出想要的结果,通过伴随用户的辅助修正不断提高了特定关系抽取的准确率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施方式及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的工作实现流程图;
图2为本发明中人工标注的网页页面示意图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接受的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、水平”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
以下结合附图对本发明作进一步详细说明,但不作为对本发明的限定。
如图1~2所示,基于用户辅助修正下的实体对特定关系抽取方法,包括以下步骤:
a、设置人工标注模块,通过该人工标注模块用于按需导入数据,并通过web页面进行人工标注;
b、使用tensorflow工具构建基于深度学习的模型训练模块,其中,基于深度学习的模型训练模块中包含多个适用于自然语言处理关系分类的深度学习模型,处理的输入格式一致,输出层的名字一致,训练数据经过不同的深度学习模型找出当前批数据中最优模型,并替换掉特定关系抽取模块中的抽取模型;该步骤主要用于在通过不同的分类器训练得到不同的模型与择优的过程,将实体对特定关系的抽取问题转换为实体对特定关系的二分类问题。
c、对互联网上的网页内容对应的正文文本进行整合,使用分词工具对自然语言进行处理,并依据分词结果进行数据的预处理,得到其语义特征,将语义特征作为模型标准输入得出分类结果,并对抽取结果进行汇总验证;
d、构建关系校正模块供用户进行辅助修正,通过前端展示的形式由用户判断抽取是否正确。
需要说明的是,tensorflow是由google公司推出的AI学习系统,目前已经发展到了第二代,其内置了多种神经网络的实现框架。
优选的,步骤a具体包括以下步骤:
a1、设置网页,对网页的数据表进行预设,其中,数据表的设计是基于一句话中两个实体是否具有某种关系的场景,如表1中所示,因此,需要提供句子line、句子的分词结果line_segment、两个实体的位置entity1_index,entity2_index;同时,为了保证能多用户同时操作,在数据库中增加了用户互斥锁,保证每条数据只会被用户处理1次;
a2、通过该网页进行人工标注,生成初始标注数据。
通过设置网页,可以有效方便人工标注的操作,提高标注的便利性。
表1标注数据-数据表格式
名称 | 数据类型 | 注释 |
id | INT | 递增序号 |
line | TEXT | 包含两个所需实体的文本 |
url | VARchar(512) | 数据来源 |
is_processed | TINYINT(4) | 是否已被处理 |
processing | TINYINT(4) | 是否正在处理(多用户支持) |
line_segment | TEXT | 文本分词结果 |
entity1_index | INT | 第一个实体的位置序号 |
entity2_index | INT | 第二个实体的位置序号 |
annotate_result | INT | 最终标注类别 |
line_hash | VARchar(100) | 文本的hash |
create_time | TIMESTAMP | 创建时间 |
process_time | TIMESTAMP | 处理时间 |
user | VARchar(50) | 标注者 |
优选的,步骤b具体包括以下步骤:
b1、预处理及标准化,将文本数据进行向量化处理,使文本数据通过低维向量表示;
b2、文本特征的提取,对文本中两个指定实体的物理位置和语义位置特征进行提取;
b3、训练模型的构建,将词向量、两个实体的物理、语义距离拼接,作为训练模型的输入构建模型;
b4、训练与择优选择,通过训练后取最优模型替代默认的模型。
在本发明中,为了保证文本数据的部分语义特征,利用Word Embedding工具来进行文本数据的向量化。同时,由于tensorflow内置多种神经网络的实现框架,而这些框架支持的是实体对之间的特定关系,因此两个被指定的实体的物理位置和语义位置也将在映射成多维数组后作为两个特征传入模型。其中,实体的物理位置代表一个实体在一句话中的词到两个实体的偏移量;语义特征指的是句中词语到两个实体之间的句法依赖的特征,即当前词到实体词句法依赖的最短路径。框架将词向量、两个实体的物理、语义距离拼接,作为训练模型的输入。训练过后取最优模型替换抽取模块中的模型。
优选的,步骤c具体包括以下步骤:
c1、依据用户需求,自动获取网络链接到互联网上的网页内容;
c2、将步骤c1中获取的数据,通过相应规则,找出其正文,并使用分词工具对自然语言进行处理,得到其语义特征;
c3、依据步骤c2中的语义特征,加载当前分类模型进行分类;
c4、将抽取出的结果依据索引、存储、更新等不同需求,存放到不同的数据库中。
优选的,步骤c1中获取的内容包括html源码和javascript代码。
优选的,步骤d包括对当前的结果进行评估,若输出结果正确,则将当前句子的抽取结果标记为正例;若输出结果错误,则将当前句子的抽取结果标记为反例,同时在数据库中标记删除,下次数据将不再显示。用户辅助修正的过程中,用户会针对前端展示的结果进行评估,当前结果是否正确。在这里有两个操作,“固化”和“删除”。固化代表的是本条数据是正确的,当前句子的抽取结果可以标记为正例;删除代表的是本条数据是错误的,当前句子的抽取结果可以标记为反例,同时在数据库中标记删除,下次数据将不再展示。
上述说明示出并描述了本发明的若干优选实施方式,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施方式的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (7)
1.基于用户辅助修正下的实体对特定关系抽取方法,其特征在于,包括以下步骤:
a、设置人工标注模块,通过该人工标注模块用于按需导入数据,并通过web页面进行人工标注;
b、使用tensorflow工具构建基于深度学习的模型训练模块,其中,所述基于深度学习的模型训练模块中包含多个适用于自然语言处理关系分类的深度学习模型,训练数据经过不同的深度学习模型找出当前批数据中最优模型,并替换掉特定关系抽取模块中的抽取模型;
c、对互联网上的网页内容对应的正文文本进行整合,使用分词工具对自然语言进行处理,并依据分词结果进行数据的预处理,得到其语义特征,将语义特征作为模型标准输入得出分类结果,并对抽取结果进行汇总验证,包括:
c1、依据用户需求,自动获取网络链接到互联网上的网页内容;
c2、将步骤c1中获取的数据,通过相应规则,找出其正文,并使用分词工具对自然语言进行处理,得到其语义特征;
c3、依据步骤c2中的语义特征,加载当前抽取模型进行分类;
c4、将抽取出的结果依据索引、存储、更新的不同需求,存放到不同的数据库中;
d、构建关系校正模块供用户进行辅助修正,通过前端展示的形式由用户判断抽取是否正确。
2.根据权利要求1中所述的基于用户辅助修正下的实体对特定关系抽取方法,其特征在于,所述步骤a具体包括以下步骤:
a1、设置网页,对网页的数据表进行预设;
a2、通过该网页进行人工标注,生成初始标注数据。
3.根据权利要求2中所述的基于用户辅助修正下的实体对特定关系抽取方法,其特征在于:所述数据表的预设包括提供句子、句子的分词结果和两个实体的位置。
4.根据权利要求3中所述的基于用户辅助修正下的实体对特定关系抽取方法,其特征在于:所述数据表的预设还包括在数据库中增加用户互斥锁,使每条数据只会被用户处理一次。
5.根据权利要求1中所述的基于用户辅助修正下的实体对特定关系抽取方法,其特征在于,所述步骤b具体包括以下步骤:
b1、预处理及标准化,将文本数据进行向量化处理,使文本数据通过低维向量表示;
b2、文本特征的提取,对文本中两个指定实体的物理位置和语义位置特征进行提取;
b3、训练模型的构建,将词向量、两个实体的物理、语义距离拼接作为训练模型的输入;
b4、训练与择优选择,通过训练后取最优模型替代默认的模型。
6.根据权利要求1中所述的基于用户辅助修正下的实体对特定关系抽取方法,其特征在于:所述步骤c1中获取的内容包括html源码和javascript代码。
7.根据权利要求1中所述的基于用户辅助修正下的实体对特定关系抽取方法,其特征在于:所述步骤d包括对当前的结果进行评估,若输出结果正确,则将当前句子的抽取结果标记为正例;若输出结果错误,则将当前句子的抽取结果标记为反例,同时在数据库中标记删除,下次数据将不再显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911235530.3A CN111026815B (zh) | 2019-12-05 | 2019-12-05 | 基于用户辅助修正下的实体对特定关系抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911235530.3A CN111026815B (zh) | 2019-12-05 | 2019-12-05 | 基于用户辅助修正下的实体对特定关系抽取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111026815A CN111026815A (zh) | 2020-04-17 |
CN111026815B true CN111026815B (zh) | 2024-02-06 |
Family
ID=70207604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911235530.3A Active CN111026815B (zh) | 2019-12-05 | 2019-12-05 | 基于用户辅助修正下的实体对特定关系抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111026815B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111832619A (zh) * | 2020-06-09 | 2020-10-27 | 哈尔滨市科佳通用机电股份有限公司 | 基于深度学习的目标检测数据集voc数据格式标注方法 |
CN114386411A (zh) * | 2020-10-16 | 2022-04-22 | 北京金山数字娱乐科技有限公司 | 一种关系抽取方法及装置 |
CN112632350B (zh) * | 2020-12-07 | 2023-12-05 | 肇庆学院 | 一种基于在线教育大数据的深度学习样本标注方法及系统 |
CN113672732B (zh) * | 2021-08-19 | 2024-04-26 | 胜斗士(上海)科技技术发展有限公司 | 用于对业务数据进行分类的方法和设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298651A (zh) * | 2014-09-09 | 2015-01-21 | 大连理工大学 | 一种基于深度学习的生物医学命名实体识别和蛋白质交互关系抽取在线系统 |
CN107967267A (zh) * | 2016-10-18 | 2018-04-27 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160098645A1 (en) * | 2014-10-02 | 2016-04-07 | Microsoft Corporation | High-precision limited supervision relationship extractor |
-
2019
- 2019-12-05 CN CN201911235530.3A patent/CN111026815B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298651A (zh) * | 2014-09-09 | 2015-01-21 | 大连理工大学 | 一种基于深度学习的生物医学命名实体识别和蛋白质交互关系抽取在线系统 |
CN107967267A (zh) * | 2016-10-18 | 2018-04-27 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
Non-Patent Citations (1)
Title |
---|
张悦 等.人名识别技术在中国招中标领域的应用.北京信息科技大学学报(自然科学版).2017,(第05期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111026815A (zh) | 2020-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111026815B (zh) | 基于用户辅助修正下的实体对特定关系抽取方法 | |
Ling et al. | Latent predictor networks for code generation | |
WO2021151270A1 (zh) | 图像结构化数据提取方法、装置、设备及存储介质 | |
CN104331449B (zh) | 查询语句与网页相似度的确定方法、装置、终端及服务器 | |
CN109726298B (zh) | 适用于科技文献的知识图谱构建方法、系统、终端及介质 | |
CN113678118A (zh) | 数据提取系统 | |
EP3022659A1 (en) | Systems and methods for extracting table information from documents | |
CN110175585B (zh) | 一种简答题自动批改系统及方法 | |
CN114528413B (zh) | 众包标注支持的知识图谱更新方法、系统和可读存储介质 | |
CN109522417A (zh) | 一种公司名的商号抽取方法 | |
CN110555205A (zh) | 否定语义识别方法及装置、电子设备、存储介质 | |
CN109558166A (zh) | 一种面向缺陷定位的代码搜索方法 | |
CN112395425A (zh) | 一种数据处理方法、装置、计算机设备以及可读存储介质 | |
CN112765999A (zh) | 机器翻译双语对照方法及系统 | |
CN116303537A (zh) | 数据查询方法及装置、电子设备、存储介质 | |
CN110019713A (zh) | 基于意图理解的数据检索方法和装置、设备及存储介质 | |
CN111191429A (zh) | 数据表格自动填充的系统和方法 | |
CN108959630A (zh) | 一种面向英文无结构文本的人物属性抽取方法 | |
CN111061832A (zh) | 基于开放域信息抽取的人物行为抽取方法 | |
CN116245177A (zh) | 地理环境知识图谱自动化构建方法及系统、可读存储介质 | |
CN117112408A (zh) | 一种生成自动化测试用例脚本方法、装置及介质 | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
CN110232328A (zh) | 一种征信报告解析方法、装置及计算机可读存储介质 | |
CN112732743B (zh) | 一种基于中文自然语言的数据分析方法及装置 | |
CN112148735B (zh) | 一种用于结构化表格数据知识图谱的构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |