CN107203813A - 一种新型缺省实体命名方法及其系统 - Google Patents
一种新型缺省实体命名方法及其系统 Download PDFInfo
- Publication number
- CN107203813A CN107203813A CN201710365448.7A CN201710365448A CN107203813A CN 107203813 A CN107203813 A CN 107203813A CN 201710365448 A CN201710365448 A CN 201710365448A CN 107203813 A CN107203813 A CN 107203813A
- Authority
- CN
- China
- Prior art keywords
- entity
- default
- text
- name
- complete
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 239000000284 extract Substances 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 239000013589 supplement Substances 0.000 abstract description 4
- 238000006243 chemical reaction Methods 0.000 abstract description 2
- 238000002372 labelling Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000007418 data mining Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种新型缺省实体命名方法,首先提取领域文本内所涉及的基本实体;对提取的完整实体进行分类,并将该完整实体作为命名实体识别的依据;提取文本信息中所有的完整实体和缺省实体;判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。本发明还公开了一种新型缺省实体命名系统,包括文本解析模块、实体分类模块、实体提取模块以及实体判断模块。本发明一方面对于指代型的缺省数学实体,利用指代消解进行回指和预指;另一方面对于非指代型的缺省数学实体,根据预先定义的数学命名格式,进行实体命名;这两点都是进行数学实体补充,从而方便准确地进行数学实体到关系的转换,进而达到机器理解题意的目的。
Description
技术领域
本发明涉及自然语言处理应用领域,具体涉及一种新型缺省实体命名方法及其系统。
背景技术
在初等数学题目描述自然语言理解中,数学实体是文本描述到数学关系理解的核心。
现有的缺省实体命名方法定义不准确,命名过程存在误差,导致机器不能充分挖掘题目信息,造成最终的解答错误,新生成的文本不便于进一步的自然语言理解,将数学文本转化为数学关系的过程存在漏洞,影响文本中实体的完整性;且现有缺省实体命名方法的功能单一,不能满足多种功能应用的需求。
发明内容
基于此,针对上述问题,有必要提出一种新型缺省实体命名方法及其系统,本发明一方面对于指代型的缺省数学实体,利用指代消解进行回指和预指;另一方面对于非指代型的缺省数学实体,根据预先定义的数学命名格式,进行实体命名;这两点都是进行数学实体补充,从而方便准确地进行数学实体到关系的转换,进而达到机器理解题意的目的,其命名准确,便于题目描述信息被机器充分挖掘,对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;另外,机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
本发明提供一种新型缺省实体命名方法,其技术方案如下:
一种新型缺省实体命名方法,包括以下步骤:
S1、确定一个领域文本,提取该领域文本内所涉及的基本实体;
S2、对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
S3、输入识别处理后的文本信息,提取该文本信息中所有的完整实体和缺省实体;
S4、判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
客观存在并可相互区别的事物称之为实体,在本发明中,一个完整的数学实体包括类别和名称,比如“线段AB”作为一个完整的数学实体存放在二元组(线段,AB)中,“线段”是类别,“AB”是名称,缺省实体特指只有类别而没有名称的数学实体。
根据美国NIST自动内容抽取评测的解释,实体概念在文本中的引用有三种形式:命名性指标、名词性指标和代词性指标;在实际应用中,命名实体识别主要用于人名、地名和组织机构等各种类型命名实体的识别,基于条件随机场(CRF)的命名实体识别把识别过程看作一个序列标注问题,将给定的文本首先进行分词处理,对数学元素(几何元素名称,函数表达式,方程等)进行识别,基于CRF的命名实体识别方法属于有监督的学习方法,因此,需要利用已标注的大规模语料对CRF模型的参数进行训练。
本发明采用的新型缺省实体命名方法,将一个文本中的数学实体完整提取出来,建立新的缺省实体命名方法,便于下一步转化关系中题目描述信息被机器充分挖掘;并且从指代型缺省实体和非指代型缺省实体两方面入手,联系上下文,确保缺省实体的命名准确。
作为上述方案的进一步优化,所述步骤S1中,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。使CDT树上的各个节点对应了各个实体,子节点具备父节点所有性质的同时,也具备自己的特有性质。
作为上述方案的更进一步优化,所述步骤S2具体包括以下步骤:
S21、对原始领域文本进行分词;
S22、确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
S33、根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
解析文本,进行分词,并投放到实体命名识别引擎,进行自动打标签,自动打标签模型是CRF方法结合大规模语料训练的结果,实现实体识别并分类。
作为上述方案的更进一步优化,所述步骤S4具体包括以下步骤:
S41、如果存在缺省实体,则将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
S42、判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
指代消解是自然语言处理的重要内容,在信息抽取时,就用到了指代消解技术;在初等数学题意机器理解中,所用到的指代消解主要是显性代词消解,指当前的照应语与上下文出现的词、短语或句子存在密切的语义关联性;按照指向,可以分为回指和预指,回指就是代词的先行语在代词前面,预指就是代词的先行语在代词后面。
按照规则自动提取文本中所有实体,包括完整实体和缺省实体,分别存储在容器类如堆栈中,循环处理缺省实体,对于每一个缺省实体,首先分析上下文,确定是否为指代型缺省实体,如果是,则在完整实体列表中搜索到对应的实体,然后补充实体名称;对于非指代型缺省实体,则根据命名规则,自动对缺省实体进行实体命名,然后将该实体插入到完整实体列表中。
本发明对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;另外,机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
本发明还提供一种新型缺省实体命名系统,其技术方案如下:
一种新型缺省实体命名系统,包括文本解析模块、实体分类模块、实体提取模块以及实体判断模块,其中:
文本解析模块,用于确定一个领域文本,提取该领域文本内所涉及的基本实体;
实体分类模块,用于对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
实体提取模块,用于提取进行识别处理后的文本信息中所有的完整实体和缺省实体;
实体判断模块,用于判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
作为上述方案的进一步优化,所述文本解析模块包括CDT组织子模块,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
作为上述方案的更进一步优化,所述实体分类模块包括文本分词子模块、标签种类确定子模块和实体命名识别子模块,其中:
文本分词子模块,用于对原始领域文本进行分词;
标签种类确定子模块,用于确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
实体命名识别子模块,用于根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
作为上述方案的更进一步优化,所述实体判断模块包括实体存储子模块和缺省实体判断子模块,其中:
实体存储子模块,用于将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
缺省实体判断子模块,用于判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
本发明的有益效果是:
1、本发明通过对初等数学题目自然语言文本进行分析处理,将一个文本中的数学实体完整提取出来,建立新的缺省实体命名方法,便于下一步转化关系中题目描述信息被机器充分挖掘。
2、本发明构建的缺省实体命名方法,从指代型缺省实体和非指代型缺省实体两方面入手,联系上下文,确保缺省实体的命名准确。
3、本发明还对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;且机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
附图说明
图1是本发明实施例所述新型缺省实体命名方法的流程图;
图2是本发明实施例所述新型缺省实体命名系统的原理框图。
附图标记说明:
10-文本解析模块;101-CDT组织子模块;20-实体分类模块;201-文本分词子模块;202-标签种类确定子模块;203-实体命名识别子模块;30-实体提取模块;40-实体判断模块;401-实体存储子模块;402-缺省实体判断子模块。
具体实施方式
下面结合附图对本发明的实施例进行详细说明。
实施例1
如图1所示,一种新型缺省实体命名方法,包括以下步骤:
S1、确定一个领域文本,提取该领域文本内所涉及的基本实体;
S2、对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
S3、输入识别处理后的文本信息,提取该文本信息中所有的完整实体和缺省实体;
S4、判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
客观存在并可相互区别的事物称之为实体,在本发明中,一个完整的数学实体包括类别和名称,比如“线段AB”作为一个完整的数学实体存放在二元组(线段,AB)中,“线段”是类别,“AB”是名称,缺省实体特指只有类别而没有名称的数学实体。
根据美国NIST自动内容抽取评测的解释,实体概念在文本中的引用有三种形式:命名性指标、名词性指标和代词性指标;在实际应用中,命名实体识别主要用于人名、地名和组织机构等各种类型命名实体的识别,基于条件随机场(CRF)的命名实体识别把识别过程看作一个序列标注问题,将给定的文本首先进行分词处理,对数学元素(几何元素名称,函数表达式,方程等)进行识别,基于CRF的命名实体识别方法属于有监督的学习方法,因此,需要利用已标注的大规模语料对CRF模型的参数进行训练。
本发明采用的新型缺省实体命名方法,将一个文本中的数学实体完整提取出来,建立新的缺省实体命名方法,便于下一步转化关系中题目描述信息被机器充分挖掘;并且从指代型缺省实体和非指代型缺省实体两方面入手,联系上下文,确保缺省实体的命名准确。
实施例2
本实施例在实施例1的基础上,
所述步骤S1中,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
使CDT树上的各个节点对应了各个实体,子节点具备父节点所有性质的同时,也具备自己的特有性质。
实施例3
本实施例在实施例1的基础上,
所述步骤S2具体包括以下步骤:
S21、对原始领域文本进行分词;
S22、确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
S33、根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
解析文本,进行分词,并投放到实体命名识别引擎,进行自动打标签,自动打标签模型是CRF方法结合大规模语料训练的结果,实现实体识别并分类。
实施例4
本实施例在实施例1的基础上,
所述步骤S4具体包括以下步骤:
S41、如果存在缺省实体,则将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
S42、判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
指代消解是自然语言处理的重要内容,在信息抽取时,就用到了指代消解技术;在初等数学题意机器理解中,所用到的指代消解主要是显性代词消解,指当前的照应语与上下文出现的词、短语或句子存在密切的语义关联性;按照指向,可以分为回指和预指,回指就是代词的先行语在代词前面,预指就是代词的先行语在代词后面。
按照规则自动提取文本中所有实体,包括完整实体和缺省实体,分别存储在容器类如堆栈中,循环处理缺省实体,对于每一个缺省实体,首先分析上下文,确定是否为指代型缺省实体,如果是,则在完整实体列表中搜索到对应的实体,然后补充实体名称;对于非指代型缺省实体,则根据命名规则,自动对缺省实体进行实体命名,然后将该实体插入到完整实体列表中。
本发明对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;另外,机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
以下举例对本发明的新型缺省实体命名方法进行详细的说明:
已知:圆O:x^2+y^2=4的切线与x轴正半轴,y轴正半轴围成一个三角形,该三角形面积为3。
实例化上述例题步骤如下:
1)解析文本,接收领域文本数据“圆O:x^2+y^2=4的切线与x轴正半轴,y轴正半轴围成一个三角形,该三角形面积为3”;
2)解析文本,投放到实体命名识别引擎,进行自动打标签,自动打标签模型是CRF方法结合大规模语料训练结果;识别处理后的文本为“圆O&&circle:x^2+y^2=4&&expr的切线与x轴正半轴,y轴正半轴围成一个三角形,该三角形面积为3&&expr”;
3)按照规则自动提取文本中所有实体,包括完整实体和缺省实体,分别存储在容器类中:
完整实体:{(圆,O),(线,x轴正半轴),(线,y轴正半轴)}
缺省实体:{(切线,null),(三角形,null),(三角形,null)}
4)循环处理缺省实体,对于每一个缺省实体,首先分析上下文,确定是否为指代型缺省实体,如果是,则在完整实体列表中搜索到对应的实体,然后补充实体名称;对于非指代型缺省实体,则根据命名规则,自动对缺省实体进行实体命名,然后将该实体插入到完整实体列表中。
具体实施步骤如下:
A、(切线,null)为非指代型缺省实体,命名后为(切线,n_1),并把命名后的实体插入到完整实体列表中。
更新后的实体列表:
完整实体:{(圆,O),(切线,n_1),(线,x轴正半轴),(线,y轴正半轴)}
缺省实体:{(三角形,null),(三角形,null)}
B、(三角形,null)为非指代型缺省实体,命名后为(三角形,ABC_1),并把命名后的实体插入到完整实体列表中。
更新后的实体列表:
完整实体:{(圆,O),(切线,n_1),(线,x轴正半轴),(线,y轴正半轴),
(三角形,ABC_1)}
缺省实体:{(三角形,null)}
C、(三角形,null)为指代型缺省实体,对应到完整实体列表中的实体(三角形,ABC_1),插入到完整实体列表中。
更新后的实体列表:
完整实体:{(圆,O),(切线,n_1),(线,x轴正半轴),(线,y轴正半轴),
(三角形,ABC_1),(三角形,ABC_1)}
缺省实体:{}
D、缺省实体列表为空,循环结束。
5)根据完整实体列表进行实体回代到步骤2的文本中,经过缺省实体命名后的文本为:“圆O&&circle:x^2+y^2=4&&expr的切线n_&&line与x轴正半轴,y轴正半轴围成一个三角形ABC_1&&triangle,该三角形ABC_1&&triangle面积为3&&expr”。
经过缺省实体命名后,新生成的文本更便于进一步的自然语言理解,将数学文本转化为数学关系。
实施例5
本实施例为实施例1的系统,
如图2所示,一种新型缺省实体命名系统,包括文本解析模块10、实体分类模块20、实体提取模块30以及实体判断模块40,其中:
文本解析模块10,用于确定一个领域文本,提取该领域文本内所涉及的基本实体;
实体分类模块20,用于对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
实体提取模块30,用于提取进行识别处理后的文本信息中所有的完整实体和缺省实体;
实体判断模块40,用于判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
实施例6
本实施例为实施例2的系统,其在实施例5的基础上,
所述文本解析模块10包括CDT组织子模块101,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
实施例7
本实施例为实施例3的系统,其在实施例5的基础上,
所述实体分类模块20包括文本分词子模块201、标签种类确定子模块202和实体命名识别子模块203,其中:
文本分词子模块201,用于对原始领域文本进行分词;
标签种类确定子模块202,用于确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
实体命名识别子模块203,用于根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
实施例8
本实施例为实施例4的系统,其在实施例5的基础上,
所述实体判断模块40包括实体存储子模块401和缺省实体判断子模块402,其中:
实体存储子模块401,用于将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
缺省实体判断子模块402,用于判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (8)
1.一种新型缺省实体命名方法,其特征在于,包括以下步骤:
S1、确定一个领域文本,提取该领域文本内所涉及的基本实体;
S2、对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
S3、输入识别处理后的文本信息,提取该文本信息中所有的完整实体和缺省实体;
S4、判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
2.根据权利要求1所述的新型缺省实体命名方法,其特征在于,所述步骤S1中,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
3.根据权利要求1或2所述的新型缺省实体命名方法,其特征在于,所述步骤S2具体包括以下步骤:
S21、对原始领域文本进行分词;
S22、确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
S33、根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
4.根据权利要求1或2所述的新型缺省实体命名方法,其特征在于,所述步骤S4具体包括以下步骤:
S41、如果存在缺省实体,则将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
S42、判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
5.一种新型缺省实体命名系统,其特征在于,包括文本解析模块、实体分类模块、实体提取模块以及实体判断模块,其中:
文本解析模块,用于确定一个领域文本,提取该领域文本内所涉及的基本实体;
实体分类模块,用于对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
实体提取模块,用于提取进行识别处理后的文本信息中所有的完整实体和缺省实体;
实体判断模块,用于判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
6.根据权利要求5所述的新型缺省实体命名系统,其特征在于,所述文本解析模块包括CDT组织子模块,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
7.根据权利要求5或6所述的新型缺省实体命名系统,其特征在于,所述实体分类模块包括文本分词子模块、标签种类确定子模块和实体命名识别子模块,其中:
文本分词子模块,用于对原始领域文本进行分词;
标签种类确定子模块,用于确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
实体命名识别子模块,用于根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
8.根据权利要求5或6所述的新型缺省实体命名系统,其特征在于,所述实体判断模块包括实体存储子模块和缺省实体判断子模块,其中:
实体存储子模块,用于将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
缺省实体判断子模块,用于判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710365448.7A CN107203813A (zh) | 2017-05-22 | 2017-05-22 | 一种新型缺省实体命名方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710365448.7A CN107203813A (zh) | 2017-05-22 | 2017-05-22 | 一种新型缺省实体命名方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107203813A true CN107203813A (zh) | 2017-09-26 |
Family
ID=59906402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710365448.7A Pending CN107203813A (zh) | 2017-05-22 | 2017-05-22 | 一种新型缺省实体命名方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107203813A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107168949A (zh) * | 2017-04-24 | 2017-09-15 | 成都准星云学科技有限公司 | 基于实体组合的数学自然语言处理实现方法、系统 |
CN109325098A (zh) * | 2018-08-23 | 2019-02-12 | 上海互教教育科技有限公司 | 用于数学题目语义解析的指代消解方法 |
CN110399452A (zh) * | 2019-07-23 | 2019-11-01 | 福建奇点时空数字科技有限公司 | 一种基于实例特征建模的命名实体列表生成方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294322A (zh) * | 2016-08-04 | 2017-01-04 | 哈尔滨工业大学 | 一种基于lstm的汉语零指代消解方法 |
-
2017
- 2017-05-22 CN CN201710365448.7A patent/CN107203813A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294322A (zh) * | 2016-08-04 | 2017-01-04 | 哈尔滨工业大学 | 一种基于lstm的汉语零指代消解方法 |
Non-Patent Citations (3)
Title |
---|
XUEQING ZHANG等: "A HYBRID APPROACH FOR CHINESE NAMED ENTITY RECOGNITION IN MUSIC DOMAIN", 《2009 EIGHTH IEEE INTERNATIONAL CONFERENCE ON DEPENDABLE, AUTONOMIC AND SECURE COMPUTING》 * |
吴中兴等: "概念从属树——一种新的树模型设计", 《计算机应用》 * |
李云静: "基于石油领域本体的 Web 信息抽取技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107168949A (zh) * | 2017-04-24 | 2017-09-15 | 成都准星云学科技有限公司 | 基于实体组合的数学自然语言处理实现方法、系统 |
CN109325098A (zh) * | 2018-08-23 | 2019-02-12 | 上海互教教育科技有限公司 | 用于数学题目语义解析的指代消解方法 |
CN109325098B (zh) * | 2018-08-23 | 2021-07-16 | 上海互教教育科技有限公司 | 用于数学题目语义解析的指代消解方法 |
CN110399452A (zh) * | 2019-07-23 | 2019-11-01 | 福建奇点时空数字科技有限公司 | 一种基于实例特征建模的命名实体列表生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766371B (zh) | 一种文本信息分类方法及其装置 | |
CN108874878B (zh) | 一种知识图谱的构建系统及方法 | |
CN106874378B (zh) | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 | |
CN111159356B (zh) | 基于教学内容的知识图谱构建方法 | |
CN103176963B (zh) | 基于crf++汉语句义结构模型自动标注方法 | |
CN107562918A (zh) | 一种数学题知识点发现与批量标签获取方法 | |
CN113626613B (zh) | 基于融入知识图谱子图信息及实体信息的实体链接方法 | |
CN103544267A (zh) | 一种基于搜索建议词进行搜索的方法以及装置 | |
CN105224648A (zh) | 一种实体链接方法与系统 | |
CN103077164A (zh) | 文本分析方法及文本分析器 | |
CN104679885A (zh) | 一种基于语义特征模型的用户搜索串机构名识别方法 | |
CN104933152A (zh) | 命名实体识别方法及装置 | |
CN108228568B (zh) | 一种数学题目语义理解方法 | |
CN106156799A (zh) | 智能机器人的物体识别方法及装置 | |
CN109446221A (zh) | 一种基于语义分析的交互式数据探查方法 | |
CN107203813A (zh) | 一种新型缺省实体命名方法及其系统 | |
CN117151659B (zh) | 一种基于大语言模型的生态修复工程全生命周期追溯方法 | |
CN108021682A (zh) | 开放式信息抽取背景下一种基于维基百科的实体语义化方法 | |
CN116340467B (zh) | 文本处理方法、装置、电子设备、及计算机可读存储介质 | |
CN106777336A (zh) | 一种基于深度学习的公司名成分抽取系统和方法 | |
CN103500216A (zh) | 一种文件信息的提取方法 | |
CN112182241A (zh) | 一种空管领域知识图谱的自动化构建方法 | |
CN107451433B (zh) | 一种基于文本内容的信息源识别方法与装置 | |
CN107590119A (zh) | 人物属性信息抽取方法及装置 | |
CN117216221A (zh) | 一种基于知识图谱的智能问答系统及构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190801 Address after: Room 11H, Building No. 33 Zizhuyuan Road, Haidian District, Beijing 100089 Applicant after: Lin Hui Address before: 610000 Fifth Floor, Building No. 5, Tianfu New Valley, 399 West Section of Fucheng Avenue, Chengdu High-tech Zone, Sichuan Province Applicant before: Chengdu foresight nehology Science and Technology Ltd. |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170926 |