CN107203813A - 一种新型缺省实体命名方法及其系统 - Google Patents

一种新型缺省实体命名方法及其系统 Download PDF

Info

Publication number
CN107203813A
CN107203813A CN201710365448.7A CN201710365448A CN107203813A CN 107203813 A CN107203813 A CN 107203813A CN 201710365448 A CN201710365448 A CN 201710365448A CN 107203813 A CN107203813 A CN 107203813A
Authority
CN
China
Prior art keywords
entity
default
text
name
complete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710365448.7A
Other languages
English (en)
Inventor
林辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lin Hui
Original Assignee
Chengdu Foresight Nehology Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Foresight Nehology Science And Technology Ltd filed Critical Chengdu Foresight Nehology Science And Technology Ltd
Priority to CN201710365448.7A priority Critical patent/CN107203813A/zh
Publication of CN107203813A publication Critical patent/CN107203813A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种新型缺省实体命名方法,首先提取领域文本内所涉及的基本实体;对提取的完整实体进行分类,并将该完整实体作为命名实体识别的依据;提取文本信息中所有的完整实体和缺省实体;判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。本发明还公开了一种新型缺省实体命名系统,包括文本解析模块、实体分类模块、实体提取模块以及实体判断模块。本发明一方面对于指代型的缺省数学实体,利用指代消解进行回指和预指;另一方面对于非指代型的缺省数学实体,根据预先定义的数学命名格式,进行实体命名;这两点都是进行数学实体补充,从而方便准确地进行数学实体到关系的转换,进而达到机器理解题意的目的。

Description

一种新型缺省实体命名方法及其系统
技术领域
本发明涉及自然语言处理应用领域,具体涉及一种新型缺省实体命名方法及其系统。
背景技术
在初等数学题目描述自然语言理解中,数学实体是文本描述到数学关系理解的核心。
现有的缺省实体命名方法定义不准确,命名过程存在误差,导致机器不能充分挖掘题目信息,造成最终的解答错误,新生成的文本不便于进一步的自然语言理解,将数学文本转化为数学关系的过程存在漏洞,影响文本中实体的完整性;且现有缺省实体命名方法的功能单一,不能满足多种功能应用的需求。
发明内容
基于此,针对上述问题,有必要提出一种新型缺省实体命名方法及其系统,本发明一方面对于指代型的缺省数学实体,利用指代消解进行回指和预指;另一方面对于非指代型的缺省数学实体,根据预先定义的数学命名格式,进行实体命名;这两点都是进行数学实体补充,从而方便准确地进行数学实体到关系的转换,进而达到机器理解题意的目的,其命名准确,便于题目描述信息被机器充分挖掘,对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;另外,机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
本发明提供一种新型缺省实体命名方法,其技术方案如下:
一种新型缺省实体命名方法,包括以下步骤:
S1、确定一个领域文本,提取该领域文本内所涉及的基本实体;
S2、对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
S3、输入识别处理后的文本信息,提取该文本信息中所有的完整实体和缺省实体;
S4、判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
客观存在并可相互区别的事物称之为实体,在本发明中,一个完整的数学实体包括类别和名称,比如“线段AB”作为一个完整的数学实体存放在二元组(线段,AB)中,“线段”是类别,“AB”是名称,缺省实体特指只有类别而没有名称的数学实体。
根据美国NIST自动内容抽取评测的解释,实体概念在文本中的引用有三种形式:命名性指标、名词性指标和代词性指标;在实际应用中,命名实体识别主要用于人名、地名和组织机构等各种类型命名实体的识别,基于条件随机场(CRF)的命名实体识别把识别过程看作一个序列标注问题,将给定的文本首先进行分词处理,对数学元素(几何元素名称,函数表达式,方程等)进行识别,基于CRF的命名实体识别方法属于有监督的学习方法,因此,需要利用已标注的大规模语料对CRF模型的参数进行训练。
本发明采用的新型缺省实体命名方法,将一个文本中的数学实体完整提取出来,建立新的缺省实体命名方法,便于下一步转化关系中题目描述信息被机器充分挖掘;并且从指代型缺省实体和非指代型缺省实体两方面入手,联系上下文,确保缺省实体的命名准确。
作为上述方案的进一步优化,所述步骤S1中,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。使CDT树上的各个节点对应了各个实体,子节点具备父节点所有性质的同时,也具备自己的特有性质。
作为上述方案的更进一步优化,所述步骤S2具体包括以下步骤:
S21、对原始领域文本进行分词;
S22、确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
S33、根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
解析文本,进行分词,并投放到实体命名识别引擎,进行自动打标签,自动打标签模型是CRF方法结合大规模语料训练的结果,实现实体识别并分类。
作为上述方案的更进一步优化,所述步骤S4具体包括以下步骤:
S41、如果存在缺省实体,则将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
S42、判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
指代消解是自然语言处理的重要内容,在信息抽取时,就用到了指代消解技术;在初等数学题意机器理解中,所用到的指代消解主要是显性代词消解,指当前的照应语与上下文出现的词、短语或句子存在密切的语义关联性;按照指向,可以分为回指和预指,回指就是代词的先行语在代词前面,预指就是代词的先行语在代词后面。
按照规则自动提取文本中所有实体,包括完整实体和缺省实体,分别存储在容器类如堆栈中,循环处理缺省实体,对于每一个缺省实体,首先分析上下文,确定是否为指代型缺省实体,如果是,则在完整实体列表中搜索到对应的实体,然后补充实体名称;对于非指代型缺省实体,则根据命名规则,自动对缺省实体进行实体命名,然后将该实体插入到完整实体列表中。
本发明对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;另外,机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
本发明还提供一种新型缺省实体命名系统,其技术方案如下:
一种新型缺省实体命名系统,包括文本解析模块、实体分类模块、实体提取模块以及实体判断模块,其中:
文本解析模块,用于确定一个领域文本,提取该领域文本内所涉及的基本实体;
实体分类模块,用于对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
实体提取模块,用于提取进行识别处理后的文本信息中所有的完整实体和缺省实体;
实体判断模块,用于判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
作为上述方案的进一步优化,所述文本解析模块包括CDT组织子模块,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
作为上述方案的更进一步优化,所述实体分类模块包括文本分词子模块、标签种类确定子模块和实体命名识别子模块,其中:
文本分词子模块,用于对原始领域文本进行分词;
标签种类确定子模块,用于确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
实体命名识别子模块,用于根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
作为上述方案的更进一步优化,所述实体判断模块包括实体存储子模块和缺省实体判断子模块,其中:
实体存储子模块,用于将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
缺省实体判断子模块,用于判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
本发明的有益效果是:
1、本发明通过对初等数学题目自然语言文本进行分析处理,将一个文本中的数学实体完整提取出来,建立新的缺省实体命名方法,便于下一步转化关系中题目描述信息被机器充分挖掘。
2、本发明构建的缺省实体命名方法,从指代型缺省实体和非指代型缺省实体两方面入手,联系上下文,确保缺省实体的命名准确。
3、本发明还对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;且机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
附图说明
图1是本发明实施例所述新型缺省实体命名方法的流程图;
图2是本发明实施例所述新型缺省实体命名系统的原理框图。
附图标记说明:
10-文本解析模块;101-CDT组织子模块;20-实体分类模块;201-文本分词子模块;202-标签种类确定子模块;203-实体命名识别子模块;30-实体提取模块;40-实体判断模块;401-实体存储子模块;402-缺省实体判断子模块。
具体实施方式
下面结合附图对本发明的实施例进行详细说明。
实施例1
如图1所示,一种新型缺省实体命名方法,包括以下步骤:
S1、确定一个领域文本,提取该领域文本内所涉及的基本实体;
S2、对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
S3、输入识别处理后的文本信息,提取该文本信息中所有的完整实体和缺省实体;
S4、判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
客观存在并可相互区别的事物称之为实体,在本发明中,一个完整的数学实体包括类别和名称,比如“线段AB”作为一个完整的数学实体存放在二元组(线段,AB)中,“线段”是类别,“AB”是名称,缺省实体特指只有类别而没有名称的数学实体。
根据美国NIST自动内容抽取评测的解释,实体概念在文本中的引用有三种形式:命名性指标、名词性指标和代词性指标;在实际应用中,命名实体识别主要用于人名、地名和组织机构等各种类型命名实体的识别,基于条件随机场(CRF)的命名实体识别把识别过程看作一个序列标注问题,将给定的文本首先进行分词处理,对数学元素(几何元素名称,函数表达式,方程等)进行识别,基于CRF的命名实体识别方法属于有监督的学习方法,因此,需要利用已标注的大规模语料对CRF模型的参数进行训练。
本发明采用的新型缺省实体命名方法,将一个文本中的数学实体完整提取出来,建立新的缺省实体命名方法,便于下一步转化关系中题目描述信息被机器充分挖掘;并且从指代型缺省实体和非指代型缺省实体两方面入手,联系上下文,确保缺省实体的命名准确。
实施例2
本实施例在实施例1的基础上,
所述步骤S1中,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
使CDT树上的各个节点对应了各个实体,子节点具备父节点所有性质的同时,也具备自己的特有性质。
实施例3
本实施例在实施例1的基础上,
所述步骤S2具体包括以下步骤:
S21、对原始领域文本进行分词;
S22、确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
S33、根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
解析文本,进行分词,并投放到实体命名识别引擎,进行自动打标签,自动打标签模型是CRF方法结合大规模语料训练的结果,实现实体识别并分类。
实施例4
本实施例在实施例1的基础上,
所述步骤S4具体包括以下步骤:
S41、如果存在缺省实体,则将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
S42、判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
指代消解是自然语言处理的重要内容,在信息抽取时,就用到了指代消解技术;在初等数学题意机器理解中,所用到的指代消解主要是显性代词消解,指当前的照应语与上下文出现的词、短语或句子存在密切的语义关联性;按照指向,可以分为回指和预指,回指就是代词的先行语在代词前面,预指就是代词的先行语在代词后面。
按照规则自动提取文本中所有实体,包括完整实体和缺省实体,分别存储在容器类如堆栈中,循环处理缺省实体,对于每一个缺省实体,首先分析上下文,确定是否为指代型缺省实体,如果是,则在完整实体列表中搜索到对应的实体,然后补充实体名称;对于非指代型缺省实体,则根据命名规则,自动对缺省实体进行实体命名,然后将该实体插入到完整实体列表中。
本发明对提取后的完整实体及对应原始文本进行存储,结合实体及原始文本的矩阵化处理,可以作为机器学习的训练集和测试集;另外,机器学习模型的构建可以完成多种应用,如进行文本分类和数据挖掘。
以下举例对本发明的新型缺省实体命名方法进行详细的说明:
已知:圆O:x^2+y^2=4的切线与x轴正半轴,y轴正半轴围成一个三角形,该三角形面积为3。
实例化上述例题步骤如下:
1)解析文本,接收领域文本数据“圆O:x^2+y^2=4的切线与x轴正半轴,y轴正半轴围成一个三角形,该三角形面积为3”;
2)解析文本,投放到实体命名识别引擎,进行自动打标签,自动打标签模型是CRF方法结合大规模语料训练结果;识别处理后的文本为“圆O&&circle:x^2+y^2=4&&expr的切线与x轴正半轴,y轴正半轴围成一个三角形,该三角形面积为3&&expr”;
3)按照规则自动提取文本中所有实体,包括完整实体和缺省实体,分别存储在容器类中:
完整实体:{(圆,O),(线,x轴正半轴),(线,y轴正半轴)}
缺省实体:{(切线,null),(三角形,null),(三角形,null)}
4)循环处理缺省实体,对于每一个缺省实体,首先分析上下文,确定是否为指代型缺省实体,如果是,则在完整实体列表中搜索到对应的实体,然后补充实体名称;对于非指代型缺省实体,则根据命名规则,自动对缺省实体进行实体命名,然后将该实体插入到完整实体列表中。
具体实施步骤如下:
A、(切线,null)为非指代型缺省实体,命名后为(切线,n_1),并把命名后的实体插入到完整实体列表中。
更新后的实体列表:
完整实体:{(圆,O),(切线,n_1),(线,x轴正半轴),(线,y轴正半轴)}
缺省实体:{(三角形,null),(三角形,null)}
B、(三角形,null)为非指代型缺省实体,命名后为(三角形,ABC_1),并把命名后的实体插入到完整实体列表中。
更新后的实体列表:
完整实体:{(圆,O),(切线,n_1),(线,x轴正半轴),(线,y轴正半轴),
(三角形,ABC_1)}
缺省实体:{(三角形,null)}
C、(三角形,null)为指代型缺省实体,对应到完整实体列表中的实体(三角形,ABC_1),插入到完整实体列表中。
更新后的实体列表:
完整实体:{(圆,O),(切线,n_1),(线,x轴正半轴),(线,y轴正半轴),
(三角形,ABC_1),(三角形,ABC_1)}
缺省实体:{}
D、缺省实体列表为空,循环结束。
5)根据完整实体列表进行实体回代到步骤2的文本中,经过缺省实体命名后的文本为:“圆O&&circle:x^2+y^2=4&&expr的切线n_&&line与x轴正半轴,y轴正半轴围成一个三角形ABC_1&&triangle,该三角形ABC_1&&triangle面积为3&&expr”。
经过缺省实体命名后,新生成的文本更便于进一步的自然语言理解,将数学文本转化为数学关系。
实施例5
本实施例为实施例1的系统,
如图2所示,一种新型缺省实体命名系统,包括文本解析模块10、实体分类模块20、实体提取模块30以及实体判断模块40,其中:
文本解析模块10,用于确定一个领域文本,提取该领域文本内所涉及的基本实体;
实体分类模块20,用于对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
实体提取模块30,用于提取进行识别处理后的文本信息中所有的完整实体和缺省实体;
实体判断模块40,用于判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
实施例6
本实施例为实施例2的系统,其在实施例5的基础上,
所述文本解析模块10包括CDT组织子模块101,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
实施例7
本实施例为实施例3的系统,其在实施例5的基础上,
所述实体分类模块20包括文本分词子模块201、标签种类确定子模块202和实体命名识别子模块203,其中:
文本分词子模块201,用于对原始领域文本进行分词;
标签种类确定子模块202,用于确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
实体命名识别子模块203,用于根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
实施例8
本实施例为实施例4的系统,其在实施例5的基础上,
所述实体判断模块40包括实体存储子模块401和缺省实体判断子模块402,其中:
实体存储子模块401,用于将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
缺省实体判断子模块402,用于判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (8)

1.一种新型缺省实体命名方法,其特征在于,包括以下步骤:
S1、确定一个领域文本,提取该领域文本内所涉及的基本实体;
S2、对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
S3、输入识别处理后的文本信息,提取该文本信息中所有的完整实体和缺省实体;
S4、判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
2.根据权利要求1所述的新型缺省实体命名方法,其特征在于,所述步骤S1中,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
3.根据权利要求1或2所述的新型缺省实体命名方法,其特征在于,所述步骤S2具体包括以下步骤:
S21、对原始领域文本进行分词;
S22、确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
S33、根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
4.根据权利要求1或2所述的新型缺省实体命名方法,其特征在于,所述步骤S4具体包括以下步骤:
S41、如果存在缺省实体,则将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
S42、判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
5.一种新型缺省实体命名系统,其特征在于,包括文本解析模块、实体分类模块、实体提取模块以及实体判断模块,其中:
文本解析模块,用于确定一个领域文本,提取该领域文本内所涉及的基本实体;
实体分类模块,用于对提取到的完整实体按预设定的规则进行分类,并将分类后的完整实体作为命名实体识别的依据;
实体提取模块,用于提取进行识别处理后的文本信息中所有的完整实体和缺省实体;
实体判断模块,用于判断是否存在缺省实体,如果是,则根据上下文对缺省实体进行实体命名;如果否,则结束实体命名。
6.根据权利要求5所述的新型缺省实体命名系统,其特征在于,所述文本解析模块包括CDT组织子模块,利用概念从属树CDT的结构来组织表示领域文本内的基本实体,并将有继承关系的实体抽象为一类,组织到CDT上。
7.根据权利要求5或6所述的新型缺省实体命名系统,其特征在于,所述实体分类模块包括文本分词子模块、标签种类确定子模块和实体命名识别子模块,其中:
文本分词子模块,用于对原始领域文本进行分词;
标签种类确定子模块,用于确定实体的种类全集,并根据预设定的规则,确定命名实体识别的标签种类,建立命名实体识别的训练语料库;
实体命名识别子模块,用于根据CRF命名实体识别法,对文本中出现的实体名称,进行命名实体识别,并确定其实体类别。
8.根据权利要求5或6所述的新型缺省实体命名系统,其特征在于,所述实体判断模块包括实体存储子模块和缺省实体判断子模块,其中:
实体存储子模块,用于将S3步骤中提取的完整实体和缺省实体存储在相应的堆栈中;
缺省实体判断子模块,用于判断缺省实体是指代型缺省实体还是非指代型缺省实体,如果是指代型缺省实体,则利用指代消解进行回指和预指;如果是非指代型缺省实体,则根据实体类别命名规则进行命名。
CN201710365448.7A 2017-05-22 2017-05-22 一种新型缺省实体命名方法及其系统 Pending CN107203813A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710365448.7A CN107203813A (zh) 2017-05-22 2017-05-22 一种新型缺省实体命名方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710365448.7A CN107203813A (zh) 2017-05-22 2017-05-22 一种新型缺省实体命名方法及其系统

Publications (1)

Publication Number Publication Date
CN107203813A true CN107203813A (zh) 2017-09-26

Family

ID=59906402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710365448.7A Pending CN107203813A (zh) 2017-05-22 2017-05-22 一种新型缺省实体命名方法及其系统

Country Status (1)

Country Link
CN (1) CN107203813A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168949A (zh) * 2017-04-24 2017-09-15 成都准星云学科技有限公司 基于实体组合的数学自然语言处理实现方法、系统
CN109325098A (zh) * 2018-08-23 2019-02-12 上海互教教育科技有限公司 用于数学题目语义解析的指代消解方法
CN110399452A (zh) * 2019-07-23 2019-11-01 福建奇点时空数字科技有限公司 一种基于实例特征建模的命名实体列表生成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294322A (zh) * 2016-08-04 2017-01-04 哈尔滨工业大学 一种基于lstm的汉语零指代消解方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294322A (zh) * 2016-08-04 2017-01-04 哈尔滨工业大学 一种基于lstm的汉语零指代消解方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XUEQING ZHANG等: "A HYBRID APPROACH FOR CHINESE NAMED ENTITY RECOGNITION IN MUSIC DOMAIN", 《2009 EIGHTH IEEE INTERNATIONAL CONFERENCE ON DEPENDABLE, AUTONOMIC AND SECURE COMPUTING》 *
吴中兴等: "概念从属树——一种新的树模型设计", 《计算机应用》 *
李云静: "基于石油领域本体的 Web 信息抽取技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168949A (zh) * 2017-04-24 2017-09-15 成都准星云学科技有限公司 基于实体组合的数学自然语言处理实现方法、系统
CN109325098A (zh) * 2018-08-23 2019-02-12 上海互教教育科技有限公司 用于数学题目语义解析的指代消解方法
CN109325098B (zh) * 2018-08-23 2021-07-16 上海互教教育科技有限公司 用于数学题目语义解析的指代消解方法
CN110399452A (zh) * 2019-07-23 2019-11-01 福建奇点时空数字科技有限公司 一种基于实例特征建模的命名实体列表生成方法

Similar Documents

Publication Publication Date Title
CN107766371B (zh) 一种文本信息分类方法及其装置
CN108874878B (zh) 一种知识图谱的构建系统及方法
CN106874378B (zh) 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN111159356B (zh) 基于教学内容的知识图谱构建方法
CN103176963B (zh) 基于crf++汉语句义结构模型自动标注方法
CN107562918A (zh) 一种数学题知识点发现与批量标签获取方法
CN113626613B (zh) 基于融入知识图谱子图信息及实体信息的实体链接方法
CN103544267A (zh) 一种基于搜索建议词进行搜索的方法以及装置
CN105224648A (zh) 一种实体链接方法与系统
CN103077164A (zh) 文本分析方法及文本分析器
CN104679885A (zh) 一种基于语义特征模型的用户搜索串机构名识别方法
CN104933152A (zh) 命名实体识别方法及装置
CN108228568B (zh) 一种数学题目语义理解方法
CN106156799A (zh) 智能机器人的物体识别方法及装置
CN109446221A (zh) 一种基于语义分析的交互式数据探查方法
CN107203813A (zh) 一种新型缺省实体命名方法及其系统
CN117151659B (zh) 一种基于大语言模型的生态修复工程全生命周期追溯方法
CN108021682A (zh) 开放式信息抽取背景下一种基于维基百科的实体语义化方法
CN116340467B (zh) 文本处理方法、装置、电子设备、及计算机可读存储介质
CN106777336A (zh) 一种基于深度学习的公司名成分抽取系统和方法
CN103500216A (zh) 一种文件信息的提取方法
CN112182241A (zh) 一种空管领域知识图谱的自动化构建方法
CN107451433B (zh) 一种基于文本内容的信息源识别方法与装置
CN107590119A (zh) 人物属性信息抽取方法及装置
CN117216221A (zh) 一种基于知识图谱的智能问答系统及构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190801

Address after: Room 11H, Building No. 33 Zizhuyuan Road, Haidian District, Beijing 100089

Applicant after: Lin Hui

Address before: 610000 Fifth Floor, Building No. 5, Tianfu New Valley, 399 West Section of Fucheng Avenue, Chengdu High-tech Zone, Sichuan Province

Applicant before: Chengdu foresight nehology Science and Technology Ltd.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170926