CN117252202B - 高中数学题目中命名实体的构建方法、识别方法和系统 - Google Patents
高中数学题目中命名实体的构建方法、识别方法和系统 Download PDFInfo
- Publication number
- CN117252202B CN117252202B CN202311544077.0A CN202311544077A CN117252202B CN 117252202 B CN117252202 B CN 117252202B CN 202311544077 A CN202311544077 A CN 202311544077A CN 117252202 B CN117252202 B CN 117252202B
- Authority
- CN
- China
- Prior art keywords
- entity
- named
- school
- entities
- mathematical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000010276 construction Methods 0.000 title claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000013135 deep learning Methods 0.000 claims abstract description 8
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 2
- 238000002372 labelling Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 9
- 238000003058 natural language processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 5
- 238000012887 quadratic function Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种高中数学题目中命名实体的构建方法、识别方法和系统,构建方法包括:根据高中数学通用的基础特征建立特征空间,特征空间中包含章节范畴特征、实体属性特征和主从属性特征;利用章节范畴特征、实体属性特征和主从属性特征进行逻辑组合成多个命名实体,多个命名实体构成高中数学命名实体空间,命名实体用于对高中数学的实体进行分类和描述;通过正则化和深度学习算法模型训练高中数学命名实体空间,并获得反馈结果;利用反馈结果对高中数学命名实体空间进行修正和更新。本发明的命名实体既能够准确表达数学实体的特征,又使实体具有了通过算法识别的逻辑基础。
Description
技术领域
本发明涉及一种电子技术领域,尤其涉及一种高中数学题目中命名实体的构建方法、识别方法和系统。
背景技术
自然语言处理(NLP,Natural Language Processing) 是研究人与计算机交互的语言问题的一门学科。命名实体识别在NLP中是一个极其重要的基础工作,在一些精准度要求较高的NLP任务中,命名实体识别的准确度决定了NLP识别任务的最终成败。现有技术中主流的命名实体识别方式包括两大类:(1)NLP命名实体识别的通用模型。通用模型针对一些通用文本可以准确高效识别文本中的一些命名实体,诸如人名、地名、机构名等。(2)领域知识命名实体识别专家系统。某些领域知识可以通过人工的专家系统或者手动构建领域命名实体词库来提供部分命名实体的识别支持。
当前的命名实体识别技术可依赖下面几种方式:(1)基于规则的方法,比如定义正则表达式来识别电话、邮箱、身份证号码等。(2)基于投票的方法,事先统计文本关键词的实体类型,记录每个关键词的实体类型的概率,在后续识别过程中根据实体类型的概率大小确定命名实体的类型。(3)基于命名实体特征工程的实体分类模型,通过命名实体的实体特征,构建特征工程分类模型,训练分类模型来识别文本中的命名实体。
然而,现有的命名实体识别技术只是针对通用的文本进行命名实体的识别,对于某些领域知识(比如高中数学)缺乏识别的能力。此外,对于某些领域(如高中数学)缺乏命名实体的特征库,如果只通过专家建设的话,成本极高,效率极低。因此,现有技术中对于学科类知识点标注项目(比如数学知识点标注),缺乏统一的标准化命名实体库,限制了学科知识点标注的技术发展。
发明内容
本发明旨在解决上述问题之一。
本发明的主要目的在于提供一种高中数学题目中命名实体的构建方法。
本发明的另一目的在于提供一种高中数学题目中命名实体的识别方法。
本发明的又一目的在于提供一种高中数学题目中命名实体的识别系统。
为达到上述目的,本发明的技术方案具体是这样实现的:
本发明一方面提供了一种高中数学题目中命名实体的构建方法,包括:根据高中数学通用的基础特征建立特征空间,所述特征空间中包含章节范畴特征、实体属性特征和主从属性特征,其中,所述实体属性特征的值至少包括实体类、关系类和运算类,所述主从属性特征的值至少包括主体类、从体类和独立体类;利用所述章节范畴特征、所述实体属性特征和所述主从属性特征进行逻辑组合成多个命名实体,所述多个命名实体构成高中数学命名实体空间,其中,所述命名实体用于对所述高中数学的实体进行分类和描述;通过正则化和深度学习算法模型训练所述高中数学命名实体空间,并获得反馈结果;利用所述反馈结果对所述高中数学命名实体空间进行修正和更新。
本发明另一方面提供了一种高中数学题目中命名实体的识别方法,包括:获取待识别的高中数学题目;根据前述的高中数学命名实体空间,识别出所述待识别的高中数学题目中所有的命名实体;根据识别出的所述命名实体,将所述待识别的高中数学题目进行分类。
本发明又一方面还提供了一种高中数学题目中命名实体的识别系统,包括:获取模块,用于获取待识别的高中数学题目;识别模块,用于根据前述的高中数学命名实体空间,识别出所述待识别的高中数学题目中所有的命名实体;分类模块,用于根据识别出的所述命名实体,将所述待识别的高中数学题目进行分类。
由上述本发明提供的技术方案可以看出,本发明提供了一种高中数学题目中命名实体的构建方法、识别方法和系统,通过该构建方法构建了一个高中数学命名实体空间,将数学的命名实体抽象成一些基础实体特征原则的多维度的组合,既能够准确表达数学实体的特征,又使实体具有了通过算法识别的逻辑基础,具有很强的解释性,并且可以在后期的实践过程中根据结果反馈对其进行持续优化。本发明提供的命名实体,既能体现出所涉及的数学实体属性,又具备能够通过少量核心属性进行快速组合的特点,从而可以借助算法模型快速准确地识别题目中的有效命名实体,进而为题目的语义理解和知识点标注提供基础。通过本发明提供的识别方法和系统,在前述的构建方法建立的高中数学命名实体空间基础上对命名实体进行识别,可以实现对高中数学题目中实体的精准识别。 高中数学命名实体识别是知识点标注的前提,本发明高效精准地识别命名实体为知识点标注提供了坚实的基础。此外,本发明有效地结合了专家系统和算法模型的优势,在确保精准度的前提下,提高了高中数学命名实体识别的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例1提供的高中数学题目中命名实体的构建方法的流程图;
图2为本发明实施例1提供的高中数学题目中命名实体的识别方法的流程图;
图3为本发明实施例1提供的高中数学题目中命名实体的识别系统的结构示意图;
图4为本发明实施例1提供的高中数学题目中命名实体的构建方法的一个具体流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或数量或位置。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
下面将结合附图对本发明实施例作进一步地详细描述。
实施例1
本实施例提供一种高中数学题目中命名实体的构建方法,如图1所示,包括:
步骤S101,根据高中数学通用的基础特征建立特征空间,特征空间中包含章节范畴特征、实体属性特征和主从属性特征,其中,实体属性特征的值至少包括实体类、关系类和运算类,主从属性特征的值至少包括主体类、从体类和独立体类;具体来说,高中数学命名实体的识别也是不能脱离专家系统的支持的,因此首先需要基于专家系统构建一个特征空间来容纳高中数学领域通用的基础特征的规范,然后建立一批基础的命名实体识别的识别原则,比如将高中数学的命名实体从所属章节范畴、实体的属性(实体类、关系类、运算类等)、主从属性(主体类、从体类或者独立体类等)。当然,本实施例仅列出了具有代表性的三个基础特征,在实际使用过程中,特征空间还可以包含除本实施例列出的三种基础特征之外的其他特征维度,从而建立更高维度的特征空间。针对章节范畴、实体属性、主从属性的取值,本实施例仅选取了一些具有代表性的特征值,实际上章节范畴、实体属性、主从属性的取值应该能够涵盖高中数学的所有基础特征,远不止本实施例中所选取的特征值。
步骤S102,利用章节范畴特征、实体属性特征和主从属性特征进行逻辑组合成多个命名实体,多个命名实体构成高中数学命名实体空间,其中,命名实体用于对高中数学的实体进行分类和描述;具体来说,将高中数学的命名实体描述为基础特征规范的模式化组合,在高维度特征空间内进行定位。基于高中数学命名实体的基础特征原则,可以将具体的数学实体进行分类处理,将每一种类别转化为基础特征原则的逻辑组合(章节范畴-实体-主从体组合等),每个组合可以表达一类高中数学的实体。通过将数学的命名实体抽象成一些基础实体特征的多维度组合,既能够准确表达数学实体的特征,又使实体具有了通过算法识别的逻辑基础,具有很强的解释性。
步骤S103,通过正则化和深度学习算法模型训练高中数学命名实体空间,并获得反馈结果;具体来说,可以通过构建算法模型学习提炼高中数学命名实体的组合特征, 通过正则化和深度学习算法模型学习专家系统构建的高中数学命名实体的逻辑组合,提炼出逻辑组合的算法层级特征,并不断提供包含有命名实体的高中数学题目作为样本数据进行识别和负反馈学习,并获取反馈结果。
在一个可选的实施方式中,通过正则化和深度学习算法模型训练高中数学命名实体空间,并获得反馈结果包括:根据特征空间构建正则规则,并根据正则规则确定命名实体的正则特征;基于正则规则,利用IDCNN算法模型对待训练的高中数学题目包含的实体进行识别,获得疑似命名实体;结合待训练的高中数学题目的句法分析和依存分析,对疑似命名实体进行评估,获得疑似命名实体的评估值;根据评估值判断是否可以将疑似命名实体归为命名实体;当判断出疑似命名实体可归为命名实体时,将疑似命名实体作为反馈结果。
在具体的实现过程中,正则化和深度学习算法模型训练的具体技术方案和步骤如下:
(1)确定命名实体正则特征:数学中的命名实体一般是一些元概念以及元概念的衍生体,因此具有一定的规律。章节范畴特征的定义为:可以判断该题目涉及到某章节的词的特征,比如“集合”、“元素”等;实体属性特征的定义为:可以根据分词的词性以及所在句子中的句法地位,判断该分词属于实体词(数学概念元素等,如集合、子集),还是关系词(实体关系,如包含、属于等);主从属性特征的定义为:可以在实体词中进一步区分属于主干地位还是从属地位,如“集合的个数”中主干地位的是“集合”,从属地位的是“个数”,实体的逻辑组合为“集合-->个数”。此外,在实体的文本识别的正则特征过程中,相关的实体往往以“集”结尾,“集合”、“子集”、“真子集”、“非空真子集”、“空集”、“非空子集”等。因此,在实际的应用中,首先收集数学科目中的基础元概念,并分类整理,获得较为完备的元概念分词集,在此基础上构建正则规则,作为数学语料库进行数学命名实体的筛选标准。
(2)利用IDCNN(Iterated Dilated Convolutional Neural Networks,膨胀卷积神经网络)算法模型训练标注好的命名实体语料。针对待训练的数学题目的问题进行初步的命名实体识别,获得疑似命名实体分词。
(3)针对(2)中初步筛选得到的疑似命名实体分词,结合题目文本的句法分析和依存分析,并根据词性对分词进行命名实体的评估,给出评估值,根据评估值对疑似命名实体进行处理,如果评估值显示该疑似命名实体可以归为命名实体,则该疑似命名实体可以被添加或者更新进命名实体空间中。
(4)将处理得到的命名实体分词及其评估值提供给学科专家库进行标注反馈。
将反馈数据再提供到步骤(2),可以进一步训练模型,从而循环(2)、(3)、(4)步骤,得到持续更新的反馈。
在一个可选的实施方式中,在通过正则化和深度学习算法模型进行训练时,通过训练可以学习到高中数学命名实体空间的命名实体的逻辑组合,提取逻辑组合的算法层级特征。具体来说,通过算法模型从题干文本中获取实体的逻辑组合如:“集合--->个数”、“不等式--->解集”、“一元二次方程--->解”、“一元二次函数--->定义域”等数学实体的逻辑组合。逻辑组合中可以识别出所属的章节范畴、主干实体、从属实体等数学实体信息和逻辑关系,即提取出了逻辑组合的算法层级特征。算法层级特征包含了题目中数学实体的详细实体属性和实体关系,是进行数学实体识别和确认的关键指标信息。
步骤S104,利用反馈结果对高中数学命名实体空间进行修正和更新。具体来说,通过专家的反馈意见对算法模型进行迭代优化。在模型自主训练和学习的基础上,利用正则规则对用于训练的高中数学题目进行训练和学习,当算法模型对待训练的高中数学题目的实体进行识别后获得疑似命名实体,通过专家系统对识别结果进行评判并将评判结果反馈给算法模型,算法模型通过专家反馈意见进行优优化迭代,即利用反馈结果对命名实体进行修正和更新,最终获得精准度达标的高中数学命名实体识别算法模型。在一个可选的实施方式中,利用反馈结果对高中数学命名实体空间进行修正和更新包括:获取反馈结果中的疑似命名实体;利用疑似命名实体修正或更新高中数学命名实体空间。
本实施例提供的高中数学题目中命名实体的构建方法,将数学的命名实体抽象成一些基础实体特征原则的多维度的组合,既能够准确表达数学实体的特征,又使实体具有了通过算法识别的逻辑基础,具有很强的解释性,并且可以在后期的实践过程中根据结果反馈对其进行持续优化。本实施例提供的命名实体,既能体现出所涉及的数学实体属性,又具备能够通过少量核心属性进行快速组合的特点,从而可以借助算法模型快速准确地识别题目中的有效命名实体,进而为题目的语义理解和知识点标注提供基础。
本实施例还提供一种高中数学题目中命名实体的识别方法,基于前述的构建方法构建出来的高中数学命名实体空间,可以对高中数学题目中出现的实体进行识别。如图2所示,本实施例提供的高中数学题目中命名实体的识别方法包括:
步骤S201,获取待识别的高中数学题目;具体来说,可以提供包含原始公式和题干的高中数学题目,也可以提供包含经过转换的公式文本和题干的高中数学题目,还可以在识别之前先进行指代消解等操作,具体视实际需要而定。
步骤S202,根据前述的高中数学命名实体空间,识别出待识别的高中数学题目中所有的命名实体;具体来说,基于前述的构建方法,已经为高中数学建立起了一个高中数学命名实体空间,该高中数学命名实体空间经过专家系统的反馈,已经训练成了一个精准度达标的命名实体空间,可以对绝大部分的高中数学的实体进行识别,且可以提高识别的效率。
步骤S203,根据识别出的命名实体,将待识别的高中数学题目进行分类。具体来说,当识别出命名实体后,根据命名实体中包含的基础特征,可以对该高中数学题目进行分类或后续的知识点标注等操作。
本实施例提供的高中数学题目中命名实体的识别方法,在前述的构建方法建立的高中数学命名实体空间的基础上对命名实体进行识别,可以实现对高中数学题目中实体的精准识别。 高中数学命名实体识别是知识点标注的前提,本实施例高效精准地识别命名实体为知识点标注提供了坚实的基础。此外,本实施例有效地结合了专家系统和算法模型的优势,在确保精准度的前提下,提高了高中数学命名实体识别的效率。
本实施例还提供高中数学题目中命名实体的识别系统,如图3所示,包括:
获取模块301,用于获取待识别的高中数学题目;具体来说,可以提供包含原始公式和题干的高中数学题目,也可以提供包含经过转换的公式文本和题干的高中数学题目,还可以在识别之前先进行指代消解等操作,具体视实际需要而定。
识别模块302,用于根据前述的高中数学命名实体空间,识别出待识别的高中数学题目中所有的命名实体;具体来说,基于前述的构建方法,已经为高中数学建立起了一个数学命名实体空间,该数学命名实体空间经过专家系统的反馈,已经训练成了一个精准度达标的命名实体空间,可以对绝大部分的高中数学的实体进行识别,且可以提高识别的效率。
分类模块303,用于根据识别出的命名实体,将待识别的高中数学题目进行分类。具体来说,当识别出命名实体后,根据命名实体中包含的基础特征,可以对该高中数学题目进行分类或后续的知识点标注等操作。
本实施例提供的高中数学题目中命名实体的识别系统,在前述的构建方法建立的高中数学命名实体空间的基础上对命名实体进行识别,可以实现对高中数学题目中实体的精准识别。 高中数学命名实体识别是知识点标注的前提,本实施例高效精准地识别命名实体为知识点标注提供了坚实的基础。此外,本实施例有效地结合了专家系统和算法模型的优势,在确保精准度的前提下,提高了高中数学命名实体识别的效率。
图4提供了一个本发明应用实例的具体流程图,用于展示一个高中数学题目的命名实体识别的具体应用。
此外,本发明还提供一个高中数学题目的命名实体的示例,具体如下所述。
数学题目的题干如下:已知函数f(x)=x^2-2*x+2。求f(x)在区间[(1/2),3]上的最大值和最小值。
针对语句“已知函数f(x)=x^2-2*x+2”识别出的命名实体如下:
所属章节范畴:函数;
实体属性:主体类(函数体);从体类(一元二次,f函数表达);
命名实体类型:函数体(单主体)、一元二次函数(组合主体)、f函数表达(表达形式主体);
针对语句“求f(x)在区间[(1/2),3]上的最大值和最小值”,可以先对f(x)进行指代消解,转化为f(x)=x^2-2*x+2,然后进行实体识别。识别出的命名实体如下:
所属章节范畴:函数;
实体属性:主体类(一元二次函数、f函数表达);从体类(最值(最大值、最小值));
命名实体类型:一元二次函数(组合主体),f函数表达(表达形式主体)、最值(从体);
命名实体有效组合(具有数学意义的实体模式):一元二次函数(组合主体),f函数表达(表达形式主体)、一元二次函数-->最值(主体+从体)。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。
Claims (3)
1.高中数学命名实体空间的构建方法,其特征在于,包括:
根据高中数学通用的基础特征建立特征空间,所述特征空间中包含章节范畴特征、实体属性特征和主从属性特征,其中,所述实体属性特征的值至少包括实体类、关系类和运算类,所述主从属性特征的值至少包括主体类、从体类和独立体类;
利用所述章节范畴特征、所述实体属性特征和所述主从属性特征进行逻辑组合成多个命名实体,所述多个命名实体构成高中数学命名实体空间,其中,所述命名实体用于对所述高中数学的实体进行分类和描述;
通过正则化和深度学习算法模型训练所述高中数学命名实体空间,并获得反馈结果;
利用所述反馈结果对所述高中数学命名实体空间进行修正和更新;
根据所述特征空间构建正则规则,并根据所述正则规则确定所述命名实体的正则特征;
基于所述正则规则,利用IDCNN算法模型对待训练的高中数学题目包含的实体进行识别,获得疑似命名实体;
结合所述待训练的高中数学题目的句法分析和依存分析,对所述疑似命名实体进行评估,获得所述疑似命名实体的评估值;
根据所述评估值判断是否可以将所述疑似命名实体归为所述命名实体;
当判断出所述疑似命名实体可归为所述命名实体时,将所述疑似命名实体作为所述反馈结果;
获取所述反馈结果中的所述疑似命名实体;
利用所述疑似命名实体修正或更新所述高中数学命名实体空间。
2.高中数学题目中命名实体的识别方法,其特征在于,包括:
获取待识别的高中数学题目;
根据权利要求1所述的高中数学命名实体空间,识别出所述待识别的高中数学题目中所有的命名实体;
根据识别出的所述命名实体,将所述待识别的高中数学题目进行分类。
3.高中数学题目中命名实体的识别系统,其特征在于,包括:
获取模块,用于获取待识别的高中数学题目;
识别模块,用于根据权利要求1所述的高中数学命名实体空间,识别出所述待识别的高中数学题目中所有的命名实体;
分类模块,用于根据识别出的所述命名实体,将所述待识别的高中数学题目进行分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311544077.0A CN117252202B (zh) | 2023-11-20 | 2023-11-20 | 高中数学题目中命名实体的构建方法、识别方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311544077.0A CN117252202B (zh) | 2023-11-20 | 2023-11-20 | 高中数学题目中命名实体的构建方法、识别方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117252202A CN117252202A (zh) | 2023-12-19 |
CN117252202B true CN117252202B (zh) | 2024-03-19 |
Family
ID=89126899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311544077.0A Active CN117252202B (zh) | 2023-11-20 | 2023-11-20 | 高中数学题目中命名实体的构建方法、识别方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117252202B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355628A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 图文知识点标注方法和装置、图文标注的修正方法和系统 |
CN108228568A (zh) * | 2018-01-24 | 2018-06-29 | 上海互教教育科技有限公司 | 一种数学题目语义理解方法 |
CN109214642A (zh) * | 2018-07-10 | 2019-01-15 | 华中科技大学 | 一种建筑施工工序约束的自动抽取和分类方法及系统 |
WO2019015269A1 (zh) * | 2017-07-18 | 2019-01-24 | 中译语通科技股份有限公司 | 基于最大熵和神经网络模型的韩语命名实体识别方法 |
CN109522553A (zh) * | 2018-11-09 | 2019-03-26 | 龙马智芯(珠海横琴)科技有限公司 | 命名实体的识别方法及装置 |
CN111967266A (zh) * | 2020-09-09 | 2020-11-20 | 中国人民解放军国防科技大学 | 中文命名实体识别模型及其构建方法和应用 |
WO2021043085A1 (zh) * | 2019-09-04 | 2021-03-11 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置、计算机设备及存储介质 |
WO2021068329A1 (zh) * | 2019-10-10 | 2021-04-15 | 平安科技(深圳)有限公司 | 中文命名实体识别方法、装置及计算机可读存储介质 |
CN115114926A (zh) * | 2022-07-26 | 2022-09-27 | 华南农业大学 | 一种中文农业命名实体识别方法 |
CN115186780A (zh) * | 2022-09-14 | 2022-10-14 | 江西风向标智能科技有限公司 | 学科知识点分类模型训练方法、系统、存储介质及设备 |
CN116050412A (zh) * | 2023-03-07 | 2023-05-02 | 江西风向标智能科技有限公司 | 基于数学语义逻辑关系的高中数学题目的分割方法和系统 |
CN116432755A (zh) * | 2023-04-21 | 2023-07-14 | 西安电子科技大学杭州研究院 | 一种基于动态实体原型的权重网络推理方法 |
CN116882403A (zh) * | 2023-05-30 | 2023-10-13 | 信雅达科技股份有限公司 | 一种地理命名实体多目标匹配方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10853576B2 (en) * | 2018-12-13 | 2020-12-01 | Hong Kong Applied Science and Technology Research Institute Company Limited | Efficient and accurate named entity recognition method and apparatus |
-
2023
- 2023-11-20 CN CN202311544077.0A patent/CN117252202B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355628A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 图文知识点标注方法和装置、图文标注的修正方法和系统 |
WO2019015269A1 (zh) * | 2017-07-18 | 2019-01-24 | 中译语通科技股份有限公司 | 基于最大熵和神经网络模型的韩语命名实体识别方法 |
CN108228568A (zh) * | 2018-01-24 | 2018-06-29 | 上海互教教育科技有限公司 | 一种数学题目语义理解方法 |
CN109214642A (zh) * | 2018-07-10 | 2019-01-15 | 华中科技大学 | 一种建筑施工工序约束的自动抽取和分类方法及系统 |
CN109522553A (zh) * | 2018-11-09 | 2019-03-26 | 龙马智芯(珠海横琴)科技有限公司 | 命名实体的识别方法及装置 |
WO2021043085A1 (zh) * | 2019-09-04 | 2021-03-11 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置、计算机设备及存储介质 |
WO2021068329A1 (zh) * | 2019-10-10 | 2021-04-15 | 平安科技(深圳)有限公司 | 中文命名实体识别方法、装置及计算机可读存储介质 |
CN111967266A (zh) * | 2020-09-09 | 2020-11-20 | 中国人民解放军国防科技大学 | 中文命名实体识别模型及其构建方法和应用 |
CN115114926A (zh) * | 2022-07-26 | 2022-09-27 | 华南农业大学 | 一种中文农业命名实体识别方法 |
CN115186780A (zh) * | 2022-09-14 | 2022-10-14 | 江西风向标智能科技有限公司 | 学科知识点分类模型训练方法、系统、存储介质及设备 |
CN116050412A (zh) * | 2023-03-07 | 2023-05-02 | 江西风向标智能科技有限公司 | 基于数学语义逻辑关系的高中数学题目的分割方法和系统 |
CN116432755A (zh) * | 2023-04-21 | 2023-07-14 | 西安电子科技大学杭州研究院 | 一种基于动态实体原型的权重网络推理方法 |
CN116882403A (zh) * | 2023-05-30 | 2023-10-13 | 信雅达科技股份有限公司 | 一种地理命名实体多目标匹配方法 |
Non-Patent Citations (6)
Title |
---|
"A survey on Named Entity Recognition — datasets, tools, and methodologies";Basra Jehangir,Saravanan Radhakrishnan,Rahul Agarwal;《Natural Language Processing Journal》;第3卷;全文 * |
"基于BERT-IDCNN-CRF的中文命名实体识别方法";李妮,关焕梅,杨飘,董文永;《山东大学学报(理学版)》;第55卷(第01期);全文 * |
"基于BERT的初等数学文本命名实体识别方法";张毅;王爽胜;何彬;叶培明;李克强;《计算机应用》;第42卷(第02期);全文 * |
"融合常识库和语法特征的数学应用题题意理解";刘清堂;马鑫倩;周洁;吴林静;周鹏霄;《计算机应用》;第43卷(第02期);全文 * |
"面向自然语言处理的深度学习研究";奚雪峰;周国栋;《自动化学报》;第42卷(第10期);全文 * |
稀疏地理实体关系的关键词提取方法;余丽;陆锋;刘希亮;程诗奋;张雪英;;《地球信息科学学报》(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117252202A (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3534272A1 (en) | Natural language question answering systems | |
US7827125B1 (en) | Learning based on feedback for contextual personalized information retrieval | |
US9442917B2 (en) | Detecting semantic errors in text using ontology-based extraction rules | |
Zubrinic et al. | The automatic creation of concept maps from documents written using morphologically rich languages | |
Nabi et al. | Performance Analysis of Classification Algorithms in Predicting Diabetes. | |
US20230123574A1 (en) | Methods and systems for intelligent editing of legal documents | |
CN113254507B (zh) | 一种数据资产目录智能构建盘点方法 | |
CN111274790A (zh) | 基于句法依存图的篇章级事件嵌入方法及装置 | |
Caplinskas | Testing Lightweight Ontology from a Glossary Based on the ONTO6 Methodology | |
Domingos et al. | Just add weights: Markov logic for the semantic web | |
Song et al. | Methodologies for semi-automated conceptual data modeling from requirements | |
Sanprasit et al. | Intelligent approach to automated star-schema construction using a knowledge base | |
CN117252202B (zh) | 高中数学题目中命名实体的构建方法、识别方法和系统 | |
CN116049376B (zh) | 一种信创知识检索回复的方法、装置和系统 | |
Zghal et al. | A model-driven approach of ontological components for on-line semantic web information retrieval. | |
Abed | Ontology-based approach for retrieving knowledge in Al-Quran | |
Opasjumruskit et al. | Contron: Continuously trained ontology based on technical data sheets and wikidata | |
Yin et al. | Extracting actors and use cases from requirements text with BiLSTM-CRF | |
Arbizu | Extracting knowledge from documents to construct concept maps | |
Gajderowicz | Using decision trees for inductively driven semantic integration and ontology matching | |
Koci | Layout inference and table detection in spreadsheet document | |
Tian | Construction of Computer English Corpus Assisted by Internet of Things Information Perception and Interaction Technology | |
Laskey et al. | Knowledge and data fusion in probabilistic networks | |
Hudeček | Low-resource methods for dialogue systems applications | |
Rogushina et al. | Ontology-Based Similarity Estimates for Fuzzy Data: Semantic Wiki Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |