CN109614623B - 一种基于句法分析的作文处理方法及系统 - Google Patents
一种基于句法分析的作文处理方法及系统 Download PDFInfo
- Publication number
- CN109614623B CN109614623B CN201811514502.0A CN201811514502A CN109614623B CN 109614623 B CN109614623 B CN 109614623B CN 201811514502 A CN201811514502 A CN 201811514502A CN 109614623 B CN109614623 B CN 109614623B
- Authority
- CN
- China
- Prior art keywords
- sentence
- composition
- text
- target
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 35
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 230000002159 abnormal effect Effects 0.000 claims abstract description 96
- 238000012937 correction Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 16
- 239000000470 constituent Substances 0.000 claims description 11
- 230000000295 complement effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 239000003550 marker Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000004622 sleep time Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
一种基于句法分析的作文处理方法及系统,该方法包括:对待批改的作文文本进行文本数据预处理,得到预处理后的目标文本数据;判断目标文本数据中的目标语句与相邻语句之间的逻辑关系是否存在错误,如果是,识别待批改的作文文本中与目标语句以及相邻语句对应的第一异常语句,并对第一异常语句进行第一标记;和/或,将目标文本数据中的目标语句的句法结构与标准正则数据库中的预设标准语句的标准句法结构进行对比,以判断目标语句的句法结构是否符合所述标准句法结构;如果不符合,识别待批改的作文文本中与目标语句对应的第二异常语句;对第二异常语句进行第二标记并校正,从而可以自动批改作文中的语法错误,提高作文批改的效率。
Description
技术领域
本发明涉及作文批改技术领域,具体涉及一种基于句法分析的作文处理方法及系统。
背景技术
作文是语言学习与考试的重点,因此老师需要花费较多时间进行作文批改。一般来说,评价一篇作文优劣的重点在于作文的框架结构和行文思路,老师也会重点针对这两部分进行点评与分析。然而,在实践中发现,由于粗心等原因,学生经常在作文中出现词语搭配不恰当等语法错误,老师也需要耗费大量的时间批改这些语法错误,导致老师的工作量加大,作文批改的效率不高。
发明内容
本发明实施例公开了一种基于句法分析的作文处理方法及系统,能够自动批改作文中的语法错误,提高作文批改的效率。
本发明实施例第一方面公开一种基于句法分析的作文处理方法,所述方法包括:
对待批改的作文文本进行文本数据预处理,得到预处理后的目标文本数据;
判断所述目标文本数据中的目标语句与相邻语句之间的逻辑关系是否存在错误,如果所述逻辑关系存在错误,识别所述待批改的作文文本中与所述目标语句以及所述相邻语句对应的第一异常语句,并对所述第一异常语句进行第一标记;
和/或,将所述目标文本数据中的目标语句的句法结构与标准正则数据库中的预设标准语句的标准句法结构进行对比,以判断所述目标语句的句法结构是否符合所述标准句法结构;如果所述目标语句的句法结构不符合所述标准句法结构,识别所述待批改的作文文本中与所述目标语句对应的第二异常语句;
对所述第二异常语句进行第二标记并校正。
作为一种可选的实施方式,在本发明实施例第一方面中,所述标准句法结构,包括:语句的组成成分完整、语句中词语的词性与词语所属的组成成分相匹配、语句的语序符合标准语序。
作为一种可选的实施方式,在本发明实施例第一方面中,对所述第二异常语句进行校正,包括:
如果所述第二异常语句的组成成分不完整,利用所述第二异常语句的相邻语句补全所述第二异常语句;
如果所述第二异常语句中任一目标词语的词性与所述目标词语所属的组成成分不匹配,识别所述目标词语所属的组成成分对应的标准词性;从所述目标词语的同义词库中查找出词性为所述标准词性的同义词;将所述第二异常语句中的所述目标词语替换成所述同义词;
如果所述第二异常语句的语序不符合标准语序,按照所述标准语序重新组合所述第二异常语句中的各个词语。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
确定被标记的所述第一异常语句和/或所述第二异常语句在所述待批改的作文文本中的占比,并根据所述占比确定所述待批改的作文文本的第一得分;
获取所述待批改的作文的批改者输入的所述待批改的作文文本的第二得分;
根据所述第一得分以及所述第一得分对应的计算权重、所述第二得分以及所述第二得分对应的计算权重,确定所述待批改的作文文本的批改得分。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
如果所述待批改的作文文本的批改得分低于预设的及格分值,获取所述待批改的作文文本的作者身份标识;
从数据库中搜索与所述待批改的作文文本相关联的范文文本,并将所述范文文本输出至与所述作者身份标识绑定的终端设备。
本发明实施例第二方面公开一种基于句法分析的作文批改处理系统,包括:
第一处理单元,用于对待批改的作文文本进行文本数据预处理,得到预处理后的目标文本数据;
判断单元,用于判断所述目标文本数据中的目标语句与相邻语句之间的逻辑关系是否存在错误,和/或,将所述目标文本数据中的目标语句的句法结构与标准正则数据库中的预设标准语句的标准句法结构进行对比,以判断所述目标语句的句法结构是否符合所述标准句法结构;
第二处理单元,用于在所述判断单元判断出所述逻辑关系存在错误时,识别所述待批改的作文文本中与所述目标语句以及所述相邻语句对应的第一异常语句,并对所述第一异常语句进行第一标记;以及,在所述判断单元判断出所述目标语句的句法结构不符合所述标准句法结构时,识别所述待批改的作文文本中与所述目标语句对应的第二异常语句,对所述第二异常语句进行第二标记并校正。
作为一种可选的实施方式,在本发明实施例第二方面中,所述标准句法结构,包括:语句的组成成分完整、语句中词语的词性与词语所属的组成成分相匹配、语句的语序符合标准语序。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第二处理单元用于对所述第二异常语句进行校正的方式具体为:
所述第二处理单元,用于在所述第二异常语句的组成成分不完整时,利用所述第二异常语句的相邻语句补全所述第二异常语句;
以及,在所述第二异常语句中任一目标词语的词性与所述目标词语所属的组成成分不匹配时,识别所述目标词语所属的组成成分对应的标准词性;从所述目标词语的同义词库中查找出词性为所述标准词性的同义词;将所述第二异常语句中的所述目标词语替换成所述同义词;
以及,在所述第二异常语句的语序不符合标准语序时,按照所述标准语序重新组合所述第二异常语句中的各个词语。
作为一种可选的实施方式,在本发明实施例第二方面中,还包括:
第一确定单元,用于确定被标记的所述第一异常语句和/或所述第二异常语句在所述待批改的作文文本中的占比,并根据所述占比确定所述待批改的作文文本的第一得分;
第一获取单元,用于获取所述待批改的作文的批改者输入的所述待批改的作文文本的第二得分;
第二确定单元,用于根据所述第一得分以及所述第一得分对应的计算权重、所述第二得分以及所述第二得分对应的计算权重,确定所述待批改的作文文本的批改得分。
作为一种可选的实施方式,在本发明实施例第二方面中,还包括:
第二获取单元,用于在所述待批改的作文文本的批改得分低于预设的及格分值时,获取所述待批改的作文文本的作者身份标识;
输出单元,用于从数据库中搜索与所述待批改的作文文本相关联的范文文本,并将所述范文文本输出至与所述作者身份标识绑定的终端设备。
本发明第三方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的任一项方法。
本发明实施例第四方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面公开的任一项方法。
与现有技术相比,本发明实施例具有以下有益效果:
对待批改的作文文本进行文本数据预处理,得到处理后的目标文本数据。针对目标文本数据中的目标语句,判断目标语句与相邻语句之间的逻辑关系(即某一单句与其他句子间的构成关系),从而可以对待批改的作文文本中存在逻辑关系错误的第一异常语句进行标记。以及,还可以判断目标语句的组成成分(即某一单句本身)是否符合预设的标准语句组成规则,从而可以对待批改的作文文中存在句法结构错误的第二异常语句进行标记,进一步地还可以对第二异常语句进行校正。也就是说,本发明实施例通过判断句子间的逻辑关系以及句子本身的组成结构来判断待批改的作文文本中是否存在语法错误,并且在发现语法错误时自动进行标记及校正,以对语法错误进行批改,从而可以减少老师等作文批改人员的工作量,提高作文批改的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于句法分析的作文处理方法的流程示意图;
图2是本发明实施例公开的另一种基于句法分析的作文处理方法的流程示意图;
图3是本发明实施例公开的一种基于句法分析的作文处理系统的结构示意图;
图4是本发明实施例公开的另一种基于句法分析的作文处理系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种基于句法分析的作文处理方法及系统,能够自动批改作文中的语法错误,提高作文批改的效率。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于句法分析的作文处理方法的流程示意图。其中,图1所描述的基于句法分析的作文处理方法适用于作文批改系统等线上批改系统的服务设备,也适用于家教机、智能手机、智能平板、个人电脑等电子设备。本发明实施例以电子设备为例描述基于句法分析的作文处理方法,不应构成对该方法的限定。如图1所示,该基于句法分析的作文处理方法可以包括以下步骤:
101、电子设备对待批改的作文文本进行文本数据预处理,得到预处理后的目标文本数据。
本发明实施例中,待批改的作文文本可以为用户通过电子设备输入的文本,例如学生通过家教机直接输入的电子文本;待批改的作文文本也可以为通过识别包含手写文本的图像得到的电子文本,例如学生利用家教机拍摄手写的作文文本,电子设备识别对拍摄到的图像进行字符识别,以获得电子文本;待批改的作文文本还可以为与电子设备存在通信连接的服务设备分发的电子文本,本发明实施例不做限定。
文本数据预处理的方式可以包括去除标点符号、去除语气词、去除特殊字符、去除空白字、语句划分、文本分词等操作,其中,文本分词包括识别语句中的各个词语以及每个词语的词性。目标文本数据即为预处理完成之后得到的文本数据集合。
作为一种可选的实施方式,对待批改的作文文本进行文本数据预处理还可以包括以下操作:识别待批改的作文文本的写作语言,如果写作语言为汉语,识别待批改的作文文本中是否存在汉语拼音;如果存在汉语拼音,查找发音与该汉语拼音的发音相同的同音词语;识别语句中与上述的汉语拼音相邻的相邻词语,根据预先建立的词语搭配关系,确定每个同音词语与相邻词语组成的词语组合的出现概率;从同音词语中选取出词语组合的出现概率最高的高频词语,将语句中的汉语拼音替换成上述的高频词语。实施上述的实施方式,可以将汉语拼音替换成最可能的汉字。当待批改的作文文本为低年级(如小学一二年级)的学生撰写的作文文本时,由于低年级的学生掌握的词汇量有限,可能在作文文本中大量使用汉语拼音替代汉字。在预处理时先将语句中的汉语拼音转换成汉字,可以提高后续判断语句间的逻辑关系以及判断语句句法结构的准确率。
此外,电子设备在执行步骤101之后,可以只执行下述的步骤102~步骤103,从而可以只对目标语句与相邻语句之间的逻辑关系进行批改;或者,也可以只执行下述的步骤104~步骤105,从而可以只对目标语句的句法结构进行批改;或者,也可以同时执行下述的步骤102~步骤103以及步骤104~步骤105,从而可以对目标语句与相邻语句之间的逻辑关系以及目标语句的句法结构进行批改。
102、电子设备判断目标文本数据中的目标语句与相邻语句之间的逻辑关系是否存在错误,如果是,执行步骤103,如果否,结束本流程。
本发明实施例中,目标语句可以是目标文本数据中的任意一个语句,相邻语句可以为在待批改的作文文本中位于目标语句之前和/或位于目标语句之后的语句。具体地,可以通过识别目标语句与相邻语句中的关联词的搭配来判断目标语句与相邻语句之间的逻辑关系是否存在错误。以汉语为例,如果识别出目标语句中的关联词为“不仅”,在目标语句之后的相邻语句中的关联词为“而且”,可以认为目标语句与该相邻语句的逻辑关系不存在错误(正确);如果识别出目标语句中的关联词为“不仅”,在目标语句之后的相邻语句中的关联词为“但是”,可以认为目标语句与该相邻语句之间的逻辑关系存在错误。
103、电子设备识别待批改的作文文本中与目标语句以及相邻语句对应的第一异常语句,对第一异常语句进行第一标记。
本发明实施例中,可以理解的是,对第一异常语句进行文本数据预处理,得到的语句为目标语句及目标的相邻语句。目标语句与相邻语句之间的逻辑关系错误可能包括以下三种情况:目标语句发生错误导致逻辑关系错误、相邻语句发生错误导致逻辑关系错误、目标语句与相邻语句均发生错误导致逻辑关系错误。因此,本发明实施例在判断出逻辑关系存在错误之后,将目标语句和相邻语句一并进行标记,以使待批改文本的作者(如学生)在接收到标记之后,可以马上联系目标语句及其相邻语句识别其中的逻辑关系错误。
此外,第一标记具体可以为高亮、添加下划线、文字加粗、添加圆圈状符号等,本发明实施例不做限定。
104、电子设备将目标文本数据中的目标语句的句法结构与标准正则数据库中的预设标准语句的标准句法结构进行对比,以判断目标语句的句法结构是否符合标准句法结构,如果是,结束本流程,如果否,执行步骤105。
本发明实施例中,通过目标语句中的各个词语进行词性标记,可以获得目标语句的句法结构,通过对比目标语句的句法结构以及标准句法结构(比如计算欧式距离),可以确定出目标语句是否符合标准句法结构。具体地,可以先从标准正则数据库中包含的所有标准语句中查找出与目标语句的句法结构最接近的标准语句,然后将目标语句与最接近的标准语句进行对比。如果目标语句与最接近的标准语句之间的距离超阈预设的阈值,可以认为目标语句不符合标准句法结构。
作为一种可选的实施方式,进一步地,标准句法结构具体可以包括语句的组成成分完整、语句中词语的词性与词语所属的组成成分相匹配、语句的语序符合标准语序。
其中,语句的组成成分完整指语句包含组成句子必须的所有成分。以汉语为例,语句的组成成分完整可以为语句至少包括主语和谓语。
语句中每个词语都具有其所属的组成成分,不同的组成成分对应不同的词性。例如,作为主语的词语词性只能为名词。
标准语序由语言中词语的惯常搭配限定,具体的,可以判断语句中各个词语的先后排列顺序在该语言中的出现概率是否超阈预设的概率阈值,当出现概率高于概率阈值时,可以认为语句符合标准语序。
105、电子设备识别待批改的作文文本中与目标语句对应的第二异常语句,对第二异常语句进行第二标记并校正。
本发明实施例中,可以理解的是,对第二异常语句进行文本数据预处理之后得到的语句为上述的目标语句。如果某一目标语句不但与相邻语句之间存在逻辑关系错误,而且该目标语句还存在句法结构错误,那么第一异常语句包括该目标语句在待批改的作文文本中对应的语句,同时第二异常语句为该目标语句在待批改的作文文本中对应的语句。第二标记可以与第一标记相同,也可以与第一标记不同,以通过不同的两种标记方式区分两种不同的语法错误。此外,电子设备还可以对第二异常语句进行校正,以使目标语句的句法结构符合标准句法结构。
可见,在图1所描述的方法中,电子设备可以通过识别目标语句与相邻语句之间的逻辑关系以及目标语句的句法结构,识别待批改的作文文本中的语法错误,并且在发现语法错误时自动进行标记及校正,以对语法错误进行批改,从而可以减少老师等作文批改人员的工作量,提高作文批改的效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种基于句法分析的作文处理方法的流程示意图。如图2所示,该基于句法分析的作文处理方法可以包括以下步骤:
其中,步骤201~步骤204与上述的步骤101~步骤104相同,以下内容不再赘述。
205、电子设备识别待批改的作文文本中与目标语句对应的第二异常语句,对第二异常语句进行第二标记并校正。
本发明实施例中,电子设备具体可以针对第二异常语句中组成成分不完整、词语词性与词语所属的组成成分不匹配、语序不符合标准语序等三种情况进行校正。具体的实施方式可以如下:
如果第二异常语句的组成成分不完整,利用第二异常语句的相邻语句补全第二异常语句;具体的,可以对目标语句及相邻语句进行语义分析,以确定出该语句段落的大意,从而根据语句段落的大意补全第二异常语句缺失的组成成分;
如果第二异常语句中任一目标词语的词性与目标词语所属的组成成分不匹配,识别目标词语所属的组成成分对应的标准词性;从目标词语的同义词库中查找出词性为标准词性的同义词;将第二异常语句中的目标词语替换成同义词;例如,将作为语句主语的动词替换成与该动词的词义相同或者相近但词性为名词的词语;
如果第二异常语句的语序不符合标准语序,按照标准语序重新组合第二异常语句中的各个词语。
206、电子设备确定被标记的第一异常语句和/或第二异常语句在待批改的作文文本中的占比,并根据该占比确定待批改的作文文本的第一得分。
本发明实施例中,可以理解的是,如果只执行步骤202~步骤203,只对语句间的逻辑关系进行批改时,电子设备在执行步骤206时只确定被标记的第一异常语句在待批改的作文文本中的占比;如果只执步骤204~步骤205,只对目标语句的句法结构进行批改时,电子设备在执行步骤206时只确定被标记的第二异常语句在待批改的作文文本中的占比;如果同时执行步骤202~步骤203以及步骤204~步骤205,电子设备在执行步骤206时确定第一异常语句和第二异常语句在待批改的作文文本中的占比。
作为一种可选的实施方式,第一异常语句和/或第二异常语句在待批改的作文文本中的占比越高,待批改的作文文本的第一得分越低。
207、电子设备获取待批改的作文的批改者输入的待批改的作文文本的第二得分。
本发明实施例中,第二得分可以由批改者在评估待批改的作文的立意、框架结构、行文思路等因素之后确定。
208、电子设备根据第一得分以及第一得分对应的计算权重、第二得分以及第二得分对应的计算权重,确定待批改的作文文本的批改得分。
本发明实施例中,可以调整第一得分和第二得分对应的计算权重。针对低年级(如小学一二年级)的待批改的作文文本,可以更加关注作文文本中的语法,因此可以调整第一得分对应的计算权重高于第二得分对应的计算权重;针对高年级(如初一二年级)的待批改的作文文本,可以更加关注作文文本所表达的思想,因此可以调整第一得分对应的计算权重低于第二得分对应的计算权重。融合第一得分和第二得分最终确定出待批改的作文文本的批改得分,可以综合评估待批改作文的优劣。
可选的,可以直接将第一得分作为待批改的作文文本的批改得分。例如,当电子设备为家教机时,通过执行上述的步骤201~步骤206,并且将第一得分作为待批改的作文文本的批改得分,使得家教机自动对待批改的作文文本进行评分,因此孩子在使用家教机辅助学习作文撰写时,可以及时得到学习反馈,无需等待老师或者家长对作文文本进行批改。
209、电子设备判断待批改的作文文本的批改得分是否低于预设的及格分值,如果是,执行步骤210,如果否,结束本流程。
210、电子设备获取待批改的作文文本的作者身份标识。
本发明实施例中,每篇待批改的作文文本可以对应一个作者身份标识,每个作者身份标识可以绑定一个终端设备。
211、电子设备从数据库中搜索与待批改的作文文本相关联的范文文本,并将范文文本输出至与作者身份标识绑定的终端设备。
本发明实施例中,当待批改的作文文本的批改得分低于及格分值,其作者可能需要进一步提高作文撰写技巧,因此,可以将相关联的范文文本推送至作者的终端设备,以使作者通过范文文本学习作文撰写技巧。此外,与待批改的作文文本相关联的范文文本,可以为与待批改的作文文本标题相同的范文文本。如果待批改的作文文本为命题作文,相关联的范文文本可以为同一命题的范文文本,本发明实施例不做限定。
此外,作为另一种可选的实施方式,上述的数据库中可以存储有大量的儿童读物文本,并且每篇儿童读物文本都标记有对应的主题标签,主题标签用于指示该儿童读物文本的中心思想。如果待批改的作文文本为命题作文,电子设备可以识别该命题的中心思想,以得到该命题的主题标签;相应地,电子设备可以从数据库中查找出主题标签与上述命题的主题标签相同的目标儿童读物文本作为与待批改的作文文本相关联的范文文本。
进一步地,如果与作者身份标识绑定的终端设备为可穿戴设备,将范文文本输出至与作者身份标识绑定的终端设备的方式具体可以为:
在检测到当前时间为预设的睡眠时间,且检测到可穿戴设备处于静止状态的持续时长超过指定时长时,将目标儿童读物文本作为范文文本推送至可穿戴设备,以使可穿戴设备通过语音播放范文文本。实施该实施方式,选取儿童读物作为范文文本,并且以睡前读物的形式输出范文文本,可以降低孩子学习范文文本时的抗拒心理,从而提高学习作文撰写技巧的学习效率。
可见,在图2所描述的方法中,电子设备可以对语句间的逻辑关系以及语句的句法结构进行批改,还可以进一步针对句法结构存在问题的语句进行校正。进一步地,还可以自动计算待批改作文的语法得分(即第一得分),以及获取待批改作文的内容得分(即第二得分),通过融合第一得分和第二得分,可以综合评估待批改作文的优劣。更进一步地,在图2所描述的方法中,还可以在当待批改的作文文本的批改得分低于及格分值,向待批改的作文文本的作者推送相关联的范文文本,以使作者利用范文文本学习作文撰写技巧。
实施例三
请参阅图3,图3是本发明实施例公开的一种基于句法分析的作文处理系统的结构示意图。如图3所示,该基于句法分析的作文处理系统可以包括:
第一处理单元301,用于对待批改的作文文本进行文本数据预处理,得到预处理后的目标文本数据;
本发明实施例中,文本数据预处理可以包括去除标点符号、去除语气词、去除特殊字符、去除空白字、语句划分、文本分词等操作。
作为一种可选的实施方式,对待批改的作文文本进行文本数据预处理还可以包括以下操作:
识别待批改的作文文本的写作语言,如果写作语言为汉语,识别待批改的作文文本中是否存在汉语拼音;如果存在汉语拼音,查找发音与该汉语拼音的发音相同的同音词语;识别语句中与上述的汉语拼音相邻的相邻词语,根据预先建立的词语搭配关系,确定每个同音词语与相邻词语组成的词语组合的出现概率;从同音词语中选取出词语组合的出现概率最高的高频词语,将语句中的汉语拼音替换成上述的高频词语。实施上述的实施方式,可以将汉语拼音替换成最可能的汉字,可以提高后续判断语句间的逻辑关系以及判断语句句法结构的准确率。
判断单元302,用于判断第一处理单元301得到的目标文本数据中的目标语句与相邻语句之间的逻辑关系是否存在错误,和/或,将第一处理单元301得到的目标文本数据中的目标语句的句法结构与标准正则数据库中的预设标准语句的标准句法结构进行对比,以判断目标语句的句法结构是否符合标准句法结构;
第二处理单元303,用于在判断单元302判断出逻辑关系存在错误时,识别待批改的作文文本中与目标语句以及相邻语句对应的第一异常语句,并对第一异常语句进行第一标记;以及,在判断单元302判断出目标语句的句法结构不符合标准句法结构时,识别待批改的作文文本中与目标语句对应的第二异常语句,对第二异常语句进行第二标记并校正。
本发明实施例中,标准句法结构具体可以包括语句的组成成分完整、语句中词语的词性与词语所属的组成成分相匹配、语句的语序符合标准语序。第二处理单元303可以对第二异常语句进行校正,以使目标语句的句法结构符合标准句法结构。
可见,实施如图3所示的基于句法分析的作文处理系统,可以通过识别目标语句与相邻语句之间的逻辑关系以及目标语句的句法结构,识别待批改的作文文本中的语法错误,并且在发现语法错误时自动进行标记及校正,以对语法错误进行批改,从而可以减少老师等作文批改人员的工作量,提高作文批改的效率。
实施例四
请参阅图4,图4是本发明实施例公开的一种基于句法分析的作文处理系统的结构示意图。其中,图4所示的基于句法分析的作文处理系统是由图3所示的基于句法分析的作文处理系统进行优化得到的。其中,在图4所示的基于句法分析的作文处理系统中,上述的第二处理单元303用于对第二异常语句进行校正的方式具体可以为:
第二处理单元303,用于第二异常语句的组成成分不完整,利用第二异常语句的相邻语句补全第二异常语句;以及,在第二异常语句中任一目标词语的词性与目标词语所属的组成成分不匹配,识别目标词语所属的组成成分对应的标准词性;从目标词语的同义词库中查找出词性为标准词性的同义词;将第二异常语句中的目标词语替换成同义词;以及,在第二异常语句的语序不符合标准语序,按照标准语序重新组合第二异常语句中的各个词语。
可选的,图4所示的基于句法分析的作文处理系统还可以包括:
第一确定单元304,用于确定被第二处理单元303标记的第一异常语句和/或第二异常语句在待批改的作文文本中的占比,并根据占比确定待批改的作文文本的第一得分;
第一获取单元305,用于获取待批改的作文的批改者输入的待批改的作文文本的第二得分;
第二确定单元306,用于根据第一确定单元304确定的第一得分以及第一得分对应的计算权重、第一获取单元305获取到的第二得分以及第二得分对应的计算权重,确定待批改的作文文本的批改得分。
本发明实施例中,通过融合第一得分和第二得分最终确定出待批改的作文文本的批改得分,可以综合评估待批改作文的优劣。
作为另一种可选的实施方式,第二确定单元306也可以将第一确定单元304确定出的第一得分直接确定为待批改的作文文本的批改得分,从而使得应用该基于句法分析的作文批改系统的电子设备(如家教机)可以自动对待批改的作文文本进行评分,使得孩子在使用该电子设备辅助学习作文撰写时,可以及时得到学习反馈,无需等待老师或者家长对作文文本进行批改。
进一步可选的,图4所示的基于句法分析的作文处理系统还可以包括:
第二获取单元307,用于在第二确定单元306确定出待批改的作文文本的批改得分低于预设的及格分值时,获取待批改的作文文本的作者身份标识;
输出单元308,用于从数据库中搜索与待批改的作文文本相关联的范文文本,并将范文文本输出至与第二获取单元307获取到的作者身份标识绑定的终端设备。
本发明实施例中,当待批改的作文文本的批改得分低于及格分值,可以将相关联的范文文本推送至待批改的作文文本的作者使用的终端设备,使得待批改的作文文本的作者可以通过范文文本学习作文撰写技巧。
此外,作为一种可选的实施方式,如果待批改的作文文本为命题作文,输出单元308可以从数据库中查找出主题标签与上述命题的主题标签相同的目标儿童读物文本作为与待批改的作文文本相关联的范文文本。进一步地,如果与作者身份标识绑定的终端设备为可穿戴设备,
输出单元308可以在检测到当前时间为预设的睡眠时间,且检测到可穿戴设备处于静止状态的持续时长超过指定时长时,将目标儿童读物文本作为范文文本推送至可穿戴设备,以使可穿戴设备通过语音播放范文文本,从而能够以睡前读物的形式输出范文文本,可以降低孩子学习范文文本时的抗拒心理,从而提高学习作文撰写技巧的学习效率。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1或图2所示的任一种基于句法分析的作文处理方法。
本发明实施例公开一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行图1或图2所示的任一种基于句法分析的作文处理方法。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种基于句法分析的作文处理方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于句法分析的作文处理方法,其特征在于,包括:
对待批改的作文文本进行文本数据预处理,得到预处理后的目标文本数据;
判断所述目标文本数据中的目标语句与相邻语句之间的逻辑关系是否存在错误,如果所述逻辑关系存在错误,识别所述待批改的作文文本中与所述目标语句以及所述相邻语句对应的第一异常语句,并对所述第一异常语句进行第一标记;
和/或,将所述目标文本数据中的目标语句的句法结构与标准正则数据库中的预设标准语句的标准句法结构进行对比,以判断所述目标语句的句法结构是否符合所述标准句法结构;如果所述目标语句的句法结构不符合所述标准句法结构,识别所述待批改的作文文本中与所述目标语句对应的第二异常语句;
对所述第二异常语句进行第二标记并校正;
确定被标记的所述第一异常语句和/或所述第二异常语句在所述待批改的作文文本中的占比,并根据所述占比确定所述待批改的作文文本的第一得分。
2.根据权利要求1所述的方法,其特征在于,所述标准句法结构,包括:
语句的组成成分完整,所述语句的组成成分完整指语句包含组成句子必须的所有成分;
语句中词语的词性与词语所属的组成成分相匹配,所述语句中词语的词性与词语所属的组成成分相匹配指语句中每个词语都具有其所属的组成成分,不同的组成成分对应不同的词性;
语句的语序符合标准语序,所述语句的语序符合标准语序指标准语序由语言中词语的惯常搭配限定。
3.根据权利要求2所述的方法,其特征在于,对所述第二异常语句进行校正,包括:
如果所述第二异常语句的组成成分不完整,利用所述第二异常语句的相邻语句补全所述第二异常语句;
如果所述第二异常语句中任一目标词语的词性与所述目标词语所属的组成成分不匹配,识别所述目标词语所属的组成成分对应的标准词性;从所述目标词语的同义词库中查找出词性为所述标准词性的同义词;将所述第二异常语句中的所述目标词语替换成所述同义词;
如果所述第二异常语句的语序不符合标准语序,按照所述标准语序重新组合所述第二异常语句中的各个词语。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述方法还包括:
获取所述待批改的作文的批改者输入的所述待批改的作文文本的第二得分;
根据所述第一得分以及所述第一得分对应的计算权重、所述第二得分以及所述第二得分对应的计算权重,确定所述待批改的作文文本的批改得分。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
如果所述待批改的作文文本的批改得分低于预设的及格分值,获取所述待批改的作文文本的作者身份标识;
从数据库中搜索与所述待批改的作文文本相关联的范文文本,并将所述范文文本输出至与所述作者身份标识绑定的终端设备。
6.一种基于句法分析的作文处理系统,其特征在于,包括:
第一处理单元,用于对待批改的作文文本进行文本数据预处理,得到预处理后的目标文本数据;
判断单元,用于判断所述目标文本数据中的目标语句与相邻语句之间的逻辑关系是否存在错误,和/或,将所述目标文本数据中的目标语句的句法结构与标准正则数据库中的预设标准语句的标准句法结构进行对比,以判断所述目标语句的句法结构是否符合所述标准句法结构;
第二处理单元,用于在所述判断单元判断出所述逻辑关系存在错误时,识别所述待批改的作文文本中与所述目标语句以及所述相邻语句对应的第一异常语句,并对所述第一异常语句进行第一标记;以及,在所述判断单元判断出所述目标语句的句法结构不符合所述标准句法结构时,识别所述待批改的作文文本中与所述目标语句对应的第二异常语句,对所述第二异常语句进行第二标记并校正;
第一确定单元,用于确定被标记的所述第一异常语句和/或所述第二异常语句在所述待批改的作文文本中的占比,并根据所述占比确定所述待批改的作文文本的第一得分。
7.根据权利要求6所述的系统,其特征在于,所述标准句法结构,包括:
语句的组成成分完整,所述语句的组成成分完整指语句包含组成句子必须的所有成分;
语句中词语的词性与词语所属的组成成分相匹配,所述语句中词语的词性与词语所属的组成成分相匹配指语句中每个词语都具有其所属的组成成分,不同的组成成分对应不同的词性;
语句的语序符合标准语序,所述语句的语序符合标准语序指标准语序由语言中词语的惯常搭配限定。
8.根据权利要求7所述的系统,其特征在于,所述第二处理单元用于对所述第二异常语句进行校正的方式具体为:
所述第二处理单元,用于在所述第二异常语句的组成成分不完整时,利用所述第二异常语句的相邻语句补全所述第二异常语句;
以及,在所述第二异常语句中任一目标词语的词性与所述目标词语所属的组成成分不匹配时,识别所述目标词语所属的组成成分对应的标准词性;从所述目标词语的同义词库中查找出词性为所述标准词性的同义词;将所述第二异常语句中的所述目标词语替换成所述同义词;
以及,在所述第二异常语句的语序不符合标准语序时,按照所述标准语序重新组合所述第二异常语句中的各个词语。
9.根据权利要求6~8任一项所述的系统,其特征在于,还包括:
第一获取单元,用于获取所述待批改的作文的批改者输入的所述待批改的作文文本的第二得分;
第二确定单元,用于根据所述第一得分以及所述第一得分对应的计算权重、所述第二得分以及所述第二得分对应的计算权重,确定所述待批改的作文文本的批改得分。
10.根据权利要求9所述的系统,其特征在于,还包括:
第二获取单元,用于在所述待批改的作文文本的批改得分低于预设的及格分值时,获取所述待批改的作文文本的作者身份标识;
输出单元,用于从数据库中搜索与所述待批改的作文文本相关联的范文文本,并将所述范文文本输出至与所述作者身份标识绑定的终端设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811514502.0A CN109614623B (zh) | 2018-12-12 | 2018-12-12 | 一种基于句法分析的作文处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811514502.0A CN109614623B (zh) | 2018-12-12 | 2018-12-12 | 一种基于句法分析的作文处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109614623A CN109614623A (zh) | 2019-04-12 |
CN109614623B true CN109614623B (zh) | 2023-06-30 |
Family
ID=66008939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811514502.0A Active CN109614623B (zh) | 2018-12-12 | 2018-12-12 | 一种基于句法分析的作文处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109614623B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111859941B (zh) * | 2019-04-30 | 2023-05-05 | 广东小天才科技有限公司 | 一种调整英文语句顺序的方法及系统 |
CN110390032B (zh) * | 2019-07-26 | 2021-08-17 | 江苏曲速教育科技有限公司 | 一种手写作文的批阅方法及系统 |
CN110837547A (zh) * | 2019-10-16 | 2020-02-25 | 云知声智能科技股份有限公司 | 一种人机交互中多意图文本理解的方法及装置 |
CN110851599B (zh) * | 2019-11-01 | 2023-04-28 | 中山大学 | 一种中文作文自动评分方法及教辅系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107122346A (zh) * | 2016-12-28 | 2017-09-01 | 平安科技(深圳)有限公司 | 一种输入语句的纠错方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007316834A (ja) * | 2006-05-24 | 2007-12-06 | Mitsubishi Electric Engineering Co Ltd | 日本語文章修正装置、日本語文章修正方法および日本語文章修正のためのプログラム |
US9442917B2 (en) * | 2013-07-11 | 2016-09-13 | University Of Oregon | Detecting semantic errors in text using ontology-based extraction rules |
CN108280065B (zh) * | 2017-01-05 | 2021-12-14 | 广州讯飞易听说网络科技有限公司 | 一种外文文本评价方法及装置 |
CN108519974A (zh) * | 2018-03-31 | 2018-09-11 | 华南理工大学 | 英语作文语法错误自动检测与分析方法 |
-
2018
- 2018-12-12 CN CN201811514502.0A patent/CN109614623B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107122346A (zh) * | 2016-12-28 | 2017-09-01 | 平安科技(深圳)有限公司 | 一种输入语句的纠错方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109614623A (zh) | 2019-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614623B (zh) | 一种基于句法分析的作文处理方法及系统 | |
CN106448675B (zh) | 识别文本修正方法及系统 | |
CN107622054B (zh) | 文本数据的纠错方法及装置 | |
US20090192787A1 (en) | Grammer checker | |
US20150269932A1 (en) | System and Method for Automated Detection of Plagiarized Spoken Responses | |
CN110119510B (zh) | 一种基于传递依存关系和结构助词的关系抽取方法及装置 | |
CN111192570B (zh) | 语言模型训练方法、系统、移动终端及存储介质 | |
CN112417850B (zh) | 音频标注的检错方法和装置 | |
CN111737968A (zh) | 一种作文自动批改及评分的方法及终端 | |
CN110147546B (zh) | 一种英语口语的语法校正方法及装置 | |
KR100911834B1 (ko) | 번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정 방법 및 장치 | |
CN111881297A (zh) | 语音识别文本的校正方法及装置 | |
CN110826301B (zh) | 标点符号添加方法、系统、移动终端及存储介质 | |
CN117828057A (zh) | 知识问答方法、装置、设备和存储介质 | |
TW201911289A (zh) | 用於分割句子的系統和方法 | |
CN109002454B (zh) | 一种确定目标单词的拼读分区的方法和电子设备 | |
Chiu et al. | Chinese spell checking based on noisy channel model | |
CN112905025B (zh) | 信息处理方法、电子设备及可读存储介质 | |
CN109582971B (zh) | 一种基于句法分析的批改方法及批改系统 | |
Hladek et al. | Unsupervised spelling correction for Slovak | |
CN111310457B (zh) | 词语搭配不当识别方法、装置、电子设备和存储介质 | |
Radzikowski et al. | Non-native English speakers' speech correction, based on domain focused document | |
CN109086272B (zh) | 句型识别方法及其系统 | |
CN112560431A (zh) | 用于生成试题辅导信息的方法、装置、设备、存储介质以及计算机程序产品 | |
Heilman et al. | Precision isn’t everything: A hybrid approach to grammatical error detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |