CN112528651A - 一种智能批改方法、系统、电子设备及存储介质 - Google Patents

一种智能批改方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN112528651A
CN112528651A CN202110178980.4A CN202110178980A CN112528651A CN 112528651 A CN112528651 A CN 112528651A CN 202110178980 A CN202110178980 A CN 202110178980A CN 112528651 A CN112528651 A CN 112528651A
Authority
CN
China
Prior art keywords
preset
phrases
grammar
clauses
modification suggestion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110178980.4A
Other languages
English (en)
Inventor
王志彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Acadsoc Information Co ltd
Original Assignee
Shenzhen Acadsoc Information Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Acadsoc Information Co ltd filed Critical Shenzhen Acadsoc Information Co ltd
Priority to CN202110178980.4A priority Critical patent/CN112528651A/zh
Publication of CN112528651A publication Critical patent/CN112528651A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种智能批改方法,包括:获取作文中的语句;从语句中提取分句和/或单词和/或短语;根据预设的词库,对单词进行拼写检查,获得第一修改建议和拼写正确的单词;根据预设的词库,对分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;根据预设的语法库,对文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;根据预设的句库和范文库,将第一修改建议和第二修改建议,进行二次校验,获得通过校验的正确语句。帮助英语学习者自主地检查自己的写作,在没有指导人员帮助的情况,指出语法错误,帮助学习者提高自己的英语水平,自动化及智能化的提高英文水平。

Description

一种智能批改方法、系统、电子设备及存储介质
技术领域
本发明涉及网上教学技术领域,特别是涉及一种智能批改方法、系统、电子设备及存储介质。
背景技术
网络教学是在一定教学理论和思想指导下,应用多媒体和网络技术,通过师、生、媒体等多边、多向互动和对多种媒体教学信息的收集、传输、处理、共享,来实现教学目标的一种教学模式。
目前针对英语作文的批改,一般采用计算机自动在线批改英语作文。就像医生使用CT机一样,老师可以用批改网自动扫描学生作文的各种参数,进而做出更精准更客观的判断和点评。
但是现有的方案只能针对作文进行单一的句子及单词拆解分析,只能针对语法进行单一错误的判断,无法联系上下文给到更多的更准确及更符合语境的处理,现在主流的作文语法错误自动检测与分析方法的准确性不高,有较大的提升空间。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种智能批改方法和相应的一种智能批改系统。
为了解决上述问题,本发明实施例公开了一种智能批改方法,包括:
获取作文中的语句;
从所述语句中提取分句和/或单词和/或短语;
根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;
根据所述预设的词库,通过预设的词性标注算法对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;
根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;
根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句。
优选的,所述获取作文中的语句,包括:
检测作文中的标点符号,并根据所述标点符号将所述作文拆解为语句。
优选的,所述根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词,包括:
当检查到的单词为正确时,获得无修改的第一修改建议,保持原正确的单词,或,当检查到的单词不正确时,根据所述预设的词库,获得正确单词的第一修改建议,标记并替换为正确的单词。
优选的,所述预设的词库,包括采用预设的最大熵的词性标注算法,预先建立一个存储了标注英语单词的词库。
优选的,所述根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语,包括:
采用概率上下文无关文算法(PCFG)生成分析模型;
对所述文本中的分句和/或短语进行统计分类,获得统计结果;
通过所述分析模型,统计并分析常见的语法错误、逻辑错误,获得分析结果;
根据所述统计结果和分析结果,获得第二修改建议和正确语法的分句和/或短语。
优选的,所述根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句,包括:
使用预设的校验匹配算法,进行二次校校验,当校验匹配通过,则获得通过校验的正确语句;当校验匹配未通过,则进行修复后,重新二次校验,多次循环达到校验匹配通过,并通过回退算法获得通过校验的正确语句。
优选的,所述根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句之后,还包括:
输出原作文单词错误、语法错误的标注,及通过句库和范文库校验通过的实例。
本发明实施例还公开了一种智能批改系统,包括:
语句拆分程序模块,用于获取作文中的语句;
拆解程序模块,用于从所述语句中提取分句和/或单词和/或短语;
拼写检查程序模块,用于根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;
词性标记程序模块,用于根据所述预设的词库,通过预设的词性标注算法对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;
语法修正程序模块,用于根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;
校验比对程序模块,用于提交所述第一修改建议和第二修改建议,到预设的句库和范文库,进行二次校验,并通过回退算法获得通过校验的正确语句。
本发明实施例还公开了一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现所述的智能批改方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现所述的智能批改方法的步骤。
本发明实施例包括以下优点:在于帮助英语学习者自主地检查自己的写作,在没有指导人员帮助的情况,可以指出语法错误,帮助学习者提高自己的英语水平,可以自动化及智能化的提高英文水平,减少等待反馈时间以及批量修改的问题。
附图说明
图1是本发明的一种智能批改方法实施例的步骤流程图;
图2是本发明的一种智能批改系统实施例的框图;
图3是本发明的一种计算机设备实施例的框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本申请涉及的英文缩写说明如下:
ISA(Industry Standard Architecture,工业标准体系结构);
MAC(Media Access Control,介质访问控制);
VESA(Video Electronics Standards Association,视频电子标准协会);
PCI(Peripheral Component Interconnect,外设部件互连标准);
RAM(Random Access Memory,随机存取存储器);
CD-ROM(Compact Disc Read-Only Memory,只读光盘);
DVD-ROM(Digital Video Disc-Read Only Memory,数字视盘);
I/O(Input/Output,输入/输出);
LAN(Local Area Network,局域网);
WAN(Wide Area Network,广域网);
RAID(Redundant Arrays of Independent Disks,磁盘阵列);
ROM(Read-Only Memory,只读存储器);
EPROM(Erasable Programmable Read-Only Memory,可擦除可编程只读存储器)。
本发明实施例的核心构思之一在于,首先对输入的待检测的英文作文进行断句,然后对断句后每个句子中单词进行分词处理,再对单词进行拼写检查,拼写检查无误后对所有单词进行词性标注,接着对这些标注后存在多标签的单词进行标注效果的修正, 然后是构建不同错误实例规则流程图,接着结合已有的语法规则以及错误实例综合地对语句进行语法检查,最后定位到作文中语法错误出现的位置,结合智能范文及语句题库进行数据对比并给出具体的修改意见及参考例句。
参照图1,示出了本发明的一种智能批改方法实施例的步骤流程图,具体可以包括如下步骤:
S100、开始;
S200、获取作文中的语句;
S300、从所述语句中提取分句和/或单词和/或短语;
S400、根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;
S500、根据所述预设的词库,通过预设的词性标注算法对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;
S600、根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;
S700、根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句;
S800、结束。
本实施例中,包括:
S200、获取作文中的语句;在步骤S200中包括,自动检测作文中的标点符号,并根据所述标点符号将所述作文拆解为语句,其中,首先根据检测到英文作文中的标点符号将整篇作文拆分成语句。
S300、从所述语句中提取分句和/或单词和/或短语。
S400、根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;在步骤S400中包括,当检查到的单词为正确时,获得无修改的第一修改建议,保持原正确的单词,或,当检查到的单词不正确时,根据所述预设的词库,获得正确单词的第一修改建议,标记并替换为正确的单词;所述预设的词库,包括预先建立一个存储了标注英语单词的词库。
S500、根据所述预设的词库,通过预设的词性标注算法对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本,将句子中的每个词都指派一个或多个的词性,采用最大熵的词性标注算法,并根据具体的语境确定每个词是名词、形容词、动词、冠词、连词、代词、副词、数词、介词、感叹词中的类型。
S600、根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;在步骤S600中包括,采用概率上下文无关文算法(PCFG)生成分析模型,对所述文本中的分句和/或短语进行统计分类,获得统计结果;统计并分析常见的语法错误、逻辑错误,获得分析结果;根据所述统计结果和分析结果,并通过回退算法获得第二修改建议和正确语法的分句和/或短语。
S700、根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句,其中,在一句话中,给定某个单词后,可以通过移动窗口的方式获得与单词前后相关的短语的方式获取单词前后相关的短语,最后利用回退算法,为了判断指定的单词是否应该被替换,通过判断该替换单词和它的变体在字典语料库中的频率的比值来确认进行语法检查并纠正;在步骤S700中包括,使用预设的校验匹配算法,进行二次校校验,当校验匹配通过,则获得通过校验的正确语句;当校验匹配未通过,则进行修复后,重新二次校验,多次循环达到校验匹配通过,获得通过校验的正确语句。
另一实施例中,在上述步骤S700之后,还包括,输出原作文单词错误、语法错误的标注,及通过句库和范文库校验通过的实例。
本发明的有益效果为:在于帮助英语学习者自主地检查自己的写作,在没有指导人员帮助的情况,可以指出语法错误,帮助学习者提高自己的英语水平,可以自动化及智能化的提高英文水平,减少等待反馈时间以及批量修改的问题。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
本发明的实施例中,参照图2,示出了本发明的一种智能批改系统的结构框图,具体可以包括如下模块:
语句拆分程序模块100,用于获取作文中的语句;拆解程序模块200,用于从所述语句中提取分句和/或单词和/或短语;拼写检查程序模块300,用于根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;词性标记程序模块400,用于根据所述预设的词库,通过预设的词性标注算法对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;语法修正程序模块500,用于根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;校验比对程序模块600,用于提交所述第一修改建议和第二修改建议,到预设的句库和范文库,进行二次校验,并通过回退算法获得通过校验的正确语句;
本实施例中还包括输出程序模块700,用于根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句。
其中,对于文本预处理包括拼写错误检查、词性标注、句法分析、依存分析;对于错误检查包括,会检索文本中所有单词是否存在于字典语料库中,未记录的将进行标记,并匹配字符相近的单词。词性标注包括,将句子中的每个词都指派一个词性,采用最大熵的词性标注计算法,确定每个词是名词、形容词、动词、冠词、连词、代词、副词、数词、介词、感叹词中的类型。
语法修正程序模块500进行修正之前,对语法和句法进行分析,具体的,采用概率上下文无关文算法(PCFG)的生成式句法分析模型,将句中短语抽离,进行单独分析,降低无关词汇干扰,提供模块性能。
还包括,采用神经网络(Neural-network)的句法分析器,用于精确的构建给定句子中词汇的依存关系,通过精准的依存分析结果,可以获得单词之间诸如主谓关系等一系列类型的搭配,从而有效跳过单词间的距离,进行错误的检查和纠正。分析英文句中的错误分为冠词及定冠词错误、名词复数错误、介词错误、主谓不一致和动词错误这五种错误。
本方案利用移动窗口(在语句中,给定某个单词后,可以通过移动窗口的方式获得与单词前后相关的短语)的方式获取单词前后相关的短语,最后利用回退算法(为了判断指定的单词是否应该被替换,通过判断该替换单词和它的变体在词库和/或范文库和/或句库和/或词典语料库中的频率的比值来确认)进行语法检查并纠正。输出程序模块700,再输出包含标记的错误部分和修正后的文本内容。
本发明还解决了,现有的批改系统不关心表述的内容是否正确和标准,如果用户讲述的是语法错误的内容,识别后输出得到的内容在语法上也一样是错误的技术问题。例如,用户读一句“How is you”,普通语音识别出来的内容也会是“How is you”,在正常的英语环境沟通和学习中,无法纠正语法错误,也无法在学习过程中发现问题。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图3,在本发明实施例中,本发明还提供一种计算机设备,上述计算机设备12以通用计算设备的形式表现,计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线18结构中的一种或多种,包括存储器总线18或者存储器控制器,外围总线18,图形加速端口,处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线18,微通道体系结构(MAC)总线18,增强型ISA总线18、音视频电子标准协会(VESA)局域总线18以及外围组件互连(PCI)总线18。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)31和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块42,这些程序模块42被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具41,可以存储在例如存储器中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块42以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)),广域网(WAN)和/或公共网络(例如因特网)通信。如图所示,网络适配器21通过总线18与计算机设备12的其他模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统34等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图形边缘吻合识别、比对方法。
即上述处理单元16执行上述程序时实现:获取作文中的语句;从所述语句中提取分句和/或单词和/或短语;根据预设的词库,对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;根据所述预设的词库,对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;根据预设的语法库,对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,获得通过校验的正确语句。
在本发明实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有实施例提供的智能批改方法。
也即,给程序被处理器执行时实现:获取作文中的语句;从所述语句中提取分句和/或单词和/或短语;根据预设的词库,对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;根据所述预设的词库,对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;根据预设的语法库,对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,获得通过校验的正确语句。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD~ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++、Python,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种图形边缘吻合识别、比对方法和一种图形边缘吻合识别、比对系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种智能批改方法,其特征在于,包括:
获取作文中的语句;
从所述语句中提取分句和/或单词和/或短语;
根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;
根据所述预设的词库,通过预设的词性标注算法对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;
根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;
根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句。
2.根据权利要求1所述的方法,其特征在于,所述获取作文中的语句,包括:
自动检测作文中的标点符号,并根据所述标点符号将所述作文拆解为语句。
3.根据权利要求1所述的方法,其特征在于,所述根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词,包括:
当检查到的单词为正确时,获得无修改的第一修改建议,保持原正确的单词,或,当检查到的单词不正确时,根据所述预设的词库,获得正确单词的第一修改建议,标记并替换为正确的单词。
4.根据权利要求3所述的方法,其特征在于,所述预设的词库,包括采用预设的最大熵的词性标注算法,预先建立一个存储了标注英语单词的词库。
5.根据权利要求1所述的方法,其特征在于,所述根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语,包括:
采用概率上下文无关文算法生成分析模型;
对所述文本中的分句和/或短语进行统计分类,获得统计结果;
通过所述分析模型,分析常见的语法错误、逻辑错误,获得分析结果;
根据所述统计结果和分析结果,获得第二修改建议和正确语法的分句和/或短语。
6.根据权利要求1所述的方法,其特征在于,所述根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句,包括:
使用预设的校验匹配算法,进行二次校校验,当校验匹配通过,则获得通过校验的正确语句;当校验匹配未通过,则进行修复后,重新二次校验,多次循环达到校验匹配通过,并通过回退算法获得通过校验的正确语句。
7.根据权利要求1所述的方法,其特征在于,所述根据预设的句库和范文库,将所述第一修改建议和第二修改建议,进行二次校验,并通过回退算法获得通过校验的正确语句之后,还包括:
输出原作文单词错误、语法错误的标注,及通过句库和范文库校验通过的实例。
8.一种智能批改系统,其特征在于,包括:
语句拆分程序模块,用于获取作文中的语句;
拆解程序模块,用于从所述语句中提取分句和/或单词和/或短语;
拼写检查程序模块,用于根据预设的词库,通过神经网络对所述单词进行拼写检查,获得第一修改建议和拼写正确的单词;
词性标记程序模块,用于根据所述预设的词库,通过预设的词性标注算法对所述分句和/或单词和/或短语进行词性标注,获得带有词性标注的文本;
语法修正程序模块,用于根据预设的语法库和预设的分析模型,通过所述神经网络对所述文本中的分句和/或短语进行语法分析,获得第二修改建议和正确语法的分句和/或短语;
校验比对程序模块,用于提交所述第一修改建议和第二修改建议,到预设的句库和范文库,进行二次校验,并通过回退算法获得通过校验的正确语句。
9.电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的智能批改方法的步骤。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的智能批改方法的步骤。
CN202110178980.4A 2021-02-08 2021-02-08 一种智能批改方法、系统、电子设备及存储介质 Pending CN112528651A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110178980.4A CN112528651A (zh) 2021-02-08 2021-02-08 一种智能批改方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110178980.4A CN112528651A (zh) 2021-02-08 2021-02-08 一种智能批改方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112528651A true CN112528651A (zh) 2021-03-19

Family

ID=74975657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110178980.4A Pending CN112528651A (zh) 2021-02-08 2021-02-08 一种智能批改方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112528651A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642318A (zh) * 2021-10-14 2021-11-12 江西风向标教育科技有限公司 英语文章的纠错方法、系统、存储介质及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446941A (zh) * 2008-12-10 2009-06-03 苏州大学 一种基于历史信息的自然语言层次句法分析方法
US8321786B2 (en) * 2004-06-17 2012-11-27 Apple Inc. Routine and interface for correcting electronic text
CN105718586A (zh) * 2016-01-26 2016-06-29 中国人民解放军国防科学技术大学 分词的方法及装置
CN108595410A (zh) * 2018-03-19 2018-09-28 小船出海教育科技(北京)有限公司 手写作文的自动批改方法及装置
CN110675294A (zh) * 2019-09-26 2020-01-10 许昌学院 一种英语作文自动评分系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8321786B2 (en) * 2004-06-17 2012-11-27 Apple Inc. Routine and interface for correcting electronic text
CN101446941A (zh) * 2008-12-10 2009-06-03 苏州大学 一种基于历史信息的自然语言层次句法分析方法
CN105718586A (zh) * 2016-01-26 2016-06-29 中国人民解放军国防科学技术大学 分词的方法及装置
CN108595410A (zh) * 2018-03-19 2018-09-28 小船出海教育科技(北京)有限公司 手写作文的自动批改方法及装置
CN110675294A (zh) * 2019-09-26 2020-01-10 许昌学院 一种英语作文自动评分系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘雷: "英语作文智能批改中语法检查的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 *
王小捷 等: "《自然语言处理技术基础》", 31 December 2002 *
王晓辉: "英语文章语法自动检查及纠正的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊 )》 *
珠杰: "《藏文文本自动处理方法研究》", 31 May 2018 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642318A (zh) * 2021-10-14 2021-11-12 江西风向标教育科技有限公司 英语文章的纠错方法、系统、存储介质及设备
CN113642318B (zh) * 2021-10-14 2022-01-28 江西风向标教育科技有限公司 英语文章的纠错方法、系统、存储介质及设备

Similar Documents

Publication Publication Date Title
Kasewa et al. Wronging a right: Generating better errors to improve grammatical error detection
US9514109B2 (en) Computer-implemented systems and methods for scoring of spoken responses based on part of speech patterns
Al-Twairesh et al. Suar: Towards building a corpus for the Saudi dialect
US9652991B2 (en) Systems and methods for content scoring of spoken responses
Spring et al. The possibility of improving automated calculation of measures of lexical richness for EFL writing: A comparison of the LCA, NLTK and SpaCy tools
US20220358361A1 (en) Generation apparatus, learning apparatus, generation method and program
Shaalan et al. Analysis and feedback of erroneous Arabic verbs
US9390078B2 (en) Computer-implemented systems and methods for detecting punctuation errors
Anastasopoulos Computational tools for endangered language documentation
CN116861242A (zh) 基于语言判别提示的语言感知多语言预训练与微调方法
Wang et al. Research and implementation of English grammar check and error correction based on Deep Learning
JP5230927B2 (ja) 問題自動作成装置、問題自動作成方法、及びコンピュータプログラム
Duran et al. Some issues on the normalization of a corpus of products reviews in Portuguese
CN112528651A (zh) 一种智能批改方法、系统、电子设备及存储介质
Lei et al. Revisit automatic error detection for wrong and missing translation–a supervised approach
Eludiora et al. Development of an English to Yorùbá Machine Translator
Kutuzov et al. Semi-automated typical error annotation for learner English essays: Integrating frameworks
de Lima et al. Automatic Punctuation Verification of School Students’ Essay in Portuguese
Bannò et al. Back to grammar: Using grammatical error correction to automatically assess L2 speaking proficiency
Ehsan et al. Statistical Machine Translation as a Grammar Checker for Persian Language
Godea et al. Automatic generation and classification of minimal meaningful propositions in educational systems
US11087097B2 (en) Automatic item generation for passage-based assessment
Kim et al. Accuracy scoring of elicited imitation: A tutorial of automating speech data with commercial NLP support
Srivastava et al. Different German and English coreference resolution models for multi-domain content curation scenarios
He Automatic detection of grammatical errors in english verbs based on rnn algorithm: auxiliary objectives for neural error detection models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210319