CN113553859A - 一种基于深度语义分析的英语写作评价系统 - Google Patents

一种基于深度语义分析的英语写作评价系统 Download PDF

Info

Publication number
CN113553859A
CN113553859A CN202110948800.6A CN202110948800A CN113553859A CN 113553859 A CN113553859 A CN 113553859A CN 202110948800 A CN202110948800 A CN 202110948800A CN 113553859 A CN113553859 A CN 113553859A
Authority
CN
China
Prior art keywords
english
module
composition
semantic analysis
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110948800.6A
Other languages
English (en)
Inventor
董迪雯
王晓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Environment Biological Polytechnic
Original Assignee
Hunan Environment Biological Polytechnic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Environment Biological Polytechnic filed Critical Hunan Environment Biological Polytechnic
Priority to CN202110948800.6A priority Critical patent/CN113553859A/zh
Publication of CN113553859A publication Critical patent/CN113553859A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于自然语言处理技术领域,公开了一种基于深度语义分析的英语写作评价系统,包括:数据挖掘模块、写作主题获取模块、中央控制模块、作文预处理模块、主题相关性确定模块、重复率检测模块、错误检测模块、语义分析模块、综合评分模块以及输出模块。本发明能够从重复率、主题相关性、错误率、语义等多个层面进行英语作文的评价,不仅客观准确的输出评价分数,同时能够展示相应的作文中的错误,全面的分析作文中出现的问题,有利于后期进行针对性训练,查缺补漏,不仅有助于辅助促进学生对英语知识点的学习和拓展,还能间接地帮助学生提升他们的英语作文写作水平和习惯,设计合理,使用方便,效果良好。

Description

一种基于深度语义分析的英语写作评价系统
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种基于深度语义分析的英语写作评价系统。
背景技术
目前:对于自然语言处理技术的发展,无论国内国外的商业市场、科研领域,以及更大范围的人类社会对于大规模、大范围的真实文本内容的迅速、精确、深度分析的要求一直都极其迫切。全球科技界目前在处理大规模真实文本方面的技术手段主要分为(1)早期的自然语言处理技术(NLP)和(2)最近三十年逐渐形成的比之前技术先进了许多的的运用混合方法构建的深度语义分析模块化的处理技术。
现有的英语写作评价依然主要依靠人工来完成,不仅无法明确写作中存在的具体问题,且评价规则不明确,主观依赖性强。
通过上述分析,现有技术存在的问题及缺陷为:现有的英语写作评价依然主要依靠人工来完成,不仅无法明确写作中存在的具体问题,且评价规则不明确,主观依赖性强。
发明内容
针对现有技术存在的问题,本发明提供了一种基于深度语义分析的英语写作评价系统。
本发明是这样实现的,一种基于深度语义分析的英语写作评价系统,所述基于深度语义分析的英语写作评价系统包括:
数据挖掘模块,与中央控制模块连接,用于利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章;
所述数据挖掘模块利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章包括:确定本地对象与远程数据源同步频率,其中远程数据源即远程Web上数据库;利用泊松过程来表示远程数据源平均变化频率λi,其中,i=1,2,…,n,n代表远程数据源的个数;
确定平均新颖度:由得到的平均变化频率λi,确定各对象即远程Web上数据库中各数据项ei对应的同步频率fi,在满足同步资源限制的条件下,使本地数据库的平均新颖度
Figure BDA0003217853350000021
最大,
Figure BDA0003217853350000022
根据数据时新性确定更新频率:
在时刻t数据抓取系统所维护的第i个数据记录ri的时新性如下:
Figure BDA0003217853350000023
则由N个数据记录组成的数据记录集合S的平均时新性如下:
Figure BDA0003217853350000024
所述数据记录集合S在时间上取平均值加以衡量:
Figure BDA0003217853350000025
利用拉格朗日乘子计算得到各对象的理论同步频率,然后按理论同步频率对对象数据进行同步,使本地数据库的平均新颖度达到最大值;
所述按理论同步频率对对象数据进行同步,包括:
对于所有的(s,a)初始化表项Q0(s,a)=0;
其中,Q表示计算机机器学习领域的专业表示,即Q为增强学习的表示形式,s表示状态,a表示动作,Q(s,a)表示应用动作a到状态s的结果状态;初始化为0值,即未进行学习初始化值;在每个情节中,将对数据源的范围作为其活动,得到回报值为Ri
Figure BDA0003217853350000031
并在时段0-t内,对Q值进行更新:
Figure BDA0003217853350000032
其中qj表示第j个数据记录在时段0-t内进行增强学习得到的结果状态值,Rj表示第j个数据记录在时段0-t内进行增强学习得到的回报值;
在资源限制的前提下,即与服务器最大交互次数M为固定值常量,使得新颖度
Figure BDA0003217853350000033
值最大,F(fii)表示对应第i个数据记录的新颖度,新颖度是通过数据时新性得到,也就是时新性表示记录中对象即最小单位数据项的更新频率,而新颖度指数据项的集合记录也就是远程数据源的整体时新性,ωi是重要性权重;
主题相关性确定模块,与中央控制模块连接,用于基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题;
重复率检测模块,与中央控制模块连接,用于将作文与数据库中存储的经典范文进行对比,判断与存储的经典范文的重复率;
错误检测模块,与中央控制模块连接,用于检测作文中是否存在词汇拼写错误、语法错误、语义错误以及篇章结果错误,并输出错误检测结果;
语义分析模块,与中央控制模块连接,用于基于英语作文预处理结果进行英语作文的语义分析;
综合评分模块,与中央控制模块连接,用于基于跑题判断结果、重复率检测结果、错误检测结果、语义分析结果进行英语写作的综合评价;
进一步,所述基于深度语义分析的英语写作评价系统还包括:
写作主题获取模块,与中央控制模块连接,用于采集并获取本次待评价作文的预设主题;
中央控制模块,与数据挖掘模块、写作主题获取模块、作文预处理模块、主题相关性确定模块、重复率检测模块、错误检测模块、语义分析模块、综合评分模块以及输出模块连接,用于利用单片机或控制器控制各个模块正常工作;
作文预处理模块,与中央控制模块连接,用于对英语作文进行分段、分词、分句、词性标注和依存句法分析,并将分析结果汇总得到英语作文的预处理结果;
输出模块,与中央控制模块连接,用于将跑题判断结果、重复率检测结果、错误检测结果、语义分析结果以及评价结果进行输出。
进一步,所述主题相关性确定模块基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题包括:
获取次待评价作文的预设主题,并对待评价英语作文的内容进行关键词提取;
对所述预设主题和所述英语作文内容关键词进行关键词分类,得到所述作文题目对应的第一实体关键词和第一修饰关键词,以及得到所述作文内容对应的第二实体关键词和第二修饰关键词;
基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度,并基于所述Wordnet分别计算各所述第二修饰关键词与各所述第一修饰关键词之间的第二相似度;
根据所述第一相似度和所述第二相似度,确定所述待评价英语作文内容与所述待评价作文的预设主题之间的相关性。
进一步,所述基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度包括:
分别将所述第一实体关键词和所述第二实体关键词映射至预设英语词汇语义网Wordnet中,以根据所述Wordnet确定各所述第一实体关键词对应的第一上位实体词和各所述第二实体关键词对应的第二上位实体词;
分别计算各所述第二上位实体词与各所述第一上位实体词之间的距离;根据所述距离确定各所述第二实体关键词与各所述第一实体关键词之间的第一相似度。
进一步,所述语义分析模块基于英语作文预处理结果进行英语作文的语义分析包括:
获取预处理后的英语作文的分段、分词、分句、词性标注和依存句法分析结果;
对单词进行词义统计,划分词性,并记录各个单词使用频率情况;进行句型结构的统计,同时记录各个句型的频率;
分析英语作文的各个段落章节的中心思想;根据分析得到的各个段落章节的中心思想,分析章节和标题的点题度;
并基于词性分析结果、单词使用频率、各个句型的评率、英语作文的各个段落章节的中心思想以及章节和标题的点题度输出语义分析结果。
进一步,所述分析英语作文的各个段落章节的中心思想包括:
根据句子的句型,以及句子中各单词的词义和词性,确定句子中各单词的含义;
提取句子中词性为名词的单词含义;根据章节中提取的所有的单词含义确定中心章节的思想。
进一步,所述根据分析得到的各个段落章节的中心思想,分析章节和标题的点题度包括:
根据分析得到的各个段落章节的中心思想,提取章节的关键词;提取标题的关键词;
根据预先存储的各单词的词义,生成章节的关键词和标题的关键词之间的关联度,并将所述关联度作为章节的点题度。
本发明的另一目的在于提供一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现所述基于深度语义分析的英语写作评价系统。
本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以应用所述基于深度语义分析的英语写作评价系统。
本发明的另一目的在于提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机应用所述基于深度语义分析的英语写作评价系统。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明能够从重复率、主题相关性、错误率、语义等多个层面进行英语作文的评价,不仅客观准确的输出评价分数,同时能够展示相应的作文中的错误,全面的分析作文中出现的问题,有利于后期进行针对性训练,查缺补漏,不仅有助于辅助促进学生对英语知识点的学习和拓展,还能间接地帮助学生提升他们的英语作文写作水平和习惯,设计合理,使用方便,效果良好。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于深度语义分析的英语写作评价系统结构示意图;
图中:1、数据挖掘模块;2、写作主题获取模块;3、中央控制模块;4、作文预处理模块;5、主题相关性确定模块;6、重复率检测模块;7、错误检测模块;8、语义分析模块;9、综合评分模块;10、输出模块。
图2是本发明实施例提供的主题相关性确定模块基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题的方法流程图。
图3是本发明实施例提供的基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度的方法流程图。
图4是本发明实施例提供的语义分析模块基于英语作文预处理结果进行英语作文的语义分析的方法流程图。
图5是本发明实施例提供的分析英语作文的各个段落章节的中心思想的方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于深度语义分析的英语写作评价系统,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的基于深度语义分析的英语写作评价系统包括:
数据挖掘模块1,与中央控制模块3连接,用于利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章;
写作主题获取模块2,与中央控制模块3连接,用于采集并获取本次待评价作文的预设主题;
中央控制模块3,与数据挖掘模块1、写作主题获取模块2、作文预处理模块4、主题相关性确定模块5、重复率检测模块6、错误检测模块7、语义分析模块8、综合评分模块9以及输出模块10连接,用于利用单片机或控制器控制各个模块正常工作;
作文预处理模块4,与中央控制模块3连接,用于对英语作文进行分段、分词、分句、词性标注和依存句法分析,并将分析结果汇总得到英语作文的预处理结果;
主题相关性确定模块5,与中央控制模块3连接,用于基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题;
重复率检测模块6,与中央控制模块3连接,用于将作文与数据库中存储的经典范文进行对比,判断与存储的经典范文的重复率;
错误检测模块7,与中央控制模块3连接,用于检测作文中是否存在词汇拼写错误、语法错误、语义错误以及篇章结果错误,并输出错误检测结果;
语义分析模块8,与中央控制模块3连接,用于基于英语作文预处理结果进行英语作文的语义分析;
综合评分模块9,与中央控制模块3连接,用于基于跑题判断结果、重复率检测结果、错误检测结果、语义分析结果进行英语写作的综合评价;
输出模块10,与中央控制模块3连接,用于将跑题判断结果、重复率检测结果、错误检测结果、语义分析结果以及评价结果进行输出。
本发明实施例提供的数据挖掘模块利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章包括:确定本地对象与远程数据源同步频率,其中远程数据源即远程Web上数据库;利用泊松过程来表示远程数据源平均变化频率λi,其中,i=1,2,…,n,n代表远程数据源的个数;
确定平均新颖度:由得到的平均变化频率λi,确定各对象即远程Web上数据库中各数据项ei对应的同步频率fi,在满足同步资源限制的条件下,使本地数据库的平均新颖度
Figure BDA0003217853350000081
最大,
Figure BDA0003217853350000082
根据数据时新性确定更新频率:
在时刻t数据抓取系统所维护的第i个数据记录ri的时新性如下:
Figure BDA0003217853350000083
则由N个数据记录组成的数据记录集合S的平均时新性如下:
Figure BDA0003217853350000084
所述数据记录集合S在时间上取平均值加以衡量:
Figure BDA0003217853350000091
利用拉格朗日乘子计算得到各对象的理论同步频率,然后按理论同步频率对对象数据进行同步,使本地数据库的平均新颖度达到最大值;
所述按理论同步频率对对象数据进行同步,包括:
对于所有的(s,a)初始化表项Q0(s,a)=0;
其中,Q表示计算机机器学习领域的专业表示,即Q为增强学习的表示形式,s表示状态,a表示动作,Q(s,a)表示应用动作a到状态s的结果状态;初始化为0值,即未进行学习初始化值;在每个情节中,将对数据源的范围作为其活动,得到回报值为Ri
Figure BDA0003217853350000092
并在时段0-t内,对Q值进行更新:
Figure BDA0003217853350000093
其中qj表示第j个数据记录在时段0-t内进行增强学习得到的结果状态值,Rj表示第j个数据记录在时段0-t内进行增强学习得到的回报值;
在资源限制的前提下,即与服务器最大交互次数M为固定值常量,使得新颖度
Figure BDA0003217853350000094
值最大,F(fii)表示对应第i个数据记录的新颖度,新颖度是通过数据时新性得到,也就是时新性表示记录中对象即最小单位数据项的更新频率,而新颖度指数据项的集合记录也就是远程数据源的整体时新性,ωi是重要性权重。
如图2所示,本发明实施例提供的主题相关性确定模块基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题包括:
S101,获取次待评价作文的预设主题,并对待评价英语作文的内容进行关键词提取;
S102,对所述预设主题和所述英语作文内容关键词进行关键词分类,得到所述作文题目对应的第一实体关键词和第一修饰关键词,以及得到所述作文内容对应的第二实体关键词和第二修饰关键词;
S103,基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度,并基于所述Wordnet分别计算各所述第二修饰关键词与各所述第一修饰关键词之间的第二相似度;
S104,根据所述第一相似度和所述第二相似度,确定所述待评价英语作文内容与所述待评价作文的预设主题之间的相关性。
如图3所示,本发明实施例提供的基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度包括:
S201,分别将所述第一实体关键词和所述第二实体关键词映射至预设英语词汇语义网Wordnet中,以根据所述Wordnet确定各所述第一实体关键词对应的第一上位实体词和各所述第二实体关键词对应的第二上位实体词;
S202,分别计算各所述第二上位实体词与各所述第一上位实体词之间的距离;根据所述距离确定各所述第二实体关键词与各所述第一实体关键词之间的第一相似度。
如图4所示,本发明实施例提供的语义分析模块基于英语作文预处理结果进行英语作文的语义分析包括:
S301,获取预处理后的英语作文的分段、分词、分句、词性标注和依存句法分析结果;
S302,对单词进行词义统计,划分词性,并记录各个单词使用频率情况;进行句型结构的统计,同时记录各个句型的频率;
S303,分析英语作文的各个段落章节的中心思想;根据分析得到的各个段落章节的中心思想,分析章节和标题的点题度;
S304,并基于词性分析结果、单词使用频率、各个句型的评率、英语作文的各个段落章节的中心思想以及章节和标题的点题度输出语义分析结果。
如图5所示,本发明实施例提供的分析英语作文的各个段落章节的中心思想包括:
S401,根据句子的句型,以及句子中各单词的词义和词性,确定句子中各单词的含义;
S402,提取句子中词性为名词的单词含义;根据章节中提取的所有的单词含义确定中心章节的思想。
本发明实施例提供的根据分析得到的各个段落章节的中心思想,分析章节和标题的点题度包括:
根据分析得到的各个段落章节的中心思想,提取章节的关键词;提取标题的关键词;
根据预先存储的各单词的词义,生成章节的关键词和标题的关键词之间的关联度,并将所述关联度作为章节的点题度。
以上所述,仅为本发明较优的具体的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于深度语义分析的英语写作评价系统,其特征在于,所述基于深度语义分析的英语写作评价系统包括:
数据挖掘模块,与中央控制模块连接,用于利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章;
所述数据挖掘模块利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章包括:确定本地对象与远程数据源同步频率,其中远程数据源即远程Web上数据库;利用泊松过程来表示远程数据源平均变化频率λi,其中,i=1,2,…,n,n代表远程数据源的个数;
确定平均新颖度:由得到的平均变化频率λi,确定各对象即远程Web上数据库中各数据项ei对应的同步频率fi,在满足同步资源限制的条件下,使本地数据库的平均新颖度
Figure FDA0003217853340000011
最大,
Figure FDA0003217853340000012
根据数据时新性确定更新频率:
在时刻t数据抓取系统所维护的第i个数据记录ri的时新性如下:
Figure FDA0003217853340000013
则由N个数据记录组成的数据记录集合S的平均时新性如下:
Figure FDA0003217853340000014
所述数据记录集合S在时间上取平均值加以衡量:
Figure FDA0003217853340000015
利用拉格朗日乘子计算得到各对象的理论同步频率,然后按理论同步频率对对象数据进行同步,使本地数据库的平均新颖度达到最大值;
所述按理论同步频率对对象数据进行同步,包括:
对于所有的(s,a)初始化表项Q0(s,a)=0;
其中,Q表示计算机机器学习领域的专业表示,即Q为增强学习的表示形式,s表示状态,a表示动作,Q(s,a)表示应用动作a到状态s的结果状态;初始化为0值,即未进行学习初始化值;在每个情节中,将对数据源的范围作为其活动,得到回报值为Ri
Figure FDA0003217853340000021
并在时段0-t内,对Q值进行更新:
Figure FDA0003217853340000022
其中qj表示第j个数据记录在时段0-t内进行增强学习得到的结果状态值,Rj表示第j个数据记录在时段0-t内进行增强学习得到的回报值;
在资源限制的前提下,即与服务器最大交互次数M为固定值常量,使得新颖度
Figure FDA0003217853340000023
值最大,F(fii)表示对应第i个数据记录的新颖度,新颖度是通过数据时新性得到,也就是时新性表示记录中对象即最小单位数据项的更新频率,而新颖度指数据项的集合记录也就是远程数据源的整体时新性,ωi是重要性权重;
主题相关性确定模块,与中央控制模块连接,用于基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题;
重复率检测模块,与中央控制模块连接,用于将作文与数据库中存储的经典范文进行对比,判断与存储的经典范文的重复率;
错误检测模块,与中央控制模块连接,用于检测作文中是否存在词汇拼写错误、语法错误、语义错误以及篇章结果错误,并输出错误检测结果;
语义分析模块,与中央控制模块连接,用于基于英语作文预处理结果进行英语作文的语义分析;
综合评分模块,与中央控制模块连接,用于基于跑题判断结果、重复率检测结果、错误检测结果、语义分析结果进行英语写作的综合评价。
2.如权利要求1所述基于深度语义分析的英语写作评价系统,其特征在于,所述基于深度语义分析的英语写作评价系统还包括:
写作主题获取模块,与中央控制模块连接,用于采集并获取本次待评价作文的预设主题;
中央控制模块,与数据挖掘模块、写作主题获取模块、作文预处理模块、主题相关性确定模块、重复率检测模块、错误检测模块、语义分析模块、综合评分模块以及输出模块连接,用于利用单片机或控制器控制各个模块正常工作;
作文预处理模块,与中央控制模块连接,用于对英语作文进行分段、分词、分句、词性标注和依存句法分析,并将分析结果汇总得到英语作文的预处理结果;
输出模块,与中央控制模块连接,用于将跑题判断结果、重复率检测结果、错误检测结果、语义分析结果以及评价结果进行输出。
3.如权利要求1所述基于深度语义分析的英语写作评价系统,其特征在于,所述主题相关性确定模块基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题包括:
获取次待评价作文的预设主题,并对待评价英语作文的内容进行关键词提取;
对所述预设主题和所述英语作文内容关键词进行关键词分类,得到所述作文题目对应的第一实体关键词和第一修饰关键词,以及得到所述作文内容对应的第二实体关键词和第二修饰关键词;
基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度,并基于所述Wordnet分别计算各所述第二修饰关键词与各所述第一修饰关键词之间的第二相似度;
根据所述第一相似度和所述第二相似度,确定所述待评价英语作文内容与所述待评价作文的预设主题之间的相关性。
4.如权利要求3所述基于深度语义分析的英语写作评价系统,其特征在于,所述基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度包括:
分别将所述第一实体关键词和所述第二实体关键词映射至预设英语词汇语义网Wordnet中,以根据所述Wordnet确定各所述第一实体关键词对应的第一上位实体词和各所述第二实体关键词对应的第二上位实体词;
分别计算各所述第二上位实体词与各所述第一上位实体词之间的距离;根据所述距离确定各所述第二实体关键词与各所述第一实体关键词之间的第一相似度。
5.如权利要求1所述基于深度语义分析的英语写作评价系统,其特征在于,所述语义分析模块基于英语作文预处理结果进行英语作文的语义分析包括:
获取预处理后的英语作文的分段、分词、分句、词性标注和依存句法分析结果;
对单词进行词义统计,划分词性,并记录各个单词使用频率情况;进行句型结构的统计,同时记录各个句型的频率;
分析英语作文的各个段落章节的中心思想;根据分析得到的各个段落章节的中心思想,分析章节和标题的点题度;
并基于词性分析结果、单词使用频率、各个句型的评率、英语作文的各个段落章节的中心思想以及章节和标题的点题度输出语义分析结果。
6.如权利要求5所述基于深度语义分析的英语写作评价系统,其特征在于,所述分析英语作文的各个段落章节的中心思想包括:
根据句子的句型,以及句子中各单词的词义和词性,确定句子中各单词的含义;
提取句子中词性为名词的单词含义;根据章节中提取的所有的单词含义确定中心章节的思想。
7.如权利要求5所述基于深度语义分析的英语写作评价系统,其特征在于,所述根据分析得到的各个段落章节的中心思想,分析章节和标题的点题度包括:
根据分析得到的各个段落章节的中心思想,提取章节的关键词;提取标题的关键词;
根据预先存储的各单词的词义,生成章节的关键词和标题的关键词之间的关联度,并将所述关联度作为章节的点题度。
8.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求1-7任意一项所述基于深度语义分析的英语写作评价系统。
9.一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以应用如权利要求1-7任意一项所述基于深度语义分析的英语写作评价系统。
10.一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机应用如权利要求1-7任意一项所述基于深度语义分析的英语写作评价系统。
CN202110948800.6A 2021-08-18 2021-08-18 一种基于深度语义分析的英语写作评价系统 Withdrawn CN113553859A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110948800.6A CN113553859A (zh) 2021-08-18 2021-08-18 一种基于深度语义分析的英语写作评价系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110948800.6A CN113553859A (zh) 2021-08-18 2021-08-18 一种基于深度语义分析的英语写作评价系统

Publications (1)

Publication Number Publication Date
CN113553859A true CN113553859A (zh) 2021-10-26

Family

ID=78105703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110948800.6A Withdrawn CN113553859A (zh) 2021-08-18 2021-08-18 一种基于深度语义分析的英语写作评价系统

Country Status (1)

Country Link
CN (1) CN113553859A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618852A (zh) * 2022-11-22 2023-01-17 山东天成书业有限公司 一种文本数字化自动校对系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618852A (zh) * 2022-11-22 2023-01-17 山东天成书业有限公司 一种文本数字化自动校对系统

Similar Documents

Publication Publication Date Title
CN106650943B (zh) 基于人工智能的辅助写作方法和装置
CN111104789B (zh) 文本评分方法、装置和系统
US8301640B2 (en) System and method for rating a written document
CN103154936A (zh) 用于自动化文本校正的方法和系统
CN111984782B (zh) 藏文文本摘要生成方法和系统
CN107180087B (zh) 一种搜索方法及装置
CN110888989A (zh) 一种智能学习平台及其构建方法
CN116821377A (zh) 基于知识图谱和大模型的小学语文自动评测系统
CN101887415A (zh) 一种文本文档主题词义的自动提取方法
CN113743085A (zh) 一种文本质量评价系统及方法
De Paiva et al. An overview of Portuguese wordnets
CN113553859A (zh) 一种基于深度语义分析的英语写作评价系统
JP4963245B2 (ja) 構文・意味解析結果ランキングモデル作成方法および装置、プログラム並びに記録媒体
CN107818078B (zh) 汉语自然语言对话的语义关联与匹配方法
Kurmi et al. Text summarization using enhanced MMR technique
Nahnsen et al. Lexical chains and sliding locality windows in content-based text similarity detection
TWM623980U (zh) 文字資料之篩選關聯系統
Wang Multimedia-aided English online translation platform based on bayesian theorem
CN112149428A (zh) 基于语义分析和深度学习的智能写作辅助系统
Wei et al. Research on Error Detection Technology of English Writing Based on Recurrent Neural Network
CN113033187B (zh) 一种可迭代语料库的建立方法
Dash et al. Designing a generic scheme for etymological annotation: A new type of language corpora annotation
TWI813028B (zh) 文字資料之篩選關聯方法及系統
CN117407511B (zh) 一种基于Bert模型的电力安全规程智能问答方法及系统
English et al. Striking a balance: Human and computer contributions to learning through semantic analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20211026

WW01 Invention patent application withdrawn after publication