CN111859941B - 一种调整英文语句顺序的方法及系统 - Google Patents

一种调整英文语句顺序的方法及系统 Download PDF

Info

Publication number
CN111859941B
CN111859941B CN201910364386.7A CN201910364386A CN111859941B CN 111859941 B CN111859941 B CN 111859941B CN 201910364386 A CN201910364386 A CN 201910364386A CN 111859941 B CN111859941 B CN 111859941B
Authority
CN
China
Prior art keywords
sample
english
corpus
words
conceptual diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910364386.7A
Other languages
English (en)
Other versions
CN111859941A (zh
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201910364386.7A priority Critical patent/CN111859941B/zh
Publication of CN111859941A publication Critical patent/CN111859941A/zh
Application granted granted Critical
Publication of CN111859941B publication Critical patent/CN111859941B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供了一种调整英文语句顺序的方法及系统,其方法包括:获取语法正确的英语语料样本;分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;获取待解析的英语语料;根据所述样本概念图解析所述英语语料;若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。本发明通过语法正确的英语语料样本建立样本概念图,然后通过概念图对英语语料中语料单词顺序错误的地方进行识别和解析,便于帮助英语初学者学习英语。

Description

一种调整英文语句顺序的方法及系统
技术领域
本发明涉及自然语言处理技术领域,尤指一种调整英文语句顺序的方法及系统。
背景技术
熟练的掌握英语,已经成为我们必须具备的素质之一,我们虽然采用了多种方式提高自己的英语水平,但是效果却不尽如人意。对于英语初学者,在学习英语时,目前大多英语老师都是让学生死记硬背单词的各个释义各个短语的搭配、以及语法规则等学习内容,但是效果并不理想,一方面学生背完很快就会忘记,只能靠反复记忆来解决遗忘的问题,另一方面对于比较相似的短语搭配、语法规则等,学生很容易混淆。因此,需要一种调整英文语句顺序的方法及系统辅助学生学习英语。
发明内容
本发明的目的是提供一种调整英文语句顺序的方法及系统,实现通过语法正确的英语语料样本建立样本概念图,然后通过概念图对英语语料中语料单词顺序错误的地方进行识别和解析,便于帮助英语初学者学习英语。
本发明提供的技术方案如下:
本发明提供一种调整英文语句顺序的方法,包括:
获取语法正确的英语语料样本;
分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
获取待解析的英语语料;
根据所述样本概念图解析所述英语语料;
若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。
进一步的,分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图具体包括:
若所述英语语料样本为英语短语样本,分析所述英语短语样本得到其中包含的所述短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;
根据所述短语样本单词和所述短语单词顺序建立所述英语短语样本对应的短语样本概念图。
进一步的,分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图还包括:
若所述英语语料样本为英语句子样本,分析所述英语句子样本得到其中包含的所述句子样本单词,以及所述句子样本单词之间的句子单词顺序,所述样本单词包括所述句子样本单词;
根据所述句子样本单词和所述句子单词顺序,结合所述短语样本概念图识别所述英语句子样本中的英语短语;
若所述英语句子样本中包含英语短语,则根据所述短语样本概念图、非英语短语的句子样本单词以及对应的句子单词顺序建立所述样本概念图。
进一步的,根据所述样本概念图解析所述英语语料具体包括:
拆分所述英语语料得到语料单词;
获取所述语料单词在所述英语语料的语料单词顺序;
结合所述样本概念图分析所述语料单词和所述语料单词顺序。
进一步的,若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析具体包括:
若所述英语语料中的语料单词的顺序错误,则标记顺序错误的语料单词;
根据所述样本概念图调整顺序,并将调整之后得到的英语语料更正文本和所述英语语料同时进行显示;
结合所述英语语料更正文本解析标记的语料单词的使用方法。
本发明还提供一种调整英文语句顺序的系统,包括:
样本获取模块,获取语法正确的英语语料样本;
概念图建立模块,分析所述样本获取模块获取的所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
语料获取模块,获取待解析的英语语料;
解析模块,根据所述概念图建立模块建立的所述样本概念图解析所述语料获取模块获取的所述英语语料;
处理模块,若所述解析模块得到所述英语语料中的语料单词的顺序错误,则根据所述概念图建立模块建立的所述样本概念图进行调整并解析。
进一步的,所述概念图建立模块具体包括:
分析单元,若所述样本获取模块获取的所述英语语料样本为英语短语样本,分析所述样本获取模块获取的所述英语短语样本得到其中包含的所述短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;
概念图建立单元,根据所述分析单元得到的所述短语样本单词和所述分析单元得到的所述短语单词顺序建立所述英语短语样本对应的短语样本概念图。
进一步的,所述概念图建立模块具体包括:
所述分析单元,若所述样本获取模块获取的所述英语语料样本为英语句子样本,分析所述样本获取模块获取的所述英语句子样本得到其中包含的所述句子样本单词,以及所述句子样本单词之间的句子单词顺序,所述样本单词包括所述句子样本单词;
识别单元,根据所述分析单元得到的所述句子样本单词和所述分析单元得到的所述句子单词顺序,结合所述短语样本概念图识别所述英语句子样本中的英语短语;
所述概念图建立单元,若所述识别单元得到所述英语句子样本中包含英语短语,则根据所述概念图建立单元建立的所述短语样本概念图、所述分析单元得到的非英语短语的句子样本单词以及对应的所述分析单元得到的句子单词顺序建立所述样本概念图。
进一步的,所述解析模块具体包括:
拆分单元,拆分所述语料获取模块获取的所述英语语料得到语料单词;
顺序获取单元,获取所述拆分单元得到的所述语料单词在所述语料获取模块获取的所述英语语料的语料单词顺序;
解析单元,结合所述概念图建立模块建立的所述样本概念图分析所述拆分单元得到的所述语料单词和所述顺序获取单元得到的所述语料单词顺序。
进一步的,所述处理模块具体包括:
标记单元,若所述解析模块判断所述英语语料中的语料单词的顺序错误,则标记顺序错误的语料单词;
顺序调整单元,根据所述概念图建立模块建立的所述样本概念图调整顺序,并将调整之后得到的英语语料更正文本和所述英语语料同时进行显示;
处理单元,结合所述顺序调整单元得到的所述英语语料更正文本解析所述标记单元标记的语料单词的使用方法。
通过本发明提供的一种调整英文语句顺序的方法及系统,能够带来以下至少一种有益效果:
1、本发明中,通过分析语法正确的英语语料样本建立样本概念图,然后根据样本概念图解析英语语料,识别其中单词顺序错误的地方,并进行语法解析和拓展,辅助用户学习英语。
2、本发明中,通过对获取的英语语料样本进行识别,将其中的英语短语样本单独进行分析建立对应的短语样本概念图,然后在样本概念图中将短语样本概念图作为一个整体处理,从而提高样本概念图的处理速度。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种调整英文语句顺序的方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种调整英文语句顺序的方法的一个实施例的流程图;
图2是本发明一种调整英文语句顺序的方法的另一个实施例的流程图;
图3是本发明一种调整英文语句顺序的方法的另一个实施例的流程图;
图4是本发明一种调整英文语句顺序的方法的另一个实施例的流程图;
图5是本发明一种调整英文语句顺序的方法的另一个实施例的流程图;
图6是本发明一种调整英文语句顺序的系统的一个实施例的结构示意图
图7是本发明一种调整英文语句顺序的系统的另一个实施例的结构示意图。
附图标号说明:
100调整英文语句顺序的系统
110样本获取模块
120概念图建立模块121分析单元122概念图建立单元123识别单元
130语料获取模块
140解析模块141拆分单元142顺序获取单元143解析单元
150处理模块151标记单元152顺序调整单元153处理单元
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘出了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
具体实现中,本申请实施例中描述的终端设备包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机、家教机或平板计算机之类的其他便携式设备。还应当理解的是,在某些实施例中,所述终端设备并非便携式通信设备,而是具有触摸敏感表面(例如:触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端设备。然而,应当理解的是,终端设备可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其他物理用户接口设备。
终端设备支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、网络创建应用程序、文字处理应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄像机应用程序、Web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端设备上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
本发明的一个实施例,如图1所示,一种调整英文语句顺序的方法,包括:
S100获取语法正确的英语语料样本;
具体的,获取大量的语法正确的英语语料样本,英语语料样本的来源多种多样,可以是获取的课本上的英语材料,还可以是获取的其余的影视资料。由于英语语料样本是作为后续对不正确语序的英语语料纠正的模板,因此收集的英语语料样本要求是语法正确的。
另外,由于本发明适用于英语学习者,尤其是英语初学者,完全符合语法规则的英语语料样本最为适宜,部分材料中的英语使用方法在部分情境下虽然适用,但并不符合严格的语法规则,将此类英语材料作为英语语料样本并不有助于初学者学习英语。
S200分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
具体的,分析获取的英语语料样本中的样本单词之间的单词顺序,建立样本概念图。概念图(conceptmap)是一种用节点代表概念,连线表示概念间关系的图示法。
将英语语料样本拆分为一一单一的样本单词,每一个样本单词作为样本概念图中的节点,每一个样本单词按照在英语语料样本中的顺序依次连接,可以用箭头等方式表明先后顺序,例如由在英语语料样本中在前的样本单词对应的节点指向在英语语料样本中在后的样本单词对应的节点。
另外在样本概念图中不仅仅只是将在英语语料样本中相邻的样本单词对应的节点进行连接,其中相隔有多个样本单词的两个样本单词对应节点也可以进行连接,同样可以通过箭头由在英语语料样本中在前的样本单词对应的节点指向在英语语料样本中在后的样本单词对应的节点,并且还可以在连线上表示两个样本单词之间相隔的样本单词数量。
通过连线表示相隔的样本单词数量的方式多种多样,例如,可以直接通过在连线上进行数字标记,或者,还可以直接通过连线的长度表示,又或者,可以通过不同颜色的连线分别进行表示。
概念图的理论基础是Ausubel的学习理论,Ausubel的先行组织者主张用一幅大的图画,首先呈现最笼统的概念,然后逐渐展现细节和具体的东西。Ausubel的先行组织者主张用一幅大的图画,首先呈现最笼统的概念,然后逐渐展现细节和具体的东西。
因此,随着所分析包含的英语语料样本越来越多,样本概念图也越来越庞大,其中样本单词之间的连接关系也越来越复杂。此时,可以统计任意两个样本单词之间的先后顺序在所有同时包含有该该两个样本单词的英语语料样本中出现的概率,以及该两个样本单词之间包含的语料单词的数量出现的频率,然后根据预设规则进行选取。例如选择频率较高的现象作为该两个样本单词应当遵循的规则,又或者,当某一种情形出现的频率远远大于其他情形时将此类情形作为该两个样本单词应当遵循的规则。
例如,有100个英语语料样本中同时包含有样本单词A和样本单词B,其中98个英语语料样本中样本单词A在前,样本单词B在后,则认定样本单词A在前,样本单词B在后。并且样本单词A在前,样本单词B在后的情形中,样本单词A与样本单词B至今间隔的样本单词数量始终为0,则认定样本单词A与样本单词B相邻。
S300获取待解析的英语语料;
具体的,获取用户待解析的英语语料。英语语料可以是用户在学习过程中的作业内容,例如短文作文、英语对话等,也可以是用户的口语练习资料。因此,终端可以是通过语音获取模块获取用户待解析的英语语料,也可以拍照识别获取。
S400根据所述样本概念图解析所述英语语料;
具体的,根据样本概念图解析英语语料,将获取的待解析的英语语料拆分为单一的语料单词,并从英语语料中获取语料单词相互之间的先后顺序,包括非相邻的语料单词之间相隔的语料单词的数量。
结合样本概念图逐一的进行比对。例如,按照英语语料的顺序从第一个语料单词开始,逐一比对后面的每一个语料单词顺序是否正确,然后再选择第二个语料单词进行比对,以此类推比对完全。
S500若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。
具体的,如果上述比对发现英语语料中的语料单词的顺序错误,则根据样本概念图进行调整并解析。当发现某一个语料单词与另一个语料单词之间的先后顺序不符合样本概念图中的所有的情形,则根据样本概念图中两个语料单词最有可能的情形进行调整,调整之后还要结合样本概念图对其余的语料单词进行检查,避免又和其余的语料单词的顺序发生冲突。但是如果冲突则返回上一步根据样本概念图中另一种情形对两个语料单词进行调整,以此类推,直至所有的语料单词之间的相互顺序符合样本概念图的要求。
另外,如果多次进行调整还是无法调整至所有的语料单词都符合样本概念图的要求,则应当单独进行识别该英语语料的顺序是否正确,该英语语料是否属于符合语法规则,若是则根据该英语语料更新样本概念图。
最后,对于识别出的英语语料中顺序出错的地方,首先进行理论上语法讲解,然后进行相应的扩展,实际举例其余情境下的正确使用方法,及时进行巩固学习。
本实施例中,通过分析语法正确的英语语料样本建立样本概念图,然后根据样本概念图解析英语语料,识别其中单词顺序错误的地方,并进行语法解析和拓展,辅助用户学习英语。
本发明的另一个实施例,是上述的实施例的优化实施例,如图2所示,包括:
S100获取语法正确的英语语料样本;
S200分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
S210若所述英语语料样本为英语短语样本,分析所述英语短语样本得到其中包含的所述短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;
具体的,在英语中英语短语都是具有固定的搭配,如果所有的英语语料样本中,每一个样本单词都逐一地分析,那么系统需要处理的数据会比较庞大,但是如果将英语短语作为固定搭配的一个整体单独进行分析,然后再结合英语短语分析其余的样本单词,可以最大程度地提高系统处理数据的速度,同时将英语短语作为一个整体也便于用户理解。
因此,需要对获取的英语语料样本进行识别,如果识别出获取的英语语料样本为英语短语样本,则将该英语语料样本标记为短语。然后对获取的英语语料样本进行拆分,得到单一的短语样本单词,并且根据该英语语料样本获取所有的短语样本单词相互之间的短语单词顺序。该短语单词顺序不仅仅指两个短语样本单词的相邻关系,即便不相邻,也要获取中间相隔的短语样本单词的数量。
S220根据所述短语样本单词和所述短语单词顺序建立所述英语短语样本对应的短语样本概念图。
具体的,根据短语样本单词和短语单词顺序建立英语短语样本对应的短语样本概念图。每一个短语样本单词作为短语样本概念图中的节点,每一个短语样本单词按照在英语语料样本中的顺序依次连接,可以用箭头等方式表明先后顺序,例如由在英语语料样本中在前的短语样本单词对应的节点指向在英语语料样本中在后的短语样本单词对应的节点。也可以按照其余的上述实施例距离的方式进行连接。
另外,由于英语短语一般为固定搭配,因此对于整体的根据英语语料样本对应的样本概念图而言,可以将英语短语样本对应的短语样本概念图整体看作是样本概念图中的一个大的节点,然后再与其余的样本单词在样本概念图中建立顺序上的关联。
S300获取待解析的英语语料;
S400根据所述样本概念图解析所述英语语料;
S500若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。
本实施例中,通过对获取的英语语料样本进行识别,将其中的英语短语样本单独进行分析建立对应的短语样本概念图,然后在样本概念图中将短语样本概念图作为一个整体处理,从而提高样本概念图的处理速度。
本发明的另一个实施例,是上述的实施例的优化实施例,如图3所示,包括:
S100获取语法正确的英语语料样本;
S200分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
S210若所述英语语料样本为英语短语样本,分析所述英语短语样本得到其中包含的所述短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;
S220根据所述短语样本单词和所述短语单词顺序建立所述英语短语样本对应的短语样本概念图。
S230若所述英语语料样本为英语句子样本,分析所述英语句子样本得到其中包含的所述句子样本单词,以及所述句子样本单词之间的句子单词顺序,所述样本单词包括所述句子样本单词;
具体的,如果识别出获取的英语语料样本为英语句子样本,则对获取的英语语料样本进行拆分,得到单一的句子样本单词,并且根据该英语语料样本获取所有的句子样本单词相互之间的句子单词顺序。该句子单词顺序不仅仅指两个句子样本单词的相邻关系,即便不相邻,也要获取中间相隔的句子样本单词的数量。
S240根据所述句子样本单词和所述句子单词顺序,结合所述短语样本概念图识别所英语句子样本中的英语短语;
具体的,根据句子样本单词和句子单词顺序,结合短语样本概念图识别英语语料样本中的英语短语。也就是说,首先根据短语样本概念图判断英语语料样本中是否包含英语短语。
另外,由于英语语料样本中即便包含英语短语,也有可能包含的是单词顺序有问题的英语短语,因此并不要求句子样本单词和句子单词顺序与短语样本概念图中完全一致,而是匹配符合一定的比例即可。
S250若所述英语句子样本中包含英语短语,则根据所述短语样本概念图、非英语短语的句子样本单词以及对应的句子单词顺序建立所述样本概念图。
具体的,如果英语句子样本中包含英语短语,则英语短语对应的句子样本单词单独对应短语样本概念图,获取英语句子样本中非英语短语的句子样本单词以及短语样本概念图之间的先后顺序,建立对应的样本概念图。
S300获取待解析的英语语料;
S400根据所述样本概念图解析所述英语语料;
S500若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。
本实施例中,在处理包含英语短语的英语句子样本时,将英语短语对应的句子样本单词单独作为一个整体处理,分层级对英语句子样本进行处理,提高数据处理速度。
本发明的另一个实施例,是上述的实施例的优化实施例,如图4所示,包括:
S100获取语法正确的英语语料样本;
S200分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
S210若所述英语语料样本为英语短语样本,分析所述英语短语样本得到其中包含的所述短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;
S220根据所述短语样本单词和所述短语单词顺序建立所述英语短语样本对应的短语样本概念图。
S230若所述英语语料样本为英语句子样本,分析所述英语句子样本得到其中包含的所述句子样本单词,以及所述句子样本单词之间的句子单词顺序,所述样本单词包括所述句子样本单词;
S240根据所述句子样本单词和所述句子单词顺序,结合所述短语样本概念图识别所述英语句子样本中的英语短语;
S250若所述英语句子样本中包含英语短语,则根据所述短语样本概念图、非英语短语的句子样本单词以及对应的句子单词顺序建立所述样本概念图。
S300获取待解析的英语语料;
S400根据所述样本概念图解析所述英语语料;
S410拆分所述英语语料得到语料单词;
S420获取所述语料单词在所述英语语料的语料单词顺序;
具体的,将获取的带解析的英语语料拆分成一个个单一的语料单词,然后结合英语语料获取语料单词相互之间的语料单词顺序。该语料单词顺序序不仅仅指两个语料单词的相邻关系,即便不相邻,也要获取中间相隔的语料单词的数量。
S430结合所述样本概念图分析所述语料单词和所述语料单词顺序。
具体的,结合样本概念图分析语料单词和语料单词顺序。首先通过样本概念图中的短语样本概念图分析英语语料中是否包含英语短语。如果包含则可以将英语短语对应的内容作为一个整体再和其余的语料单词进行处理,减少了数据处理量。
S500若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。
本实施例中,在解析待解析的英语语料时,首先根据样本概念图中的短语样本概念图判断英语语料中是否包含英语短语,若有则将英语短语对应的语料单词单独作为一个整体处理,分层级对英语语料进行处理,提高数据处理速度。
本发明的另一个实施例,是上述的实施例的优化实施例,如图5所示,包括:
S100获取语法正确的英语语料样本;
S200分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
S300获取待解析的英语语料;
S400根据所述样本概念图解析所述英语语料;
S500若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。
S510若所述英语语料中的语料单词的顺序错误,则标记顺序错误的语料单词;
具体的,如果结合样本概念图识别出英语语料中的语料单词之间的顺序有地方存在错误,则在英语语料的原始文本中标记出顺序错误的语料单词。由于获取的英语语料可能是通过语音获取的,针对此类情形,需要首先将语音转化为原始文本再进行标记。
S520根据所述样本概念图调整顺序,并将调整之后得到的英语语料更正文本和所述英语语料同时进行显示;
具体的,根据样本概念图调整顺序得到英语语料更正文本,使得英语语料更正文本中所有的语料单词之间的顺序都符合样本概念图的要求,并将英语语料更正文本和英语语料同时进行显示,便于用户对比学习。
S530结合所述英语语料更正文本解析标记的语料单词的使用方法。
具体的,结合英语语料更正文本,解析在英语语料中标记的顺序出现错误语料单词的正确使用方法,首先从语法规则的角度解析单词的使用方法,其次结合其余的语料实例进行讲解。
本实施例中,将顺序调整之后英语语料更正文本和英语语料同时进行显示,便于用户直观的看出错误之处。并且对顺序错误的地方进行理论讲解和实例拓展解析,辅助用户更好地学习英语。
本发明的一个实施例,如图6所示,一种调整英文语句顺序的系统100,包括:
样本获取模块110,获取语法正确的英语语料样本;
概念图建立模块120,分析所述样本获取模块110获取的所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
语料获取模块130,获取待解析的英语语料;
解析模块140,根据所述概念图建立模块120建立的所述样本概念图解析所述语料获取模块130获取的所述英语语料;
处理模块150,若所述解析模块140得到所述英语语料中的语料单词的顺序错误,则根据所述概念图建立模块120建立的所述样本概念图进行调整并解析。
本实施例中的各个模块的具体操作方式在上述对应的方法实施例中已经进行了详细描述,因此不再一一进行赘述。
本发明的另一个实施例,是上述的实施例的优化实施例,如图7所示,包括:
样本获取模块110,获取语法正确的英语语料样本;
概念图建立模块120,分析所述样本获取模块110获取的所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;
所述概念图建立模块120具体包括:
分析单元121,若所述样本获取模块110获取的所述英语语料样本为英语短语样本,分析所述样本获取模块110获取的所述英语短语样本得到其中包含的所述短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;
概念图建立单元122,根据所述分析单元121得到的所述短语样本单词和所述分析单元121得到的所述短语单词顺序建立所述英语短语样本对应的短语样本概念图。
所述概念图建立模块120还包括:
所述分析单元121,若所述样本获取模块110获取的所述英语语料样本为英语句子样本,分析所述样本获取模块110获取的所述英语句子样本得到其中包含的所述句子样本单词,以及所述句子样本单词之间的句子单词顺序,所述样本单词包括所述句子样本单词;
识别单元123,根据所述分析单元121得到的所述句子样本单词和所述分析单元121得到的所述句子单词顺序,结合所述短语样本概念图识别所述英语句子样本中的英语短语;
所述概念图建立单元122,若所述识别单元123得到所述英语句子样本中包含英语短语,则根据所述概念图建立单元122建立的所述短语样本概念图、所述分析单元121得到的非英语短语的句子样本单词以及对应的所述分析单元121得到的句子单词顺序建立所述样本概念图。
语料获取模块130,获取待解析的英语语料;
解析模块140,根据所述概念图建立模块120建立的所述样本概念图解析所述语料获取模块130获取的所述英语语料;
所述解析模块140具体包括:
拆分单元141,拆分所述语料获取模块130获取的所述英语语料得到语料单词;
顺序获取单元142,获取所述拆分单元141得到的所述语料单词在所述语料获取模块130获取的所述英语语料的语料单词顺序;
解析单元143,结合所述概念图建立模块120建立的所述样本概念图分析所述拆分单元141得到的所述语料单词和所述顺序获取单元142得到的所述语料单词顺序。
处理模块150,若所述解析模块140得到所述英语语料中的语料单词的顺序错误,则根据所述概念图建立模块120建立的所述样本概念图进行调整并解析。
所述处理模块150具体包括:
标记单元151,若所述解析模块140判断所述英语语料中的语料单词的顺序错误,则标记顺序错误的语料单词;
顺序调整单元152,根据所述概念图建立模块120建立的所述样本概念图调整顺序,并将调整之后得到的英语语料更正文本和所述英语语料同时进行显示;
处理单元153,结合所述顺序调整单元152得到的所述英语语料更正文本解析所述标记单元151标记的语料单词的使用方法。
本实施例中的各个模块的具体操作方式在上述对应的方法实施例中已经进行了详细描述,因此不再一一进行赘述。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种调整英文语句顺序的方法,其特征在于,包括:
获取语法正确的英语语料样本;
分析所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;具体包括:若所述英语语料样本为英语短语样本,分析所述英语短语样本得到其中包含的短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;根据所述短语样本单词和所述短语单词顺序建立所述英语短语样本对应的短语样本概念图;若所述英语语料样本为英语句子样本,分析所述英语句子样本得到其中包含的句子样本单词,以及所述句子样本单词之间的句子单词顺序,所述样本单词包括所述句子样本单词;根据所述句子样本单词和所述句子单词顺序,结合所述短语样本概念图识别所述英语句子样本中的英语短语;若所述英语句子样本中包含英语短语,则根据所述短语样本概念图、非英语短语的句子样本单词以及对应的句子单词顺序建立所述样本概念图;
获取待解析的英语语料;
根据所述样本概念图解析所述英语语料;
若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析。
2.根据权利要求1所述的调整英文语句顺序的方法,其特征在于,根据所述样本概念图解析所述英语语料具体包括:
拆分所述英语语料得到语料单词;
获取所述语料单词在所述英语语料的语料单词顺序;
结合所述样本概念图分析所述语料单词和所述语料单词顺序。
3.根据权利要求1-2任一项所述的调整英文语句顺序的方法,其特征在于,若所述英语语料中的语料单词的顺序错误,则根据所述样本概念图进行调整并解析具体包括:
若所述英语语料中的语料单词的顺序错误,则标记顺序错误的语料单词;
根据所述样本概念图调整顺序,并将调整之后得到的英语语料更正文本和所述英语语料同时进行显示;
结合所述英语语料更正文本解析标记的语料单词的使用方法。
4.一种调整英文语句顺序的系统,其特征在于,包括:
样本获取模块,获取语法正确的英语语料样本;
概念图建立模块,分析所述样本获取模块获取的所述英语语料样本中的样本单词之间的单词顺序,建立样本概念图;具体包括:分析单元,若所述样本获取模块获取的所述英语语料样本为英语短语样本,分析所述样本获取模块获取的所述英语短语样本得到其中包含的短语样本单词,以及所述短语样本单词之间的短语单词顺序,所述样本单词包括所述短语样本单词;概念图建立单元,根据所述分析单元得到的所述短语样本单词和所述分析单元得到的所述短语单词顺序建立所述英语短语样本对应的短语样本概念图;所述分析单元,若所述样本获取模块获取的所述英语语料样本为英语句子样本,分析所述样本获取模块获取的所述英语句子样本得到其中包含的句子样本单词,以及所述句子样本单词之间的句子单词顺序,所述样本单词包括所述句子样本单词;识别单元,根据所述分析单元得到的所述句子样本单词和所述分析单元得到的所述句子单词顺序,结合所述短语样本概念图识别所述英语句子样本中的英语短语;所述概念图建立单元,若所述识别单元得到所述英语句子样本中包含英语短语,则根据所述概念图建立单元建立的所述短语样本概念图、所述分析单元得到的非英语短语的句子样本单词以及对应的所述分析单元得到的句子单词顺序建立所述样本概念图;
语料获取模块,获取待解析的英语语料;
解析模块,根据所述概念图建立模块建立的所述样本概念图解析所述语料获取模块获取的所述英语语料;
处理模块,若所述解析模块得到所述英语语料中的语料单词的顺序错误,则根据所述概念图建立模块建立的所述样本概念图进行调整并解析。
5.根据权利要求4所述的调整英文语句顺序的系统,其特征在于,所述解析模块具体包括:
拆分单元,拆分所述语料获取模块获取的所述英语语料得到语料单词;
顺序获取单元,获取所述拆分单元得到的所述语料单词在所述语料获取模块获取的所述英语语料的语料单词顺序;
解析单元,结合所述概念图建立模块建立的所述样本概念图分析所述拆分单元得到的所述语料单词和所述顺序获取单元得到的所述语料单词顺序。
6.根据权利要求4-5任一项所述的调整英文语句顺序的系统,其特征在于,所述处理模块具体包括:
标记单元,若所述解析模块判断所述英语语料中的语料单词的顺序错误,则标记顺序错误的语料单词;
顺序调整单元,根据所述概念图建立模块建立的所述样本概念图调整顺序,并将调整之后得到的英语语料更正文本和所述英语语料同时进行显示;
处理单元,结合所述顺序调整单元得到的所述英语语料更正文本,解析标记的所述语料单词的使用方法。
CN201910364386.7A 2019-04-30 2019-04-30 一种调整英文语句顺序的方法及系统 Active CN111859941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910364386.7A CN111859941B (zh) 2019-04-30 2019-04-30 一种调整英文语句顺序的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910364386.7A CN111859941B (zh) 2019-04-30 2019-04-30 一种调整英文语句顺序的方法及系统

Publications (2)

Publication Number Publication Date
CN111859941A CN111859941A (zh) 2020-10-30
CN111859941B true CN111859941B (zh) 2023-05-05

Family

ID=72965195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910364386.7A Active CN111859941B (zh) 2019-04-30 2019-04-30 一种调整英文语句顺序的方法及系统

Country Status (1)

Country Link
CN (1) CN111859941B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5535121A (en) * 1994-06-01 1996-07-09 Mitsubishi Electric Research Laboratories, Inc. System for correcting auxiliary verb sequences
CN103116575A (zh) * 2011-11-16 2013-05-22 富士通株式会社 基于层次短语模型的译文词序概率确定方法及装置
JP2014170296A (ja) * 2013-03-01 2014-09-18 Nippon Telegr & Teleph Corp <Ntt> 語順並べ替え装置、翻訳装置、翻訳モデル学習装置、方法、及びプログラム
CN105677642A (zh) * 2015-12-31 2016-06-15 成都数联铭品科技有限公司 一种机器翻译语序调整方法
CN106255998A (zh) * 2014-05-09 2016-12-21 高光哲 利用英语语序地图的英语学习方法及其系统
CN108519974A (zh) * 2018-03-31 2018-09-11 华南理工大学 英语作文语法错误自动检测与分析方法
CN109299282A (zh) * 2018-08-16 2019-02-01 山东女子学院 基于文本分析及关联规则挖掘的概念图自动生成方法
CN109543176A (zh) * 2018-10-17 2019-03-29 中山大学 一种基于图向量表征的丰富短文本语义方法及装置
CN109614623A (zh) * 2018-12-12 2019-04-12 广东小天才科技有限公司 一种基于句法分析的作文处理方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5535121A (en) * 1994-06-01 1996-07-09 Mitsubishi Electric Research Laboratories, Inc. System for correcting auxiliary verb sequences
CN103116575A (zh) * 2011-11-16 2013-05-22 富士通株式会社 基于层次短语模型的译文词序概率确定方法及装置
JP2014170296A (ja) * 2013-03-01 2014-09-18 Nippon Telegr & Teleph Corp <Ntt> 語順並べ替え装置、翻訳装置、翻訳モデル学習装置、方法、及びプログラム
CN106255998A (zh) * 2014-05-09 2016-12-21 高光哲 利用英语语序地图的英语学习方法及其系统
CN105677642A (zh) * 2015-12-31 2016-06-15 成都数联铭品科技有限公司 一种机器翻译语序调整方法
CN108519974A (zh) * 2018-03-31 2018-09-11 华南理工大学 英语作文语法错误自动检测与分析方法
CN109299282A (zh) * 2018-08-16 2019-02-01 山东女子学院 基于文本分析及关联规则挖掘的概念图自动生成方法
CN109543176A (zh) * 2018-10-17 2019-03-29 中山大学 一种基于图向量表征的丰富短文本语义方法及装置
CN109614623A (zh) * 2018-12-12 2019-04-12 广东小天才科技有限公司 一种基于句法分析的作文处理方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Design of turbo codes without 4-cycles in Tanner graph representation for message passing algorithm;Ying Cui et.al;《2011 IEEE 7th International Colloquium on Signal Processing and its Applications》;20110502;第108-111页 *
Diffusive gradients in thin films based on MOF-derived porous carbon binding gel for in-situ measurement of antibiotics in waters;Suyu Ren et.al;《Science of the Total Environment》;20181231;第482-490页 *
在语篇中教学词汇的时间探索;罗娟;《中小学外语教学(中学篇)》;20130731;第1-6页 *
朝鲜族小学生""字补语句偏误分析;崔颖;《中国优秀博硕士学位论文全文数据库 (硕士)哲学与人文科学辑(月刊)》;20060315;第F084-172页 *

Also Published As

Publication number Publication date
CN111859941A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
US10210154B2 (en) Input method editor having a secondary language mode
CN106202059B (zh) 机器翻译方法以及机器翻译装置
RU2607416C2 (ru) Крауд-сорсные системы обучения лексике
TWI475406B (zh) 取決於上下文之輸入方法
US20150309984A1 (en) Learning language models from scratch based on crowd-sourced user text input
US20170270086A1 (en) Apparatus, method, and computer program product for correcting speech recognition error
US20160275941A1 (en) Systems and methods for structured stem and suffix language models
US11640503B2 (en) Input method, input device and apparatus for input
WO2015089409A1 (en) Using statistical language models to improve text input
US20070288240A1 (en) User interface for text-to-phone conversion and method for correcting the same
KR102043419B1 (ko) 아동언어학습을 위한 음성인식 기반 학습 시스템 및 학습방법
JP2023511971A (ja) ドキュメント翻訳方法及び装置、記憶媒体並びに電子デバイス
van Esch et al. Writing across the world's languages: Deep internationalization for Gboard, the Google keyboard
CN107765888A (zh) 一种汉字输入方法及终端
KR20120131480A (ko) 단어 학습 서비스 제공 시스템 및 방법
JP2011076384A (ja) 情報出力装置及び情報出力プログラム
CN111859941B (zh) 一种调整英文语句顺序的方法及系统
CN111860000A (zh) 文本翻译编辑方法、装置、电子设备及存储介质
CN111914533A (zh) 一种解析英语长句的方法及系统
CN110781689B (zh) 信息处理方法、装置及存储介质
CN106776533B (zh) 用于分析一段文本的方法和系统
CN116806338A (zh) 确定和利用辅助语言熟练度量度
CN108766059B (zh) 一种云服务英语教学设备及教学方法
CN108509057B (zh) 输入方法与相关设备
CN111913563A (zh) 一种基于半监督学习的人机交互方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant