一种自动产生测试题目的语言学习系统及其语言学习方法
技术领域
本发明提供一种的语言学习系统及其学习方法,具体地,特别涉及自动测试题目的语言学习系统及其语言学习方法。
背景技术
语言是人类最重要的交际工具,是人们进行沟通的主要表达方式。人们借助语言保存和传递人类文明的成果。语言是民族的重要特征之一。一般来说,各个民族都有自己的语言。汉语,法语,俄语,西班牙语,阿拉伯语,英语是世界上的主要语言,也是联合国的工作语言。汉语是世界上使用人口最多的语言。据德国出版的《语言学及语言交际工具问题手册》说,现在世界上查明的有5651种语言。在这些语言中,约有1400多种还没有被人们承认是独立的语言,或者是正在衰亡的语言。
学习者不仅学习自己本国语言,为了增加与其它国家的人员交流和文化往来,学习者还需要学习其它语言,如英语、日语、德语等,因此具有一种以上的外语能力是目前每一个人所需要的,无论是在职场上或是在对话中,具备多种外语能力的人,无形中自然会被更加重视。所以,如何增加学习外语能力的方法常会被人们提起。但现在学习生活中,语言教学一般都为教师的课堂讲课教授,再辅以文字教材的方式达成或者视频录播教学,强硬通过单词,句子,听力来被动学习,过程较为枯燥,教学效果一般,不能满足现在的学习需求。该方式需要求学习者和授课者于时间上高度配合,但往往时间上存在冲突或者学习仅能是在课堂上完成,业余时间学生需要课后巩固学习成果时,往往缺乏老师的指导,导致学生出现疑问不能及时解答。
另外,学习者还对非本国语言学习产生一定的动力,为了增加外语能力,市面上提出了许多硬体装置或软件方法以达到学习外语的能力。例如,利用学习英语的软件的话,它就是会列出每个不同级别的单字范围,例如:小学、中学等,让你选择范围后,开始自字母“a”开始背起单词。由于,这些英文单字是预先设计好的,因此,没办法根据你的实际需要分类出单词范围。学习英语软件的背单词功能有:单词的播放,单词测验等。这些背单词的方法都是靠眼睛的“视觉”,来进行记忆的。但是,熟悉语言学习的人们都知道,仅使用单一种“视觉”进行记忆单字其效率有限,若能配合“听觉”,以声音的形式朗读出来,不断刺激人的大脑,帮助人们对于单词的记忆,会让语言学习的效率更进一步。因此,现在有很多录制好的音效档案,能让你放在播放器中使用“听觉”进行单字记忆,但是却使用纸本方式让使用者阅读,因此需要在固定场所,方能进行语言学习,无法让使用者可以随时随地的进行语言学习,这也是一个问题。
现有语言学习中主要被动方式学习主要采取真人面对面或在线教学、视频录播教学,强硬通过单词,句子,听力来被动学习,通过本方法类似母语,所听所见即是所学的方式,主动学习,自然而然的学会了外语。
专利(CN 105608944 A)提供了本发明为一种随机出题的程序在线考核系统,该系统包括题库管理模块、随机出题模块、程序自动判别模块、题目完成情况监测模块、代码浏览模块、成绩导出模块、数据库模块;题库管理模块为系统管理员提供题目录入功能;随机出题模块为系统管理员提供设置考核题目数与考核难度功能,并在用户登录时随机为用户分配题目进行考核;程序自动判别模块可在线判别用户针对某个题目提交的代码是否通过测试;题目完成情况监测模块可在考核期间为系统管理员提供用户登录IP的查看功能以及用户完成题目情况查看功能;代码浏览模块可供系统管理员查看用户提交的代码;成绩导出模块为系统管理员提供成绩导出功能;数据库模块为其他模块提供数据存储功能。该技术方案中,其具有随机出题模块,产生的试题都是预先在数据库中,但是不能根据用户的语言水平、学习进度进行出题,这样会导致不同语言水平的学习用户面对相同的测试,导致分数不真实,打击用户的学习信心。
专利(CN108010409A)提供了移动终端的教学系统,教师移动终端和学生移动终端,均包括壳体以及设置在所述壳体内部的处理器;所述教师移动终端的处理器包括存储模块、出题模块以及审阅模块;所述学生移动终端的处理器包括阅读模块和答题模块;在学生课桌上设置指纹签到元件;在教室内部与讲台正对的墙壁上设置影像传输元件;后台数据库,其通过无线网络分别连接所述第一处理器、第二处理器、指纹签到元件以及影像传输元件;信息交流平台,其通过无线网络分别连接所述教师移动终端、学生移动终端以及所述后台数据库。充分利用现有的网络资源,实现教学课件的共享和网络阅读,节省了印刷书籍和出试卷所浪费的纸张,节约资源。其中包括出题模块,通过设定不同种类的题型供教师选择并录入题目和答案解析,并将题目通过所述存储模块存入后台数据库中以供学生提取。其出题模块是预先由教师录入的,经过阶段性学习,由教师出题目。该专利同样存在着不能根据每个学生的学习进度、自身的学习水平进行出题,并不适合分阶段的对每个学生的学习进度,掌握的学习水平进行测试。
另外,不同语言水平的人其需要进行测试的题目的难度系统是有差别的,现有的出题系统都是提前将题目预先存入题库,产生的题目不能自动匹配当前的用户的自身水平,会导致测试结果不可靠,反映不出真实际的用户语言水平。
发明内容
基于现有语言学习技术中存在的缺陷,本发明提供一种能够自动评估用户的学习水平、能够自动产生测试题目的语言学习系统及其语言学习方法。
一种自动产生测试题目的语言学习方法,应用于至少包含有学习终端和服务器的学习系统,所述学习方法至少包括测试阶段,所述测试阶段至少包括以下步骤:
步骤S401:接收到来自用户选择测试的指令或者根据用户的学习时长自动启动测测的指令;
步骤S402:从学习数据库中搜索用户已学习内容;从关键词数据库中搜索用户已学习的关键词;从用户等级模块中获取当前用户的等级;
步骤S403:根据用户已学习内容、已学习关键词并结合当前用户等级生成测验题目;
步骤S404:将测试题目传输给学习终端进行输出显示并提供给用户进行测验;
所述步骤S403中,测试题目生成方法至少包括:
步骤S501:根据获取的关键词在学习数据库中查找与关键词匹配的用户已学习内容并产生至少一道题目;
步骤S502:根据获取的关键词在学习数据库中查找与关键词匹配的相关但用户并未学习的内容产并产生至少一道题目;
步骤S503:根据获取的关键词在图片数据库中查找与关键词匹配的图片并产生至少一道题目;
步骤S504:根据步骤S501、S502和S503产生的题目并结合当前的用户等级匹配生成多套测试题目;
步骤S505:输出多套测试题目。
具体地,测试阶段的方法步骤是通过测验模块进行的。测验模块的功能是负责产生测试题目提供给用户进行测试。
优选的,步骤S501或S502所产生的题目至少包括听力题目、选择题目、语法填空与改错题目、阅读理解、作文题目中的一种。或者其它能够对用户进行测试的题目类型。
优选的,步骤S503所产生的题目至少包括看图说话、看图作文、看图填空、看图改错中的一种。或者其它能够对用户进行测试的题目类型。
优选的,步骤S505产生的每套测试题目中,来自S501、S502、S503三者之间的权重比例包括:S501产生的题目比例为35~60%,S502产生的题目比例为20~40%,S503产生的比例为10~20%。
优选的,步骤S505产生的每套测试题目中,来自S501、S502、S503三者之间的权重比例包括:S501产生的题目比例为60%,S502产生的题目比例为30%,S503产生的比例为10%。
具体地,产生的题目比较符合用户,通过采用已经学过、未学过还有看图题目,使得用户能够根据试题中的看图题目等多种类,能够在给以文字化的视觉中,在以可视化效果提供给用户更直观的测试和学习。
优选的,关键词获取中涉及关键词的同义词、反义词、同音词、相似词语。
一种自动产生测试题目的语言学习方法,还包括学习阶段,学习阶段至少包括以下步骤:
步骤S101:接收到来自于学习终端的信息,对所接收到的信息进行识别并获取识别后的内容;
步骤S102:获取所需解码的内容;
步骤S103:对需要进行解码的内容进行分析处理获得多个关键词;
步骤S104:根据获得多个关键词与学习内容数据库进行匹配生成学习内容;
步骤S105:将学习内容传送给学习终端进行输出显示;
所述步骤S103中对解码内容的分析处理至少包括以下步骤:
步骤S103a:获得的步骤S102中的所需解码的内容;
步骤S103b:将所需解码的内容中的特征词分别与第一词库名单和第二词库名单进行比较;
步骤S103c:将出现在第二词库名单中的特征词去除,保留出现在第一词库名单的特征词;
步骤103d:结合用户等级,然后从保留的特征词中选择与用户等级匹配的多个关键词;
所述第一词库名单和第二词库名单中的特征词至少包含有预先设计的词或词组或句子。
优选的,步骤S101的信息至少包括文字、语音、视频、手势、手语、姿态中的一种或它们之间的组合。
优选的,关键词获取中涉及同义词、反义词、同音词、相似词语。
需要说明的是,本发明的关键词获取都涉及了同义词、反义词、同音词、相似词语。
优选的,本发明涉及接收到信息或内容以及处理过程中产生的信息至少包括文字、语音、视频、手势、手语、姿态中的一种或它们之间的组合。
一般情况下,用户群体各异,考虑不同的用户的年龄、国籍、性别、兴趣爱好、语言水平不相同,学习系统如果用相同的条件对待,则势必会产生分歧,语言水平高的学生不愿意学习较简单的单词、句子。语言水平低的学生如果学习难度大的内容,会对其学习信心造成打击,使其丧失学习兴趣。因此,需要考虑用户的年龄、国籍、性别、兴趣爱好、语言水平,设定用户的真是水平,根据用户的真实水平进行测试、学习。为此设计了用户等级的获取方法:
步骤S301:获取用户的初始背景信息;
步骤S302:根据用户的初始背景信息对用户进行初始测试;
步骤S303:根据用户的测试结果获得初始用户等级;
步骤S304:用户经过学习阶段进行自我学习;
步骤S305:对用户进行阶段测试;
步骤S306:根据用户的阶段测试结果获得用户等级;
步骤S307:判断用户是否继续学习,若继续学习,则执行步骤S304;若用户放弃学习,将用户等级保存,结束学习。
本发明提供一种自动产生测试题目的学习方法,包括学习阶段和测试阶段,学习阶段和测试阶段可以合为一体,也可以单独分开独立进行,二者阶段既可以相互衔接,也可以相互独立。例如:用户也可以仅采用学习阶段相关内容的学习而不进行测试,用户经过本发明提供的学习进行学习后,可以与自行网上寻找题目,高中英语、大学四六级真题进行测试等,检验学习水平。或者用户如果一定的语言水平,也可以开启测试模式直接进行测试。
用户能够完成学习阶段的学习后达到一定的语言水平,然后在测试阶段通过机器进行测试,检验学习效果,提高学习效率,提升用户的学习信心。
本发明还根据该学习方法设计了对应的语言学习系统,通过学习系统,用户可以进行自我学习,一种自动产生测试题目的语言学习系统的具体组成结构如下:
一种自动产生测试题目的语言学习系统,至少包括学习终端(1)和服务器(2);
学习终端(1)至少包括:
显示模块(101),用于对输入与输出的内容进行显示;通信模块(102),用于对学习终端内部模块之间的通信或学习终端与外部通信;摄像模块(103),用于对物体进行拍照或者摄像或人脸识别;语音模块(104),用于对语音的输入或者语音的输出;所述通信模块(102)与显示模块(101)、摄像模块(103)、语音模块(104)都电连接;
优选的,摄像模块可以为摄像头、TOF深度相机、3D相机、红外相机等。
所述服务器(2)至少包括:通信模块(202),用于对服务器内部模块之间的通信或服务器与外部通信;数据存储模块(203),用于对服务器(2)模块之间产生的信息进行存储或接收到的外部信息进行存储;识别模块(204),用于对接收到的信息进行识别;解码模块(205),用于对识别模块(204)经过识别后获得的内容进行解码;用户等级模块(206),用于获取用户等级;匹配模块(207),用于对解码模块经过解码后获得的内容与数据存储模块中内容进行匹配并获得匹配结果;语义分析模块(208),用于产生测试题目提供给用户进行测试;
所述通信模块(202)与数据存储模块(203)、识别模块(204)、解码模块(205)、用户等级模块(206)、匹配模块(207)、测验模块(208)电连接;
优选的,所述学习终端(1)还包括学习模式选择模块(105),学习模式选择模块(105)至少包括对话模块105a、训练模式(105b)、测试模式(105c);
测验模块用于根据用户所学的内容,阶段性的为用户准备用于测试的题目。例如,测验模块可以根据用户学习一段时间,例如学习时长超过5小时,测验模块可以自动启动出题的指令,将这段时间用户所学习的相关内容进行编辑,生成多道测试题目。或者用户可以手动从学习模式选择模块(105)中的测试模式(105c),启动测验模块,测验模块会根据用户的学习内容进行启动出题的指令,产生多道测试题目提供给用户进行测试。因此用户的测试可以随时随地的进行。
优选的,数据存储器模块(203)至少包括临时数据库(203a)、对话数据库(203b)、关键词数据库(203c)、图片数据库(203d)、学习内容数据库(203e)中的一种;
临时数据库(203a),用于存储服务器(2)各模块处理过程中产生的临时信息;
对话数据库(203b),用于存储与对话数据有关的内容;
关键词数据库(203c),用于存储产生的关键词、预设的关键词、第一词库名单、第二词库名单;
图片数据库(203d),用于存储各种图片,包括关键词对应的图片,用户拍照产生的图片、网络获取的图片;
学习内容数据库(203e),用于存储用户学习内容。
优选的,所述识别模块(204)至少包括图像识别(204a)、语音识别(204b)、视频识别(204c)、手语识别(204d)中的一种;
图像识别(204a),用于对接收到的图片数据进行识别;
语音识别(204b),用于对接收到的语音数据进行识别;
视频识别(204c),用于对接收到的视频数据进行识别;
手语识别(204d),用于对接收到的手语数据进行识别。
优选的,服务器(2)可设置于学习终端内或服务器(2)独立于学习终端,服务器(2)为本地服务器或云端服务器。
服务器(2)还包括系统评测模块(209),系统评测模块(209)分别与数据存储模块(203)和用户等级模块(206)电连接;
系统评测模块(209)用于用户经过一段时间的学习后,对用户的语言学习水平进行测试。
自动产生测试题目的语言学习系统还包括自我训练装置(3),自我训练装置(3)至少包括通信模块(301)、临时训练数据库(302)、深度学习训练分类模块(303),通信模块(301)与临时训练数据库(302)和深度学习训练分类模块(303)进行电直接或者间接电连接;通信模块(301)还与通信模块(202)、通信模块(102)进行电连接;
深度学习训练分类模块(303)包括学习教程(304)、词汇(305)、对话预料(306)并依据学习教程(304)、词汇(305)、对话预料(306)进行自我训练并将训练获得的结果存储到服务器(2)中的数据存储模块。自我训练装置(3)能够根据收集多种用户的学习内容,及时通过海量的网络进行搜索,及时更新用数据库,使得数据库的学习内容能够与时俱进,自我更新,无需人工干涉。
具体地,本发明的通信模块(102)、通信模块(202)、通信模块(301)之间互相进行通信,进行信息的双向传递。通信模块(102)能够与学习终端(1)的各个模块进行直接或者间接的电连接。通信模块(202)能够与服务器(2)的各个模块进行直接或者间接的电连接。通信模块(301)能够与自我训练装置中的各个模块进行直接或者间接的电连接。
通信模块(102)、通信模块(202)、通信模块(301)可以采用无线或者有线的方式进行通信,例如:LAN、WAN、无限带宽技术(Infiniband)、3G、4G、5G、蓝牙、wifi、RFID、NFC等通信手段进行通信。
优选的,服务器(2)和自我训练装置(3)可以设置于学习终端内,也可以独立于学习终端单独设立。
优选的,服务器(2)为本地服务器或云端服务器。
本发明的有益技术效果:
(1)真正随时随地进入学习,看到任何场景和文字,拍一拍即可进入学习;系统结合标准学习流程和深度机器学习教育内容,不管用户随手拍一拍还是选择标准学习,都可根据用户级别自动匹配适合当前水平的学习内容;基础学习单词和句子时,都通过图片识别来进行,强化知识与实物结合;建立基础学习标准化流程,并植入语音智能评分系统对学习内容进行评分;能够24小时不间断与学习和进行测验,测验内容贴合学习者当前水平;能够24小时随时随地发起与学习,无需预约或排课。
(2)本发明预设了第一词库名单和第二词库名单,第一词库名单专门用来存储记录对用户学习有价值的词、词组、句子、短语等,例如日常生活中的常用词汇、高频词汇等,第二词库名单专门用来存储记录对用户学习无价值的词、词组、句子、短语、文章等,例如日常生活中的生僻词,极少出现频率低的词、不文明词汇等。通过设计第一词库名单和第二词库名单,将提取的特征词与两个名单进行对比,找出有利于用户学习的关键词,这样能够提高学习效率。
(3)定义了用户等级,能够自动获取当前的用户等级,从而及时调整与用户难度系统相匹配的学习内容,增加学习兴趣,提高用户学习效率,使用户能够及时达到目标。
(4)本发明提供语言学习系统包括学习阶段和测试阶段,用户可以通过学习阶段的学习使其语言水平达到一定程度后,可以立即通过学习系统进行测试,检验学习效果,而不用再去找老师或者同学进行对话检验。通过本发明的语言学习系统,能够独立完成学习过程而无需老师或者家长的帮助。
(5)本发明提供的自我训练装置(3)能够根据收集多种用户的学习内容,及时通过海量的网络进行搜索,及时更新用数据库,使得数据库的学习内容能够与时俱进,自我更新,无需人工干涉。
(6)要求当前用户的学习内容比例在于当前用户等级学习的60~80%的内容中单词、词组、句子、图形、视频、语音的分数与用户等级对应的难度等级匹配,其余学习内容与当前用户等级相差在二级以内。如:用户等级为5级的用户,其学习内容的60~80%与难度等级处于40~50分之内,其余学习内容的难度等级处于可以为20~30,30~40,50~60,60~70。这样定义学习内容,能够提供学生学习的积极性,增强学生的学习信心,提高学习效率,能够使学生短期内达到事半功倍的效果。
(7)本发明的测验模块产生试题从综合三方面的来源,例如获取的关键词在学习数据库中查找与关键词匹配的相关且用户已学习的内容产并产生至少一道题目、学习数据库中查找与关键词匹配的相关但用户并未学习的内容产并产生至少一道题目和图片数据库中查找与关键词匹配的图片并产生至少一道题目。来自三者之间的权重比例包括:S501产生的题目比例为35~60%,S502产生的题目比例为20~40%,S503产生的比例为10~20%。一方面,加强用户已学习内容的考察可以检验用户经过学习后的学习效果,看用户学过的内容是否真正掌握。另一方面,增加用户未学习的题目可以考察用户对学习过的内容是否灵活掌握,能够学以致用,不仅要理解学过的语言,更主要的在适当的场合要会灵活运用。还有,试题中还增加一定比例的图片题目,如看图说话,看图填空,看图作文等,给予学习者提供可视化的学习效果,提供语言应用场景。
附图说明
以下附图仅对本发明做示意性说明和解释,并不限定本发明的范围。
图1是本发明提供的一种自动产生测试题目的语言学习方法的学习阶段的方法流程示意图;
图2是本发明提供的学习阶段的学习方法中解码模块对识别结果进行分析处理获得多个关键词的方法流程示意图;
图3是本发明提供的一种自动产生测试题目的学习方法中用户等级的获取方法流程示意图;
图4是本发明提供的一种自动产生测试题目的语言学习方法中测验模块的产生试题的流程示意图;
图5是本发明提供的一种自动产生测试题目的语言学习方法中的测验模块的产生试题的流程中步骤S403的方法流程图;
图6是本发明提供一种沉浸式语言学习系统的示意图:
6a-学习系统结构示意图,6b-学习模式选择模块结构示意图,6c-识别模块结构示意图,6d-数据存储模块结构示意图。
图中标号:
学习终端(1):显示模块(101)、通信模块(102)、摄像模块(103)、语音模块(104)、学习模式选择模块(105)、对话模式(105a)、训练模式(105b)、测试模式(105c);
服务器(2):通信模块(202)、数据存储模块(203)、识别模块(204)、解码模块(205)、用户等级模块(206)、匹配模块(207)、测验模块(208)、系统评测模块(209)、图像识别(204a)、语音识别(204b)、视频识别(204c)、手语是被(204d)、临时数据库(203a)、对话数据库(203b)、关键词数据库(203c)、图片数据库(203d)、学习内容数据库(203e);
自我训练装置(3):通信模块(301)、临时训练数据库模块(302)、深度学习训练分类模块(303)、学习教程(304)、词汇(305)、对话预料(306)。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式,在各图中相同的标号表示相同的部分。为使图面简洁,各图中的只示意性地表示出了与本发明相关部分,而并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。
在本文中,“示意性”表示“充当实例、例子或说明”,不应将在本文中被描述为“示意性”的任何图示、实施方式解释为一种更优选的或更具优点的技术方案。
具体实施例:
本发明提供一种沉浸式语言学习系统及其学习方法。
具体地,本发明包括提供的沉浸式语言学习系统可以用来提供给用户进行自我学习。
本发明提供的沉浸式语言学习系统,参见图6a至图6d至少包括学习终端(1)和服务器(2);
学习终端(1)至少包括:
显示模块(101),用于对输入与输出的内容进行显示;通信模块(102),用于对学习终端内部模块之间的通信或学习终端与外部通信;摄像模块(103),用于对物体进行拍照或者摄像或人脸识别;语音模块(104),用于对语音的输入或者语音的输出;通信模块(102)与显示模块(101)、摄像模块(103)、语音模块(104)电连接;
具体地,摄像模块可以为摄像头、TOF深度相机、3D相机、红外相机等。
服务器(2)至少包括:通信模块(202),用于对服务器内部模块之间的通信或服务器与外部通信;数据存储模块(203),用于对服务器(2)模块之间产生的信息进行存储或接收到的外部信息进行存储;识别模块(204),用于对接收到的信息进行识别;解码模块(205),用于对识别模块(204)经过识别后获得的内容进行解码;用户等级模块(206),用于获取用户等级;匹配模块(207),用于对解码模块经过解码后获得的内容与数据存储模块中内容进行匹配并获得匹配结果;测验模块(208),用于产生测试题目提供给用户进行测试。
通信模块(202)与数据存储模块(203)、识别模块(204)、解码模块(205)、用户等级模块(206)、匹配模块(207)、语义分析模块(208)电连接。
具体地,解码模块(205)分别与识别模块(204)、匹配模块(207)、用户等级模块(206)相连接;用户等级模块(206)分别与匹配模块(207)、测验模块(208)相连接、数据存储模块(203)相连接。
需要说明的是,以上连接关系仅是一种事例,具体的连接关系是可以改变的,其可以是两种模块直接电连接,或者通过其它模块进行间接的电连接,只要能够达到相互调用、相互通信即可。本实施例中的模块之间的连接关系并不限制本发明的学习系统的保护范围。
需要说明的是,本实施例中的连接关系均是指电连接,电连接为了保证模块之间的通信、相互调用。
服务器(2)还包括系统评测模块(209),用于用户经过一段时间的学习后,对用户的语言学习水平进行测试。
具体地,学习终端(1)还包括学习模式选择模块(105),学习模式选择模块(105)至少包括对话模块(105a)、训练模式(105b)、测试模式(105c)。
当用户开启学习终端需要进行自我学习时,用户通过学习模式选择模块选择训练模式(105b),此时,用户可以根据其提供的关键词或者学习系统自动提供的关键词内容从学习内容数据库输出相关内容进行学习,其输出内容既可以是文字,也可以是语音。将文字转化为语音的功能设置在语音模块中。
当用户开启学习终端需要进行对话模式时,用户通过学习模式选择模块选择对话模式(105a),此时,用户可以根据其提供的关键词或者学习系统自动提供的关键词内容从对话数据库中输出相关内容进行学习,其输出内容既可以是文字,也可以是语音。将文字转化为语音的功能设置在语音模块中。
测验模块用于根据用户所学的内容,阶段性的为用户准备用于测试的题目。例如,测验模块可以根据用户学习一段时间,例如学习时长超过5小时,测验模块可以自动启动出题的指令,将这段时间用户所学习的相关内容进行编辑,生成多道测试题目。或者用户可以手动从学习模式选择模块(105)中的测试模式(105c),启动测验模块,测验模块会根据用户的学习内容进行启动出题的指令,产生多道测试题目提供给用户进行测试,测验模块产生的多套测试题目提供给系统评测模块调用。因此用户的测试可以随时随地的进行。
测验题目既可以是语音、文字、图片,题型包括听力、选择、语法、改错、阅读等。
具体地,数据存储器模块(203)至少包括临时数据库(203a)、对话数据库(203b)、关键词数据库(203c)、图片数据库(203d)、学习内容数据库(203e)中的一种;
临时数据库(203a),用于存储服务器(2)各模块处理过程中产生的临时信息;
对话数据库(203b),用于存储与对话数据有关的内容;
关键词数据库(203c),用于存储产生的关键词、预设的关键词、第一词库名单、第二词库名单;
此处,传统的关键词提取算法将获取的信息进行识别处理,将处理的结果通过简单处理获得关键词,而不管关键词获取是否有利于学习者的学习,是否具有学习价值。如英文中,假设有语言片段出现多处“fuck”等带有不文明词汇,建设提取关键词不经过处理,则关键词会出现fuck等词汇,显然这种带有不文明词汇的单次显然不利于儿童的学习,该单词不具备教育价值。或者选取某一个生僻词作为关键词,这个生僻词在日常行为的过程中出现概率非常低,显然这类词汇也利于用户的学习。为此,本发明预设了第一词库名单和第二词库名单,第一词库名单专门用来存储记录对用户学习有价值的词、词组、句子、短语等,例如日常生活中的常用词汇、高频词汇等,第二词库名单专门用来存储记录对用户学习无价值的词、词组、句子、短语、文章等,例如日常生活中的生僻词,极少出现频率低的词、不文明词汇等。
图片数据库(203d),用于存储各种图片,包括关键词对应的图片,用户拍照产生的图片、网络获取的图片;
学习内容数据库(203e),用于存储用户学习内容;
具体地,识别模块(204)至少包括图像识别(204a)、语音识别(204b)、视频识别(204c)、手语识别(204d)中的一种;
图像识别(204a),用于对接收到的图片数据进行识别;
语音识别(204b),用于对接收到的语音数据进行识别;
视频识别(204c),用于对接收到的视频数据进行识别;
手语识别(204d),用于对接收到的手语数据进行识别。
具体地,服务器(2)可设置于学习终端内或服务器(2)独立于学习终端,服务器(2)为本地服务器或云端服务器。
服务器(2)还包括系统评测模块(209),系统评测模块(209)分别与数据存储模块(203)和用户等级模块(206)电连接;
具体地,沉浸式语言学习系统还包括自我训练装置(3),自我训练装置(3)至少包括通信模块(301)、临时训练数据库(302)、深度学习训练分类模块(303),通信模块(301)与临时训练数据库(302)和深度学习训练分类模块(303)进行电直接或者间接电连接;通信模块(301)还与通信模块(202)、通信模块(102)进行电连接;
深度学习训练分类模块(303)包括学习教程(304)、词汇(305)、对话预料(306)并依据学习教程(304)、词汇(305)、对话预料(306)进行自我训练并将训练获得的结果存储到服务器(2)中的数据存储模块。自我训练装置(3)能够根据收集多种用户的学习内容,及时通过海量的网络进行搜索,及时更新用数据库,使得数据库的学习内容能够与时俱进,自我更新,无需人工干涉。
具体地,本发明的通信模块(102)、通信模块(202)、通信模块(301)之间互相进行通信,进行信息的双向传递。通信模块(102)能够与学习终端(1)的各个模块进行直接或者间接的电连接。通信模块(202)能够与服务器(2)的各个模块进行直接电连接或者间接的电连接。通信模块(301)能够与自我训练装置中的各个模块进行直接或者间接的电连接。
通信模块(102)、通信模块(202)、通信模块(301)可以采用无线或者有线的方式进行通信,例如:LAN、WAN、无限带宽技术(Infiniband)、3G、4G、5G、蓝牙、wifi、RFID、NFC等通信手段进行通信。
具体地,服务器(2)和自我训练装置(3)可以设置于学习终端,也可以独立于学习终端单独设立。
具体地,本发明的学习系统由学习终端(1)至少包括处理器(CPU)、存储器,如硬盘,SSD固态硬盘、DDR3或DDR4内存,摄像头、通信芯片(如Wifi,4G模块)等,这些芯片可以集成到一块主板上,也可以分别集成多款主板上。还可以包括图形处理器(GPU)语音识别芯片、声卡(语音输入输出芯片)、麦克风。更具体,可以为当前手机、电脑、智能的可穿戴设备、游戏设备等。
服务器(2)可以包括处理器(CPU)、图形处理器(GPU)、存储器,如硬盘,SSD固态硬盘、DDR3或DDR4内存,语音识别芯片、声卡(语音输入输出芯片)、文字语音转化芯片、通信芯片(如Wifi,4G模块)等,这些芯片可以集成到一块主板上,也可以分别集成多款主板上。当然,服务器也可以只包括其中的一些芯片,只要能够满足功能就行。
自我训练装置(3)包括处理器(CPU)、图形处理器(GPU)、存储器,如硬盘,SSD固态硬盘、DDR3或DDR4内存,语音识别芯片、声卡(语音输入输出芯片)、文字语音转化芯片、通信芯片(如Wifi,4G模块)等,这些芯片可以集成到一块主板上,也可以分别集成多款主板上。其中为了提高效率,处理器可以采用ASIC专用人工智能芯片。
需要说明的是,本发明学习终端、服务器、自我训练装置等采用的学习阶段和对话阶段的各种方法,可以通过软件的方式集成嵌入到学习终端、服务器、自我训练装置中。使用的,直接调用就可以。例如,学习阶段和人机对话阶段的方法可以集成到学习终端中,也可以集成到服务器中。或者分别集成到学习终端和服务器中,只要方法能够运行即可满足要求。
需要说明的是,本发明学习终端、服务器、自我训练装置可以集成到一起,例如,可以将这些功能都集中到学习终端中,只需要学习终端既可以满足所有的要求。也可以自我训练装置集成中服务器中,服务器设置在云端,学习终端需要用服务器,直接通过操作学习终端调用云端服务器。
需要说明的是,本发明的学习终端、服务器、自我训练装置的硬件组成是多种做样的,其硬件可以根据功能订制,如可以将处理器和图形处理器集成到一起,甚至多个功能的芯片也可以利用FPGA或者ASIC集成到一起,都能够实现本发明的功能。
具体地,需要说明的是,本发明输出的学习内容和对话内容,其形式多种多样,既可以是文字、语音、图片、视频、手语、姿态等能够提供给用户进行学习的内容,但并不局限于这些内容。
本发明还提供了一种自动产生测试题目的语言学习方法,该学习方法既可以应用于本发明的学习系统也可以应用其它的语言学习系统,例如:学习机器、设备,例如:手机、电脑、智能手表、PDA等可以用于学习的设备。
具体地,本发明提供一种自动产生测试题目的语言学习方法包括两个独立的阶段:学习阶段和测试阶段:
学习阶段和测试阶段都能够单独成为一种学习方法,例如用户可以通过本发明的学习系统利用在学习阶段进行学习,学习达到一定水平后可以去找买题库或者书籍进行语言测试。
具体地,用户也可以通过报名参加培训学校后掌握一定的语言能力后通过与测试阶段与学习系统进行测试,检验学习者的学习水平。
具体地,用户可以通过本发明的学习系统利用在学习阶段进行学习,当用户达到一定的语言能力后,用户立即与学习系统进行测试练习。这样非常方便,而不用费时、费力的去找寻找题库进行测试或者报名参加培训学习。而且本发明从的测试题目能够结合当前用户的语言水平并且能够根据用户已学习的内容进行测试,达到巩固当前的学习环境。
具体地,一种自动产生测试题目的语言学习方法,参见图4至图5,包括测试阶段,测试阶段至少包括以下步骤:
步骤S401:接收到来自用户选择测试的指令或者根据用户的学习时长自动启动测试的指令;
步骤S402:从学习数据库中搜索用户已学习内容;从关键词数据库中搜索用户已学习的关键词;从用户等级模块中获取当前用户的等级;
步骤S403:根据用户已学习内容、已学习关键词并结合当前用户等级生成测验题目;
步骤S404:将测试题目传输给学习终端进行输出显示并提供给用户进行测验;
所述步骤S403中,测试题目生成方法至少包括:
步骤S501:根据获取的关键词在学习数据库中查找与关键词匹配的用户已学习内容并产生至少一道题目;
步骤S502:根据获取的关键词在学习数据库中查找与关键词匹配的相关但用户并未学习的内容产并产生至少一道题目;
步骤S503:根据获取的关键词在图片数据库中查找与关键词匹配的图片并产生至少一道题目;
步骤S504:根据步骤S501、S502和S503产生的题目并结合当前的用户等级匹配生成多套测试题目;
步骤S505:输出多套测试题目。
需要说明的是,测验模块的功能是负责产生测试题目提供给用户进行测试。
具体地,步骤S401中,测验模块接收到来自用户选择测试模块的指令,当用户通过学习系统进行学习一段时间后,用户想通过测试检测一下自身通过学习后的语言水平,因此用户此时通过学习模式选择模块进行选择测试模式,服务中的测验模块会接收到来自用户选择测试模式的指令,开启产生试题的流程。或者可以设定用户学习一段时间后,例如可以为3小时,5小时,10小时为一个时间段,系统自动启用测试模式,将指令传送给测试模块进行出题提供给用户进行测验。
具体地,步骤S501或S502所产生的题目至少包括听力题目、选择题目、语法填空与改错题目、阅读理解、作文题目中的一种。或者其它能够对用户进行测试的题目类型。
具体地,步骤S503所产生的题目至少包括看图说话、看图作文、看图填空、看图改错中的一种。或者其它能够对用户进行测试的题目类型。
具体地,步骤S505产生的每套测试题目中,来自S501、S502、S503三者之间的权重比例包括:S501产生的题目比例为35~60%,S502产生的题目比例为20~40%,S503产生的比例为10~20%。
优选的,本实施例中,如:步骤S505产生的每套测试题目中,来自S501、S502、S503三者之间的权重比例包括:S501产生的题目比例为60%,S502产生的题目比例为30%,S503产生的比例为10%。
本实施例中限定了产生试题来源比例,使其产生的题目比较符合用户,通过采用已经学过、未学过还有看图题目,使得用户能够根据试题中的看图题目等多种类,能够在给以文字化的视觉中,在以可视化效果提供给用户更直观的测试和学习。
具体地,需要说明的是,本发明的任一实施例中,关键词获取中可以涉及关键词的同义词、反义词、同音词、相似词语。
例如:假设获取的关键词为“聪明”,则对关键词进行扩展,同义词为“聪慧”、反应词为“笨拙、愚笨、愚蠢、拙笨”、相似词语为“灵活”等。
具体地,一种自动产生测试题目的语言学习方法,还包括学习阶段,学习阶段至少包括以下步骤:
参见图1,图1是本发明提供的一种沉浸式语言学习方法中学习阶段的学习方法流程示意图。
参见图1,图1是本发明提供的一种沉浸式语言学习方法中学习阶段的学习方法流程示意图。
步骤S101:接收到来自于学习终端的信息,对所接收到的信息进行识别并获取识别后的内容。具体地,学习终端将接收到的信息传送至识别模块,识别模块对所接收到的信息进行识别并获取识别后的内容提供解码模块进行解码;
步骤S102:获取所需解码的内容;
步骤S103:对需要进行解码的内容进行分析处理获得多个关键词。具体地,解码内容的分析处理通过解码模块来进行。
步骤S104:根据获得多个关键词与学习内容数据库进行匹配生成学习内容;
步骤S105:将学习内容传送给学习终端进行输出显示。
本发明提供的学习方法能够根据用户提供的信息及时将相关的学习内容传送给用户进行学习,如信息包括文字、语音、视频、手势、手语、姿态中的一种或它们之间的组合。因此如何根据用户信息寻找合适的关键词成为该学习方法的核心环节。
具体地,解码模块对信息进行分析处理获取关键词的步骤如下:
参见图2,步骤S103中解码模块对关键才进行解码至少包括以下步骤:
步骤S103a:获得的步骤S102中的所需解码的内容;
步骤S103b:将所需解码的内容中的特征词分别与第一词库名单和第二词库名单进行比较;
步骤S103c:将出现在第二词库名单中的特征词去除,保留出现在第一词库名单的特征词;
步骤103d:结合用户等级,然后从保留的特征词中选择与用户等级匹配的多个关键词;
所述第一词库名单和第二词库名单中的特征词至少包含有预先设计的词或词组或句子。
获取用户等级是非常关键的一个环节,每个人的学习起点都是不同的,因此系统需要学习的语言水平设定学习内容。获取用户等级,从而获得当前用户的学习水平是非常重要的。
步骤S104中,根据获得多个关键词与学习内容词数据库进行匹配生成学习内容,该过程将所获得的关键词在学习内容数据库中进行检索,找出符合当前用户的学习内容并结合用户等级,输出符合用户的学习内容提供给用户进行学习。需要说明的是,符合内容可以有多个,系统对不用的语言水平定义多个等级,例如分为1至9级用户,1级为初学者,10级为精通者,参见表1。在学习内容数据库中,将其涉存储的词、词组、短语、句子、听力片段等都进行分数设定,可以根据单词的字母个数、发音的难易、日常使用频率等进行分数评估,即定义难度等级,参见表1。例如:假设定义分数为1至100分,分为10分为一个等级,则分为10级,a:2分,an:2分,recommendations:50分,然后定义用户等级与学习内容数据中的单词分数相匹配。即1级的用户学习内容的60~80%的内容的分数要低于10分。为此,要求当前用户学习的难度等级与当前的用户等级的学习内容匹配度为60~80%,其余学习内容的难度等级与当前用户等级相差在二级以内。如:用户等级为5级的用户,其学习内容的60~80%与难度等级处于40~50分之内,其余学习内容的难度等级处于可以为20~30,30~40,50~60,60~70。这样定义学习内容,能够提供学生学习的积极性,增强学生的学习信心,提高学习效率,能够使学生短期内达到事半功倍的效果。
表1用户等级与难度等级匹配关系图
用户等级 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
难度等级 |
0~10 |
10~20 |
20~30 |
30~40 |
40~50 |
50~60 |
60~70 |
70~80 |
80~90 |
90~100 |
具体地,本发明的提供的学习方法能够自动获取或者用户选择获取自己目前的用户等级,用户等级与用户的实际语言水平挂钩。因此,需要考虑用户的年龄、国籍、性别、兴趣爱好、语言水平,设定用户的真是水平,根据用户的真实水平进行测试、学习。为此设计了用户等级的获取方法,用户等级的获取方法参见图3。
步骤S301:获取用户的初始背景信息。用户拿到学习机器,首先填写一个初始的用户信息,如年龄、国籍、性别、学历、专业、语言熟练程度等,系统会根据用户填写的相关信息,预估用户的需要进行测试的学习内容;
步骤S302:系统评测模块根据用户的初始背景信息对用户进行初始测试。依据背景信息,系统评测模块会从学习数据库中获取学习内容,组成多套测试题目,对用户进行测试;
步骤S303:根据用户的测试结果获得初始用户等级。对用户的测试结果的分数进行评估,获取用户的初始用户等级;
步骤S304:用户经过学习阶段进行自我学习。系统获知用户的初始等级后,用户的学习内容会根据用户的初始内容进行获取提供用户学习,保证难度适中,提升用户的兴趣,提高学习效率;
步骤S305:系统评测模块对用户进行阶段测试。当用户经过一段时间的学习后,如学习时间为3~5小时后,可以根据设定,系统会自动对用户进行测试,即根据用户学习阶段的内容,系统评测模块会从学习内容数据库中获取多套题目提供给用户进行测试。或者用户也可以同学学习评测模块(105)主动选择进行测试;
步骤S306:根据用户的阶段测试结果获得用户等级。当用户经过学习阶段进行学习后,根据用户的阶段测试结果,系统会根据用户的分数给予用户一定的评级,从而获取当前的用户等级;
步骤S307:判断用户是否继续学习,若继续学习,则执行步骤S304;若用户放弃学习,将当前用户等级保存,结束学习;
具体地,用户经过学习阶段的学习后,可以立即通过学习系统进行测试,检验学习水平;
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,而并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方案或变更,如特征的组合、分割或重复,均应包含在本发明的保护范围之内。