CN111223014A - 一种从大量细分教学内容在线生成细分场景教学课程的方法和系统 - Google Patents
一种从大量细分教学内容在线生成细分场景教学课程的方法和系统 Download PDFInfo
- Publication number
- CN111223014A CN111223014A CN201811411974.3A CN201811411974A CN111223014A CN 111223014 A CN111223014 A CN 111223014A CN 201811411974 A CN201811411974 A CN 201811411974A CN 111223014 A CN111223014 A CN 111223014A
- Authority
- CN
- China
- Prior art keywords
- user
- teaching
- scene
- semantic
- contents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000013528 artificial neural network Methods 0.000 claims description 29
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 239000000284 extract Substances 0.000 claims description 10
- 238000005065 mining Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims 1
- 230000011218 segmentation Effects 0.000 abstract description 8
- 238000007670 refining Methods 0.000 abstract 1
- 230000001502 supplementing effect Effects 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 32
- 238000012986 modification Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000001914 filtration Methods 0.000 description 7
- 230000006399 behavior Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000012896 Statistical algorithm Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000001680 brushing effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B9/00—Simulators for teaching or training purposes
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Educational Technology (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种在线教学方法和系统,可以自动地从大量细分内容生成符合用户当前细分场景的、具有一定教学逻辑的课程。其中,所述教学方法提取教学内容的语义信息和内容间的语义关系,收集用户的当前场景信息,结合用户的历史场景信息对当前的场景进行补充和细化,将这些场景信息与教学内容的语义信息进行匹配,根据所匹配内容的语义特征、内容间的语义关系、以及用户的使用历史和习惯将教学内容自动组合成具有一定内在教学逻辑的课程。
Description
技术领域
在线教育的方法和系统
背景技术
基于场景的教学是一种非常有效的教学方法,例如,在儿童英语的教学中,当儿童穿衣服时进行关于穿衣服的英语教学,或者当儿童吃饭时进行关于吃饭的英语教学,可以有效地加深学生对这些英语内容的理解,并且学生可以在当下立刻使用到这些英语进行练习。但是,现有方法在实际使用时均有诸多问题。现有方法分为两类,一是基于搜索的方法,利用各种搜索引擎可以将用户输入与被搜索内容做细分匹配,但这是一种文字匹配,并不利用被搜索内容与教学相关的语义信息,因此搜索结果只能以独立文档的方式呈现,搜索结果之间不具有教学逻辑,而且并不利用用户的场景逻辑。例如,用户在早上搜索教小孩“穿衣服”的英语,穿衣服本身是一个有时间顺序的事件,比如先穿内衣再穿外衣再穿鞋,然后叠被子刷牙,如果将这些内容以完整的具有顺序和教学逻辑的方式呈现,用户就可以立刻跟着这个课程学习和练习。但是搜索只会匹配关于“穿衣服”或“衣服”的文字,且所匹配文章中有的是句子教学,有的是词汇教学,有的是故事,用户需要在搜索结果中一个一个翻看,挑选其中自己需要的内容,非常没有效率。
现有的另一类方法是人工预先设定与场景相关的课程,利用规则进行系统输入和预设场景的匹配,这种方法的一个缺点是预设的场景内容并不一定符合用户的细分场景,比如穿衣服场景的内容虽然可以有前后顺序,但课程例句是穿毛衣,而用户当时的衣服是T恤,则教学与实际场景不符,但对所有细分场景进行预先设定需要太多人力。另外,用户的输入有限,通过规则直接匹配输入和预设场景不能利用输入的全部语义信息,因此可能匹配不到对用户有用的教学场景,比如,用户输入“空调”,教学内容中并没有此场景,但此输入表明用户大概率处于热的状态,关于夏天或热的教学内容均是用户当前可以学习的内容,更进一步,如果用户的地理位置和当前季节表明用户处于冷的地区,则关于热的内容不符合当前场景,而关于“暖风”或“暖气”的内容符合当前场景。使用规则和预定义场景定义这些复杂语义关系也需要太多人力。
同时,以上现有方法不能使用用户的历史输入逐步细化场景信息,比如用户最近输入过“开空调”,而当前输入为“穿衣服”,则在未有用户地理信息的情况下,该用户大概率处于夏天,给出的教学内容不应包含冬天的衣服。
例如CN104021326A提出了一种基于预设场景的英语教学方法和教具,该方法接受控制器的控制信息,当该信息为输出场景时,通过直接匹配判断是否存在对应的预设场景,处理不了细分场景,也无法从细分知识点生成课程。
又例如CN107391883A提出了一种采用SWRL语言将学习情景规则和知识关联关系转化为SWRL规则,应用SWRL规则设计学习知识路径和生成教学的方法。该方法可以利用本体规则将输入转化为语义信息,并同样使用本体规则得到教学内容,但本体规则需要人为定义,目前并没有可以大规模自动化建立准确的本体规则的方法,因此与匹配预设场景的方法类似,此方法更适用于匹配用户的粗分场景,只是将简单的文字匹配扩展到基于预设规则的匹配,且更适用于基于已有课程设计学习知识路径,不适用于将大量细分的知识点自动组合成课程。
又例如CN107038914A提出一种英语教学语言系统,在服务器中预置场景和已有教学课程的对应关系,根据用户对课程的选择生成假想场景的图像与用户的投影合成。该发明解决的是为用户制造模拟场景的问题,并不是根据用户实际场景生成课程的问题。
又例如CN106816054A提出了一种基于图象识别的教学方法,从图像中识别物体,并匹配与此物体相关的知识词条,这种方法与搜索类似,在搜索以前加入了图像识别物体一步,并不涉及语义分析过程和基于场景的教学内容生成过程。
又例如CN106202214A提出一种语义搜索学习平台,该发明仅是对于输入的直接检索,并不涉及语义分析过程和基于场景的教学内容生成过程。
又例如CN103353872B提出一种基于神经网络的教学内容推荐,其神经网络输入为以下9个特征数据:教学资源上传时间推荐度,教学资源下载推荐度,教学资源打分推荐度,基于用户协同过滤下载推荐度,基于用户协同过滤打分推荐度,基于项目协同过滤浏览推荐度,基于项目协同过滤下载推荐度,基于项目协同过滤打分推荐度,基于项目协同过滤浏览推荐度。输出为教学资源对用户的最终推荐度。虽然该方法不基于预设规则或搜索,但该方法是根据用户相似度、资源相似度、资源受欢迎程度做推荐,并不是为了提取用户场景信息或者生成教学内容。
考虑以上方法的局限性,本发明提出一种方法和系统,可以使用细分知识点生成满足用户细分场景且具有教学逻辑的课程。
发明内容
本发明提出一种在线教育的方法和系统,所述教学方法和系统提取教学内容的语义信息和内容间的语义关系,收集用户的当前场景信息,结合用户的历史场景信息对当前的场景信息进行补充和细化,将这些场景信息与教学内容的语义信息法进行匹配,根据所匹配内容的语义特征、内容间的语义关系、以及用户的使用历史和习惯将教学内容自动组合成具有内在教学逻辑的课程。
所述教学系统包含以下模块,其中各模块均为逻辑模块,可以集中式部署也可分布式部署:
1.所述系统包含一个客户端模块,此客户端模块包含以下子模块:
(1)一个用户界面,用户从此用户界面进行输入和操作展现的内容,此用户界面收到用户输入和触发的指令后,将请求发送给用户终端控制模块。
(2)一个用户场景收集模块,此模块收集除用户输入以外的用户场景信息。
(3)一个用户终端控制模块,此模块从用户界面接收请求数据,调用用户场景收集模块获得收集到的场景数据,将数据发送到用户请求处理模块,并将收到的返回发送到用户界面进行展现。
(4)一个用户操作收集模块,此模块收集用户在用户界面上对展现的教学内容的操作数据,用户终端控制模块定期将这些数据发送给用户请求处理模块。
2.所述系统包含一个服务器端模块,此服务器端模块包含以下子模块:
(1)一个教学内容库,存储预设的教学内容和特征。
(2)一个教学内容库语义分析模块,读取教学内容库的内容,提取教学内容的语义特征和内容间的语义关系。
(3)一个教学内容特征库,教学内容库语义分析模块将对教学内容的分析结果存入此教学内容特征库。
(4)一个用户请求处理模块,接收用户终端控制模块,调用其他模块对用户请求进行处理,并将处理结果返回给用户界面。
(5)一个场景数据语义分析模块,从用户请求处理模块传来的用户场景数据提取语义特征,将结果返回给用户请求处理模块,以及将结果写入用户历史场景库。
(6)一个用户场景历史库,保存用户请求、请求的语义信息和请求的时间。
(7)一个用户场景历史分析模块,对用户场景历史库中的数据进行挖掘,得到用户历史场景特征和规律,并将结果存入用户场景历史库。
(8)一个教学内容场景匹配模块,将用户请求处理模块传来的用户场景数据及其语义特征数据、结合用户历史场景库和用户学习历史库中的数据,与教学内容库及教学内容特征库中的数据进行匹配,获得满足当前场景的教学内容。
(9)一个教学内容组合模块,将教学内容根据教学内容的语义特征、教学内容之间的语义关系、当前场景信息和历史操作数据组合成具有内在教学逻辑的课程。
(10)一个教学内容摘要模块,接收组合后的具有教学逻辑的内容,对教学内容生成摘要便于展现。
(11)一个用户学习历史库,记录曾经返回给用户的教学内容、用户操作数据、以及用户操作历史特征。
(12)一个用户操作历史分析模块,对用户学习历史库中的历史返回内容、用户操作数据进行分析,提取用户学习历史操作的规律特征并将结果保存到用户学习历史库。
所述教学方法包含以下流程:
1.教学数据准备,此为定期执行的线下流程,包含以下步骤:
(1)对教学内容库中的内容使用统计或神经网络的方法进行语义分析,提取教学内容的语义特征,以及教学内容之间的语义关系。
(2)教学内容库语义分析模块将分析结果存入教学内容特征库。
2.处理请求和生成教学内容,此为用户触发的线上流程,包含以下步骤。
(1)用户从用户界面输入场景信息及触发请求给用户终端控制模块。
(2)用户终端控制模块调用用户场景收集模块收集用户场景数据。
(3)用户终端控制模块将用户输入和场景收集模块收集的场景数据发送给用户请求处理模块。
(4)用户请求处理模块调用用户输入语义分析模块提取用户场景的语义信息。
(5)用户请求处理模块调用教学内容场景匹配模块传入用户场景数据及其语义信息,教学内容场景匹配模块从用户历史场景库读取用户历史场景数据、从用户历史学习库读取用户历史学习数据,用规则、统计或神经网络的算法匹配用户细分场景的语义信息和教学内容库中的语义信息,得到符合当前场景的教学内容。
(6)用户请求处理模块调用教学内容组合模块,教学内容组合模块根据教学内容的语义特征、教学内容之间的语义关系、当前场景信息和历史操作数据,将符合当前场景的教学内容组合成具有教学逻辑的课程内容。
(7)用户请求处理模块调用教学内容摘要模块,对组合后的教学课程生成教学内容摘要,并将组合后的课程及其摘要返回给用户终端控制模块。
(8)用户请求处理模块将返回给用户的内容存入用户学习历史库。
(9)用户终端控制模块将课程内容和摘要中需要展示的部分返回给用户界面进行展示。
(10)在用户操作界面上的课程内容时,用户操作收集模块收集用户行为数据。
3.收集用户行为,此为定期执行的线上流程,包含以下步骤。
(1)用户终端控制模块将用户操作收集模块收集的数据发送给用户请求处理模块。
(2)用户请求处理模块将用户操作数据存入用户学习历史库。
4.分析用户场景历史,此为定期执行的线下流程,包含以下步骤:
(1)用户历史场景分析模块读取用户历史场景库,用统计或神经网络的方法提取用户场景规律和特征。
(2)用户历史场景分析模块将用户场景规律和特征存入用户历史场景库。
5.分析用户操作场景,此为定期执行的流程,包含以下步骤:
(1)用户操作历史分析模块读取用户学习历史库,用统计或神经网络的方法提起用户学习的规律和特征。
(2)用户操作历史分析模块将用户学习规律和特征存入用户学习历史库。
附图说明
图1:系统模块图
图2:教学数据准备流程步骤图
图3:收集用户行为流程步骤图
图4:分析用户场景历史流程步骤图
图5:分析用户操作场景流程步骤图
图6:处理请求和生成教学内容流程步骤图
具体实施方式
所述教学系统包含以下模块:
1.所述系统包含一个客户端模块,此客户端模块包含以下子模块:
(1)一个用户界面,用户从此用户界面进行输入和操作界面上展现的内容,此用户界面收到用户输入和触发的指令后,将请求发送给用户终端控制模块。具体来说,用户可以从此界面输入文字、图片、媒体、语音、或其他文件等并触发内容匹配请求、对界面展示的内容进行浏览、播放、输入文字、选择选项、进行手势操作、转发、输入语音和视频等操作。此用户界面模块可以是图形化或非图形化形式。
(2)一个用户场景收集模块,此模块收集除用户输入以外的用户场景信息。此模块可以调用此系统外的第三方场景数据和用户操作收集模块,如手机的内置地理位置收集模块或手机摄像头,获得场景和用户操作数据。
(3)一个用户终端控制模块,此模块从用户界面接收请求数据,调用用户场景收集模块获得收集到的场景数据,将请求和数据发送到用户请求处理模块,并将收到返回的展现部分返回给用户界面进行展现。以上客户端模块可以部署在个人电脑、手机及平板电脑等移动终端、智能手表或眼镜等可穿戴设备、以及机器人或电子玩具等智能电子产品或电器。
(4)一个用户操作收集模块,此模块收集用户在用户界面上对展现的教学内容的操作,将这些数据存入用户学习历史库。此模块可以部署在个人电脑、手机及平板电脑等移动终端、智能手表或眼镜等可穿戴设备、以及机器人或电子玩具等智能电子产品或电器。此模块可以调用此系统外的第三方场景数据和用户操作收集模块。
2.所述系统包含一个服务器端模块,此服务器端模块包含以下子模块:
(1)一个教学内容库,存储预设的教学内容和特征。该内容库的存在形式可以是但不限于以下形式:结构化数据库,非结构化数据库,文本文件,内存数据库等。此教学内容库中的每个内容对应一个知识点或多个知识点,每个内容的记录可以包含但不限于以下关于知识点的数据:文字讲解、音频、视频、预设难度、预设关键词、预设知识点类型、主题、在某主题中的顺序值、与其他内容的预设关系等。每个内容的记录也可以包含此内容的模板替换规则,模板替换规则即当此内容与所查询场景符合一定关系时,内容替换模板规定的内容可以被所查询的语义信息替换。此教学内容库的内容领域可以是但不限于以下适用于使用语义分析精准匹配场景的教学领域:外语教学、家长育儿知识教学、体育教学等。
(2)一个教学内容库语义分析模块,读取教学内容库的内容,提取教学内容的语义特征和内容间的语义关系。例如,教学内容的语义特征可以包括但不限于:词频统计、关键词、词向量、语言模型参数、难度、类型、所需学习时间等。内容间的语义关系包括但不限于:层级关系,时间先后关系,先后修关系,相关关系。例如,层级关系可以包括但不限于场景细分关系、类型细分关系等,其中场景细分关系如A是关于吃饭的英语,B是关于喝汤的英语,则B是A的子场景;类型细分关系如A是关于吃饭英语的讲解,B是关于吃饭英语的词组讲解,则B是A的子类型。
(3)一个教学内容特征库,教学内容库语义分析模块将对教学内容的分析结果存入此教学内容特征库。该内容特征库的存在形式可以是但不限于以下形式:结构化数据库,非结构化数据库,文本文件,内存数据库等。
(4)一个用户请求处理模块,接收用户终端控制模块,调用其他模块对用户请求进行处理,并将处理结果返回给用户界面。
(5)一个场景数据语义分析模块,从用户请求处理模块传来的用户场景数据提取语义特征,将结果返回给用户请求处理模块,以及将结果写入用户历史场景库。此模块也可以调用第三方语义提取服务获得语义特征。例如,从用户场景数据提取的语义特征可以包括但不限于:文本分词、对语音的识别、对图像或视频的识别和语义信息提取、调用第三方服务获得用户地理位置的天气数据等。
(6)一个用户场景历史库,保存用户请求、请求的语义特征和请求的时间。该用户场景历史库的存在形式可以是但不限于以下形式:结构化数据库,非结构化数据库,文本文件,内存数据库等。
(7)一个用户场景历史分析模块,对用户场景历史库中的数据进行挖掘,得到用户历史场景特征和规律,并将结果存入用户场景历史库。例如,用户历史场景特征可以包括但不限于:用户输入场景信息与时间或地点的关联度、用户常用的输入顺序等。
(8)一个教学内容场景匹配模块,将用户请求处理模块传来的用户场景数据及其语义特征数据、结合用户历史场景库和用户学习历史库中的数据,与教学内容库及教学内容特征库中的数据进行匹配,获得满足当前场景的教学内容。
(9)一个教学内容组合模块,接收教学内容标识并读取用户历史操作数据,将教学内容根据历史操作数据组合成具有内在教学逻辑的课程。例如,所述教学逻辑可以基于但不限于以下特征:内容间的语义关系如层级关系、相关关系、时间顺序关系、先修关系等;或者内容的特征数据如内容的类型、难度等级、所需学习时间、用户对该内容的操作统计量等;又或者当前用户的学习历史和操作习惯特征,如当前用户特别偏爱某种内容。此外当单个内容和当前场景信息符合单个内容的模板替换规则时,将此内容中需要替换的部分进行替换。
(10)一个教学内容摘要模块,接收组合后的具有教学逻辑的内容,对教学内容生成摘要便于展现。例如,教学内容的摘要可以包括但不限于:教学内容知识点类型、教学内容中的重点内容、教学内容的难度等级、所需学习时间、场景主题等。
(11)一个用户学习历史库,记录曾经返回给用户的教学内容、用户操作数据、以及用户操作历史特征。该用户学习历史库的存在形式可以是但不限于以下形式:结构化数据库,非结构化数据库,文本文件,内存数据库等。
(12)一个用户操作历史分析模块,对用户学习历史库中的历史返回内容、用户操作数据进行分析,提取用户学习历史操作的规律特征并将结果保存到用户学习历史库。本模块可以使用内置算法计算用户操作规律和特征,也可以调用第三方服务对用户历史操作数据分析和提取特征。
以上各模块均为逻辑模块,可以部署在同一媒介上,也可以部署在不同媒介上。每个模块均可部署单个或多个实例。当部署在不同媒介的模块互相调用时,它们的通讯媒介可以是但不限于有线网络、无线网络、蓝牙、ibeacon等。
所述教学方法包含以下流程:
1.教学数据准备,此为定期执行的线下流程,包含以下步骤:
(1)对教学内容库中的内容使用规则、统计或神经网络的方法进行语义分析,提取教学内容的语义特征,以及教学内容之间的语义关系。内容的语义特征可以使用但不限于以下算法计算:例如,可以对内容分词,使用TF-IDF算出内容的关键词、使用word2vec词嵌入算法算出字和词的向量、使用主题模型算出的内容主题的向量表示、使用隐马可夫算法或神经网络算法建立的语言模型参数、使用统计或神经网络的算法对内容做的词性标注、语义标注和句法标注等;内容的语义特征还可以是难度值或知识点类型,例如在英语教学中,一篇文章中低频词越多视为越难,又例如根据中英文、数字、特殊字符的出现频率判断某段知识点为句子讲解、词语讲解、公式推导等,又例如内容越长、难度越高视为所需时间最长;还可以使用有监督学习如神经网络算法训练知识点的语义特征,使用此类有监督学习可以提取更多可能的语义特征,如该知识点是否属于背景介绍、应用、精讲、参考文献等,此类有监督学习训练时的输入为一个知识点的全部内容或用其他方法提取的语义特征,输出为该内容在某个所需语义特征上符合程度的打分。内容间的语义关系可以使用但不限于以下算法计算:如使用规则定义含有特定关键词的内容具有特定关系;又例如使用统计的算法计算层级关系,假设A包含B的大多数关键词,但B的某一个相对高频关键词不是A的关键词,则视B为A的子场景;假设A和B的关键词大体相同,但A属于概念讲解类型内容,B属于词组讲解类型内容,则B属于A的子类型;又如使用统计的算法计算时间先后关系,对大量语料统计发现同一文档中B的关键词通常出现在A的关键词之后,则记录B为A的一个时间后续内容;又如使用统计的算法计算先修后修关系,假设某个词词频较低,在内容A中少量出现,在内容B中相对更多,则视B为A的先修内容,即该词可能为一个独立知识点,先阅读B有助于理解A中与该词相关的部分;又如用文本向量的夹角余弦值或词向量的平均夹角余弦算出的文本距离计算内容的相关程度,比如“堆沙堡”和“吃海鲜”是具有语义相关性的两个内容,它们都与海边相关,但不具有层级、时间先后、或先后修关系,但具有语义关系;内容间语义关系的计算也都可以使用有监督机器学习如神经网络计算,此类有监督机器学习的输入数据包括两个内容的全部数据或部分数据、以及用其他方法算出的两个内容的语义特征,输出为对两个内容间的某种关系强度比如如层级关系强度的打分。
(2)教学内容库语义分析模块将分析结果存入教学内容特征库。
2.处理请求和生成教学内容,此为用户触发的线上流程,包含以下步骤。
(1)用户从用户界面输入场景信息及触发请求给用户终端控制模块。
(2)用户终端控制模块调用用户场景收集模块收集用户场景数据。
(3)用户终端控制模块将用户输入和场景收集模块收集的场景数据发送给用户请求处理模块。
(4)用户请求处理模块调用用户输入语义分析模块提取用户场景的语义信息。所述提取方法可以包括但不限于:对文字输入的分词、对字和词语义标注、对语音输入通过神经网络进行语音识别、对图片通过神经网络进行识别和语义信息提取、对视频通过神经网络进行识别和语义信息提取。其中,对图片或视频处理时,可以进行但不限于物体识别、语义分割、场景识别、图片转换为文字描述等。
(5)用户请求处理模块调用教学内容场景匹配模块传入用户场景数据及其语义信息,教学内容场景匹配模块从用户历史场景库读取用户历史场景数据、从用户历史学习库读取用户历史学系数据,用规则、统计或神经网络的算法匹配用户细分场景的语义信息和教学内容库中的语义信息,得到符合当前场景的教学内容。其中语义匹配过程使用算法可以是但不限于:如基于词向量相关度的算法,如将用户场景的词向量与每个内容的关键词的词向量的加权平均余弦值作为二者相关度,其中对于历史场景数据,根据历史场景时间久远程度减小历史数据和内容的相关度在平均值中的权值,也可以根据历史场景数据和最新场景数据的相关程度决定该历史数据是否舍弃;又例如基于系统挖掘的内容间关系根据一定规则获得匹配内容,比如大量语料中B的关键词和A的关键词通常同时发生,则A被匹配时,B也认为同时匹配;又如基于系统挖掘的用户历史场景的语义特征根据一定规则获得匹配内容,比如若用户的输入包含语义特征X与用户的输入包含语义特征Y强相关,则当用户的输入仅包含语义特征X时,将Y也加入其语义特征;又如基于神经网络的相关度算法,神经网络的输入为历史和当前用户场景数据和特征,以及某个内容的全部内容或者部分内容以及语义特征,神经网络的输出为当前场景和此内容的相关度。不失一般性地,在训练神经网络的过程中,可以将真实历史数据中用户在对教学内容的感兴趣程度,如浏览时间或评分,作为该内容和用户在获得该内容以前的场景数据的相关度,并将这些场景输入数据和由此获得的相关度作为训练集的输入和输出。
(6)用户请求处理模块调用教学内容组合模块,教学内容组合模块根据教学内容的语义特征、教学内容之间的语义关系,将符合当前场景的教学内容组合成具有教学逻辑的课程内容。例如,教学内容组合模块可以使用预置模板生成具有内在教学逻辑的课程。所述预置模板可以是但不限于:
具有场景层级关系的内容以预置模板组合,比如当A和B同时符合当前场景且B是A的细分场景,A排在B之前,该模板根据层级关系包含语义描述,如“一般地说:<A场景内容>下面是一些例子:<B场景内容>”;或者具有时间顺序关系的场景按顺序组合,如“叠被子”通常发生在“穿衣服”之后,则先显示“穿衣服”的内容,后显示“叠被子”的内容。或者对于难易值不同的内容,按照某种预置顺序显示,如简单的内容在前;或者具有语义关系的内容作为推荐栏目内容,根据语义相关度排序;或者对于有先修关系的内容,如果都符合当前场景,先修内容在前显示,如果符合当前场景的内容的先修内容不符合当前场景,则将该先修内容作为推荐先修栏目内容;或者同时可以使用用户历史操作数据对教学内容进行调整,例如但不限于,去除用户过去曾经阅读过的教学内容、在匹配到内容很多时优先选择和用户学习过的内容相关的内容、优先显示用户画像表明的用户可能感兴趣的内容等。
又例如,所述教学内容组合模块还可以使用神经网络的方法生成教学内容。比如该神经网络训练时的输入为一个由教学内容组成的序列,输入为这些教学内容的顺序。
当单个内容和当前场景信息符合单个内容的模板替换规则时,教学内容组合模块将此内容中需要替换的部分进行替换,例如,一个简单基于匹配的模板可以规定,如果内容中含有字符串A,所查询场景信息包含字符串X且X是B、C、D之一,则此内容中的A被X替换;又例如,一个基于语义关系的模板可以规定,如果内容中有动词V和该动词的宾语O1,而匹配此内容的查询场景信息包含动词V和该动词的宾语O2,则此内容中的O1被O2替换。
(7)用户请求处理模块调用教学内容摘要模块,对组合后的教学课程生成教学内容摘要,并将组合后的课程及其摘要返回给用户终端控制模块。其中对重点内容的文字摘要获得可以使用现有的基于统计或神经网络的段落摘要算法。其他摘要信息如知识点类型、学习时间等均可以根据内容的数据机器特征数据通过统计的方法计算。
(8)用户请求处理模块将返回给用户的内容存入用户学习历史库。
(9)用户终端控制模块将课程摘要返回给用户界面进行展示。
(10)在用户操作界面上的课程内容时,用户操作收集模块记录用户行为数据。
3.收集用户行为,此为定期执行的线上流程,包含以下步骤。
(1)用户终端控制模块将用户操作收集模块收集的数据发送给用户请求处理模块。
(2)用户请求处理模块将用户操作数据存入用户学习历史库。
4.分析用户场景历史,此为定期执行的线下流程,包含以下步骤:
(1)用户历史场景分析模块读取用户历史场景库,提取用户场景规律和特征,所述规律和特征可以包括但不限于:例如用户输入场景信息与时间或地点的关联度、用户常用的输入顺序等。用户场景规律和特征的算法可以是但不限于:基于统计的算法,如在使用关联规则算法计算不同场景信息及语义特征的关联度;又如基于神经网络的算法,如使用历史场景特征使用LSTM神经网络预测之后出现的语义特征。
(2)用户历史场景分析模块将用户场景规律和特征存入用户历史场景库。
5.分析用户操作场景,此为定期执行的流程,包含以下步骤:
(1)用户操作历史分析模块读取用户学习历史库,用统计或神经网络的方法提起用户学习的规律和特征。获得用户学习的规律和特征的算法可以是但不限于:统计用户学习的内容类型,或者根据协同过滤、关联关系、或神经网络计算用户可能感兴趣的内容等。
(2)用户操作历史分析模块将用户学习规律和特征存入用户学习历史库。
Claims (5)
1.一种生成在线教学课程的教学系统,其特征在于,所述系统包括教学内容库语义分析模块、客户端、用户场景语义分析模块、用户场景历史分析模块、用户学习历史分析模块、教学内容场景匹配模块、教学内容组合模块,其中:
教学内容库语义分析模块对教学内容库中的内容进行语义分析,提取教学内容的语义特征,以及教学内容之间的语义关系;
客户端输入和收集用户的场景数据、产生生成教学内容的请求、收集用户操作数据;
用户场景语义分析模块使用统计或神经网络算法从用户场景数据提取细分场景的语义信息;
用户场景历史分析模块对用户场景历史数据进行挖掘,得到用户历史场景特征和规律;
用户学习历史分析模块对用户操作历史数据进行分析,得到用户学习的特征和规律;
教学内容场景匹配模块用统计或神经网络的方法匹配用户细分场景的语义信息和教学内容库中的语义信息,得到符合当前细分场景的教学内容;
教学内容组合模块根据教学内容的语义特征和教学内容间的语义关系、当前场景信息和历史操作数据生成具有教学逻辑的课程内容。
2.一种生成在线教学课程的方法,其特征在于,所述方法包含以下步骤:
对教学内容库中的内容进行语义分析,提取教学内容的语义特征,以及教学内容之间的语义关系;
输入和收集用户场景数据;
用统计或神经网络算法提取用户场景数据的语义信息;
用统计或神经网络的算法匹配用户细分场景的语义信息和教学内容的语义信息,得到符合当前场景的教学内容;
根据教学内容的语义特征和教学内容之间的语义关系、当前场景信息和历史操作数据将符合当前场景的教学内容组合成具有教学逻辑的课程内容。
3.如权利要求2所述生成在线教学课程的方法,其特征还在于:
在输入和收集用户场景数据之后,记录用户场景历史并定期分析用户历史场景的特征和规律;
在匹配用户细分场景的语义信息和教学内容库中的语义信息时,使用用户历史场景数据及其特征和规律作为匹配算法的部分输入,提高对当前场景匹配的准确度。
4.如权利要求2所述生成在线教学课程的方法,其特征还在于:
在客户端收集用户操作历史并定期记录;
定期分析用户操作历史,提取其特征和规律;
在使用细分教学内容生成教学课程时,利用用户操作记录调整课程的生成使其符合用户特征。
5.如权利要求2所述生成在线教学课程的方法,其特征还在于:
在生成具有教学逻辑的课程内容时,如果单个内容的语义特征和当前场景的语义信息符合单个内容的模板替换规则,教学内容组合模块将此内容中需要替换的部分进行替换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811411974.3A CN111223014B (zh) | 2018-11-26 | 2018-11-26 | 一种从大量细分教学内容在线生成细分场景教学课程的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811411974.3A CN111223014B (zh) | 2018-11-26 | 2018-11-26 | 一种从大量细分教学内容在线生成细分场景教学课程的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111223014A true CN111223014A (zh) | 2020-06-02 |
CN111223014B CN111223014B (zh) | 2023-11-07 |
Family
ID=70828782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811411974.3A Active CN111223014B (zh) | 2018-11-26 | 2018-11-26 | 一种从大量细分教学内容在线生成细分场景教学课程的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111223014B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881347A (zh) * | 2020-07-16 | 2020-11-03 | 北京师范大学 | 基于场景的学习服务推送方法、终端及存储介质 |
CN111931107A (zh) * | 2020-07-31 | 2020-11-13 | 上海博泰悦臻电子设备制造有限公司 | 数字公民体系构建方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040078204A1 (en) * | 2002-10-18 | 2004-04-22 | Xerox Corporation | System for learning a language |
CN101501741A (zh) * | 2005-06-02 | 2009-08-05 | 南加州大学 | 互动式外语教学 |
CN103729476A (zh) * | 2014-01-26 | 2014-04-16 | 王玉娇 | 一种根据环境状态来关联内容的方法和系统 |
CN107633005A (zh) * | 2017-08-09 | 2018-01-26 | 广州思涵信息科技有限公司 | 一种基于课堂教学内容的知识图谱构建、对比系统及方法 |
CN108830764A (zh) * | 2018-09-04 | 2018-11-16 | 乔新霞 | 英语教学方法、系统和电子终端 |
-
2018
- 2018-11-26 CN CN201811411974.3A patent/CN111223014B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040078204A1 (en) * | 2002-10-18 | 2004-04-22 | Xerox Corporation | System for learning a language |
CN101501741A (zh) * | 2005-06-02 | 2009-08-05 | 南加州大学 | 互动式外语教学 |
CN103729476A (zh) * | 2014-01-26 | 2014-04-16 | 王玉娇 | 一种根据环境状态来关联内容的方法和系统 |
CN107633005A (zh) * | 2017-08-09 | 2018-01-26 | 广州思涵信息科技有限公司 | 一种基于课堂教学内容的知识图谱构建、对比系统及方法 |
CN108830764A (zh) * | 2018-09-04 | 2018-11-16 | 乔新霞 | 英语教学方法、系统和电子终端 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881347A (zh) * | 2020-07-16 | 2020-11-03 | 北京师范大学 | 基于场景的学习服务推送方法、终端及存储介质 |
CN111881347B (zh) * | 2020-07-16 | 2022-04-15 | 北京师范大学 | 基于场景的学习服务推送方法、终端及存储介质 |
CN111931107A (zh) * | 2020-07-31 | 2020-11-13 | 上海博泰悦臻电子设备制造有限公司 | 数字公民体系构建方法、系统及存储介质 |
CN111931107B (zh) * | 2020-07-31 | 2024-03-22 | 博泰车联网科技(上海)股份有限公司 | 数字公民体系构建方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111223014B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009228B (zh) | 一种内容标签的设置方法、装置及存储介质 | |
CN105824959B (zh) | 舆情监控方法及系统 | |
CN105068661B (zh) | 基于人工智能的人机交互方法和系统 | |
US8312022B2 (en) | Search engine optimization | |
US10180979B2 (en) | System and method for generating suggestions by a search engine in response to search queries | |
CN112131472B (zh) | 信息推荐方法、装置、电子设备和存储介质 | |
CN101346718A (zh) | 用于向用户提供选定内容项的方法 | |
CN103455487B (zh) | 一种搜索词的提取方法及装置 | |
CN105095187A (zh) | 一种搜索意图识别方法及装置 | |
CN110430476A (zh) | 直播间搜索方法、系统、计算机设备和存储介质 | |
WO2019011936A1 (en) | IMAGE EVALUATION METHOD | |
CN112989208B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN115964560B (zh) | 基于多模态预训练模型的资讯推荐方法及设备 | |
CN101957825A (zh) | 基于网页中图像、视频内容的图像搜索方法 | |
CN115114395A (zh) | 内容检索及模型训练方法、装置、电子设备和存储介质 | |
CN113704507A (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN112231554A (zh) | 一种搜索推荐词生成方法、装置、存储介质和计算机设备 | |
CN111223014B (zh) | 一种从大量细分教学内容在线生成细分场景教学课程的方法和系统 | |
CN113407775A (zh) | 视频搜索方法、装置及电子设备 | |
Goyal et al. | A Review on Different Content Based Image Retrieval Techniques Using High Level Semantic Feature | |
CN110609950A (zh) | 一种舆情系统搜索词推荐方法及系统 | |
CN115269961A (zh) | 内容搜索方法以及相关设备 | |
CN111506754B (zh) | 图片检索方法、装置、存储介质及处理器 | |
KR102279125B1 (ko) | 취향필터에 기반한 추천 정보 제공 단말 및 장치 | |
CN116521937A (zh) | 视频表单的生成方法、装置、设备及存储介质、程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |