发明内容
本发明提供一种云教育平台的数据搜索方法及系统,以解决上述问题。
本发明提供一种云教育平台的数据搜索方法。上述方法包括以下步骤:专题数据提取服务器无限循环遍历教学数据存储器内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据,并将专题数据存储至专题数据存储器;索引数据处理服务器无限循环遍历专题数据存储器内的专题数据,并根据专题数据生成专题数据索引表;索引数据处理服务器根据专题数据索引表,按照第二规则生成元数据索引表及按照第三规则生成词句数据索引表;当用户进行数据搜索时,查询服务器根据用户输入的查询信息至索引数据处理服务器依次查询元数据索引表及词句数据索引表,以获得初始查询结果,查询服务器根据评估算法及初始查询结果得到最终查询结果。
本发明还提供一种云教育平台的数据搜索系统,包括教学数据存储器、专题数据提取服务器、专题数据存储器、索引数据处理服务器以及查询服务器。专题数据提取服务器连接教学数据存储器及专题数据存储器,索引数据处理服务器连接专题数据存储器及查询服务器。其中,专题数据提取服务器,用于无限循环遍历教学数据存储器内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据,并将专题数据存储至专题数据存储器。索引数据处理服务器,用于无限循环遍历专题数据存储器内的专题数据,并根据专题数据生成专题数据索引表。索引数据处理服务器,用于根据专题数据索引表,按照第二规则生成元数据索引表及按照第三规则生成词句数据索引表。当用户进行数据搜索时,查询服务器根据用户输入的查询信息至索引数据处理服务器依次查询元数据索引表及词句数据索引表,以获得初始查询结果,查询服务器根据评估算法及初始查询结果得到最终查询结果。
相较于先前技术,根据本发明提供的云教育平台的数据搜索方法及系统,专题数据提取服务器按照第一规则获得专题数据,并将专题数据存储至专题数据存储器,如此通过专题数据的提炼,提高了数据的查询效率。另外,当用户进行数据搜索时,查询服务器根据用户输入的查询信息至索引数据处理服务器依次查询元数据索引表及词句数据索引表,以获得初始查询结果,查询服务器根据评估算法及初始查询结果得到最终查询结果。如此,通过依次查询元数据索引表及词句数据索引表,提高了初始查询结果的命中率,而且,再根据评估算法及初始查询结果获取最终查询结果,大大提高了查询的准确性。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1所示为根据本发明的较佳实施例提供的云教育平台的数据搜索方法的流程图。如图1所示,本发明的较佳实施例提供的云教育平台的数据搜索方法包括步骤101~104。
于步骤101,专题数据提取服务器无限循环遍历教学数据存储器内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据,并将所述专题数据存储至专题数据存储器。
于本实施例中,教学数据存储器存储云教育平台上的教学数据。具体而言,云教育平台上的老师会将教学课件存储至教学数据存储器的教学课件专区,然后,老师在授课时实时录制的视频亦可存储至教学数据存储器的教学视频专区。学生在线听课,并在听完课之后给老师评分,评分结果可存储至教学数据存储器的学生评分专区。老师布置作业,并将作业存储至教学数据存储器的学生作业专区。学生完成作业,老师例如通过云教育平台批阅后,将作业得分存储至教学数据存储器的作业得分专区。此外,老师亦会总结本节课程的主要内容,并输入相应的关键词作为元数据。其中,云教育平台会为每节课程生成一个全局唯一的编号,用于标识该节课程的所有资源(例如,课件、视频、评分、作业、得分、元数据)。举例而言,若老师A准备“信息系统的生命周期”的课程,当老师A制作教学课件并上传至教学数据存储器后,云教育平台会为该课件产生一个全局唯一的编号GUID:a1484645-786e-4f7e-bc09-0ecf36add696,该教学课程之后产生的教学视频、学生评分、学生作业、作业得分、元数据等教学数据都会采用a1484645-786e-4f7e-bc09-0ecf36add696作为GUID编号,以便于专题数据整理。
于本实施例中,专题数据提取服务器无限循环遍历教学数据存储器内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据的过程为:专题数据提取服务器无限循环遍历教学数据存储器内的数据,获取数据的GUID,并比对GUID是否存在于GUID列表,若不存在,则获取GUID对应的数据归档为专题数据。具体而言,专题数据提取服务器维护GUID列表,若专题数据提取服务器在教学数据存储器内获取的数据GUID存在于GUID列表,则说明该数据已经被提取,如果该数据的GUID未存在于GUID列表中,则说明该数据未被提取,此时,专题数据提取服务器将教学数据存储器内的该GUID对应的教学数据均提取出来,并归档至一个静态文件,形成一条专题数据,且将该专题数据存储于专题数据存储器。同时,完成该GUID对应的教学数据的提取后,专题数据提取服务器会将该GUID更新至其维护的GUID列表。于此,每个专题数据例如包括编号GUID、教学课件、教学视频、学生评分、学生作业、作业得分、元数据等教学数据。
于步骤102,索引数据处理服务器无限循环遍历所述专题数据存储器内的专题数据,并根据所述专题数据生成专题数据索引表。
于本实施例中,专题数据索引表包括序号、专题GUID、物理位置、元数据及词句数据等内容。具体而言,索引数据处理服务器无限循环遍历专题数据存储器内的专题数据,并比对专题数据的GUID是否存在于专题数据索引表中,若存在,说明此专题数据已被提炼至专题数据索引表中,若不存在,则说明该专题数据尚未被提炼至专题数据索引表中,此时需要将该专题数据的相关信息加入专题数据索引表。于此,专题数据索引表例如表1所示。
表1
于表1中,序号表示专题数据索引表内各个索引信息的编号,专题GUID即为教学数据GUID,物理位置表示相关专题数据在专题数据存储器的磁盘目录,元数据是老师输入的关键词,词句数据是通过将教学数据的所有文本内容分词,并将重复出现的次数达到一定预设值的词句提炼得到的。关于词句数据的提炼在本领域是常用的技术手段,故于此不再赘述。
于步骤103,索引数据处理服务器根据所述专题数据索引表,按照第二规则生成元数据索引表及按照第三规则生成词句数据索引表。
于本实施例中,索引数据处理服务器根据专题数据索引表,按照第二规则生成元数据索引表的过程为:索引数据处理服务器依次遍历专题数据索引表中所有的元数据,将相同的元数据组织到一个元数据索引项中,其中,元数据索引项包括元数据及其所对应的索引位置。另外,索引数据处理服务器根据专题数据索引表,按照第三规则生成词句数据索引表的过程为:索引数据处理服务器依次遍历专题数据索引表中所有的词句数据,将相同的词句数据组织到一个词句数据索引项中,其中,词句数据索引项包括词句数据及其所对应的索引位置。
举例而言,根据表1所示的专题数据索引表可生成表2所示的元数据索引表及表3所示的词句数据索引表。
序号 |
元数据 |
索引位置 |
1 |
生命周期 |
1、2 |
2 |
立项 |
1 |
3 |
开发 |
1、2 |
4 |
运维 |
1、2 |
5 |
消亡 |
1 |
6 |
需求 |
2 |
7 |
测试 |
2 |
8 |
产品生命 |
3 |
9 |
形成 |
3 |
10 |
成长 |
3 |
11 |
成熟 |
3 |
12 |
衰退 |
3 |
表2
其中,于表2中,序号表示元数据索引表中各个索引信息的编号,元数据即专题数据索引表中记录的元数据,索引位置表示相应的元数据在专题数据索引表中的对应的序号。
1 |
概念形成 |
1 |
2 |
需求分析 |
1 |
3 |
问题定义 |
2 |
4 |
黑盒测试 |
2 |
5 |
市场淘汰 |
3 |
6 |
营销生命 |
3 |
7 |
生命周期 |
3 |
表3
其中,于表3中,序号表示词句数据索引表中各个索引信息的编号,词句数据即专题数据索引表中记录的词句数据,索引位置表示相应的词句数据在专题数据索引表中的对应的序号。
于步骤104,当用户进行数据搜索时,查询服务器根据用户输入的查询信息至所述索引数据处理服务器依次查询所述元数据索引表及所述词句数据索引表,以获得初始查询结果,所述查询服务器根据评估算法及所述初始查询结果得到最终查询结果。
于本实施例中,当用户对云教育平台的数据进行搜索时,用户会输入查询信息(例如,关键字),查询服务器根据用户输入的查询信息至索引数据处理服务器依次查询元数据索引表及词句数据索引表。举例而言,若用户输入的查询信息为:生命周期,则查询服务器至索引数据处理服务器查询元数据索引表可获得初始查询结果如表4所示,查询词句数据索引表可获得初始查询结果如表5所示。
表4
表5
之后,查询服务器根据评估算法及初始查询结果得到最终查询结果。于此,评估算法为:根据每个专题数据对应的评分和得分获得平均评分和平均得分,每个专题数据的评估值等于所述专题数据的平均评分与第一比例的乘积和平均得分与第二比例的乘积的和值,其中,所述第一比例与所述第二比例的和值为1。
以初始查询结果为表4及表5为例,查询服务器根据初始查询结果中的索引位置至专题数据索引表中找到相应专题数据对应的物理位置,再根据物理位置找到相应专题数据对应的评分和得分,然后计算相应专题数据的平均评分和平均得分,之后计算相应专题数据的评估值。于此,以第一比例为0.4,第二比例为0.6为例,每个专题数据的评估值=0.4*该专题数据的平均评分+0.6*该专题数据的平均得分。然而,本发明对第一比例及第二比例并不限定。
于此,根据评估算法,表4及表5中相应的专题数据的评估信息例如下表所示。
索引位置 |
专题GUID |
评估值 |
数据源 |
1 |
A1484645-786e-4f7e-bc09-0ecf36add696 |
95.32 |
元数据 |
2 |
b3d4074c-ed0c-46b1-9078-7f1d49bf7c12 |
86.23 |
元数据 |
3 |
db03e971-1fab-444d-a761-11f5b25330ea |
93.56 |
词句数据 |
于本实施例中,最终查询结果依次排列元数据查询结果及词句数据查询结果,且每个类型中按照评估算法获得的每个专题数据的评估值由大至小的顺序排列。如此,根据上述评估算法得到的评估值可得到如表6所示的最终查询结果。
索引位置 |
专题GUID |
1 |
a1484645-786e-4f7e-bc09-0ecf36add696 |
2 |
b3d4074c-ed0c-46b1-9078-7f1d49bf7c12 |
3 |
db03e971-1fab-444d-a761-11f5b25330ea |
表6
于此,查询服务器根据最终查询结果(例如,表6)可向专题数据存储器获取相应的专题数据,并将获取的专题数据输出给用户。此外,查询服务器还会将此次的最终查询结果保存下来(例如,将最终查询结果保存至查询日志存储器),以供下一次相关查询时,直接获取对应的最终查询结果,从而提高查询效率。然而,本发明对此并不限定。于实际应用中,最终查询结果亦可被保存至查询服务器。
图2所示为根据本发明的较佳实施例提供的云教育平台的数据搜索系统的示意图。如图2所示,根据本发明的较佳实施例提供的云教育平台的数据搜索系统包括教学数据存储器10、专题数据提取服务器12、专题数据存储器14、索引数据处理服务器16以及查询服务器18。专题数据提取服务器12连接教学数据存储器10及专题数据存储器14,索引数据处理服务器16连接专题数据存储器14及查询服务器18。
于本实施例中,专题数据提取服务器12,用于无限循环遍历教学数据存储器10内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据,并将专题数据存储至专题数据存储器14。索引数据处理服务器16,用于无限循环遍历专题数据存储器14内的专题数据,并根据专题数据生成专题数据索引表。索引数据处理服务器16,用于根据专题数据索引表,按照第二规则生成元数据索引表及按照第三规则生成词句数据索引表。当用户进行数据搜索时,查询服务器18根据用户输入的查询信息至索引数据处理服务器16依次查询元数据索引表及词句数据索引表,以获得初始查询结果,查询服务器18根据评估算法及初始查询结果得到最终查询结果。关于上述系统的具体操作过程同上述方法所述,故于此不再赘述。
综上所述,根据本发明较佳实施例提供的云教育平台的数据搜索方法及系统,专题数据提取服务器按照第一规则获得专题数据,并将专题数据存储至专题数据存储器,如此通过专题数据的提炼,提高了数据的查询效率。另外,当用户进行数据搜索时,查询服务器根据用户输入的查询信息至索引数据处理服务器依次查询元数据索引表及词句数据索引表,以获得初始查询结果,查询服务器根据评估算法及初始查询结果得到最终查询结果。如此,通过依次查询元数据索引表及词句数据索引表,提高了初始查询结果的命中率,而且,再根据评估算法及初始查询结果获取最终查询结果,大大提高了查询的准确性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。