具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1所示为根据本发明的较佳实施例提供的云教育平台的数据搜索实现方法的流程图。如图1所示,本发明的较佳实施例提供的云教育平台的数据搜索实现方法包括步骤101~106。
于步骤101,专题数据提取服务器无限循环遍历教学数据存储器内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据,并将所述专题数据存储至专题数据存储器。
于本实施例中,教学数据存储器存储云教育平台上的教学数据。具体而言,云教育平台上的老师会将教学课件存储至教学数据存储器的教学课件专区,然后,老师在授课时实时录制的视频亦可存储至教学数据存储器的教学视频专区。学生在线听课,并在听完课之后给老师评分,评分结果可存储至教学数据存储器的学生评分专区。老师布置作业,并将作业存储至教学数据存储器的学生作业专区。学生完成作业,老师例如通过云教育平台批阅后,将作业得分存储至教学数据存储器的作业得分专区。此外,老师亦会总结本节课程的主要内容,并输入相应的关键词作为元数据。其中,云教育平台会为每节课程生成一个全局唯一的编号,用于标识该节课程的所有资源(例如,课件、视频、评分、作业、得分、元数据)。举例而言,若老师A准备“信息系统的生命周期”的课程,当老师A制作教学课件并上传至教学数据存储器后,云教育平台会为该课件产生一个全局唯一的编号GUID:a1484645-786e-4f7e-bc09-0ecf36add696,该教学课程之后产生的教学视频、学生评分、学生作业、作业得分、元数据等教学数据都会采用a1484645-786e-4f7e-bc09-0ecf36add696作为GUID编号,以便于专题数据整理。
于本实施例中,专题数据提取服务器无限循环遍历教学数据存储器内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据的过程为:专题数据提取服务器无限循环遍历教学数据存储器内的数据,获取数据的GUID,并比对GUID是否存在于GUID列表,若不存在,则获取GUID对应的数据归档为专题数据。具体而言,专题数据提取服务器维护GUID列表,若专题数据提取服务器在教学数据存储器内获取的数据GUID存在于GUID列表,则说明该数据已经被提取,如果该数据的GUID未存在于GUID列表中,则说明该数据未被提取,此时,专题数据提取服务器将教学数据存储器内的该GUID对应的教学数据均提取出来,并归档至一个静态文件,形成一条专题数据,且将该专题数据存储于专题数据存储器。同时,完成该GUID对应的教学数据的提取后,专题数据提取服务器会将该GUID更新至其维护的GUID列表。于此,每个专题数据例如包括编号GUID、教学课件、教学视频、学生评分、学生作业、作业得分、元数据等教学数据。
于步骤102,索引数据处理服务器无限循环遍历所述专题数据存储器内的专题数据,并根据所述专题数据生成专题数据索引表。
于本实施例中,专题数据索引表包括序号、专题GUID、物理位置、元数据及词句数据等内容。具体而言,索引数据处理服务器无限循环遍历专题数据存储器内的专题数据,并比对专题数据的GUID是否存在于专题数据索引表中,若存在,说明此专题数据已被提炼至专题数据索引表中,若不存在,则说明该专题数据尚未被提炼至专题数据索引表中,此时需要将该专题数据的相关信息加入专题数据索引表。于此,专题数据索引表例如表1所示。
表1
于表1中,序号表示专题数据索引表内各个索引信息的编号,专题GUID即为教学数据GUID,物理位置表示相关专题数据在专题数据存储器的磁盘目录,元数据是老师输入的关键词,词句数据是通过将教学数据的所有文本内容分词,并将重复出现的次数达到一定预设值的词句提炼得到的。关于词句数据的提炼在本领域是常用的技术手段,故于此不再赘述。
于步骤103,索引数据处理服务器根据所述专题数据索引表,按照第二规则生成元数据索引表及按照第三规则生成词句数据索引表。
于本实施例中,索引数据处理服务器根据专题数据索引表,按照第二规则生成元数据索引表的过程为:索引数据处理服务器依次遍历专题数据索引表中所有的元数据,将相同的元数据组织到一个元数据索引项中,其中,元数据索引项包括元数据及其所对应的索引位置。另外,索引数据处理服务器根据专题数据索引表,按照第三规则生成词句数据索引表的过程为:索引数据处理服务器依次遍历专题数据索引表中所有的词句数据,将相同的词句数据组织到一个词句数据索引项中,其中,词句数据索引项包括词句数据及其所对应的索引位置。
举例而言,根据表1所示的专题数据索引表可生成表2所示的元数据索引表及表3所示的词句数据索引表。
1 |
生命周期 |
1、2 |
2 |
立项 |
1 |
3 |
开发 |
1、2 |
4 |
运维 |
1、2 |
5 |
消亡 |
1 |
6 |
需求 |
24 --> |
7 |
测试 |
2 |
8 |
产品生命 |
3 |
9 |
形成 |
3 |
10 |
成长 |
3 |
11 |
成熟 |
3 |
12 |
衰退 |
3 |
表2
其中,于表2中,序号表示元数据索引表中各个索引信息的编号,元数据即专题数据索引表中记录的元数据,索引位置表示相应的元数据在专题数据索引表中的对应的序号。
序号 |
词句数据 |
索引位置 |
1 |
概念形成 |
1 |
2 |
需求分析 |
1 |
3 |
问题定义 |
2 |
4 |
黑盒测试 |
2 |
5 |
市场淘汰 |
3 |
6 |
营销生命 |
3 |
7 |
生命周期 |
3 |
表3
其中,于表3中,序号表示词句数据索引表中各个索引信息的编号,词句数据即专题数据索引表中记录的词句数据,索引位置表示相应的词句数据在专题数据索引表中的对应的序号。
于步骤104,当用户进行数据搜索时,查询服务器将认证请求发送至所述索引数据处理服务器,其中,所述认证请求中携带的信息包括:当前周期内的当前时刻对相应查询信息的查询次数信息及用户名信息。
具体而言,当用户A进行数据搜索(例如,查询信息为生命周期)时,查询服务器会将认证请求(例如,包括当前周期内的当前时刻用户A对生命周期的查询次数及用户名信息)发送至索引数据处理服务器。
于步骤105,所述索引数据处理服务器根据自身存储的用户认证对照表,对所述认证请求进行认证,若通过认证,则所述查询服务器根据用户输入的查询信息至所述索引数据处理服务器依次查询所述元数据索引表及所述词句数据索引表,以获得初始查询结果,所述查询服务器根据评估算法及所述初始查询结果得到最终查询结果,并保存所述最终查询结果,或者,所述查询服务器直接获得之前保存的所述查询信息对应的最终查询结果。
于本实施例中,索引数据处理服务器存储用户认证对照表。用户认证对照表包括用户名、用户级别及周期内查询信息最大次数的对应关系。于此,用户认证对照表例如表4所示。
用户名 |
用户级别 |
周期内查询信息最大次数5 --> |
A~C |
第1级别 |
15 |
D~G |
第2级别 |
12 |
H~L |
第3级别 |
9 |
M~O |
第4级别 |
6 |
P~Z |
第5级别 |
3 |
表4
然而,本发明对于表4中具体内容的设置并不限定。于实际应用中,可根据需要设置用户级别及对应周期内查询信息最大次数。举例而言,若用户A在当前周期内的当前时刻对相应查询信息(例如,生命周期)的查询次数为10次,则索引数据处理服务器接收查询服务器发送的认证请求后,至表4查询可知,用户A所属的级别为第1级别,其对应的周期内查询信息最大次数为15次。此时,用户A对相应查询信息的查询次数为10次,其小于周期内查询信息最大次数。因此,所述认证请求通过认证。反之,若用户A在当前周期内的当前时刻对相应查询信息(例如,生命周期)的查询次数为16次,则其大于表4中对应的周期内查询信息最大次数(15次),此时,认证失败,则索引处理服务器拒绝查询服务器的查询,并反馈查询失败信息,以避免用户恶意攻击,保证通信安全。
以下详述通过认证的情况。
于本实施例中,当查询服务器发送的认证请求通过索引数据处理服务器的认证后,查询服务器会判断当前周期是否已经获得并存储相应查询信息对应的最终查询结果。若查询服务器在当前周期内已经存储相应查询信息对应的最终查询结果,则查询服务器直接获得之前保存的查询信息对应的最终查询结果。
若查询服务器在当前周期内没有存储相应查询信息对应的最终查询结果,则查询服务器需根据以下过程获得并保存最终查询结果。具体而言,查询服务器根据用户输入的查询信息(例如,关键字)至索引数据处理服务器依次查询元数据索引表及词句数据索引表。举例而言,若用户输入的查询信息为:生命周期,则查询服务器至索引数据处理服务器查询元数据索引表可获得初始查询结果如表5所示,查询词句数据索引表可获得初始查询结果如表6所示。
表5
表6
之后,查询服务器根据评估算法及初始查询结果得到最终查询结果。于此,评估算法为:根据每个专题数据对应的评分和得分获得平均评分和平均得分,每个专题数据的评估值等于所述专题数据的平均评分与第一比例的乘积和平均得分与第二比例的乘积的和值,其中,所述第一比例与所述第二比例的和值为1。
以初始查询结果为表5及表6为例,查询服务器根据初始查询结果中的索引位置至专题数据索引表中找到相应专题数据对应的物理位置,再根据物理位置找到相应专题数据对应的评分和得分,然后计算相应专题数据的平均评分和平均得分,之后计算相应专题数据的评估值。于此,以第一比例为0.4,第二比例为0.6为例,每个专题数据的评估值=0.4*该专题数据的平均评分+0.6*该专题数据的平均得分。然而,本发明对第一比例及第二比例并不限定。
于此,根据评估算法,表5及表6中相应的专题数据的评估信息例如下表所示。
索引位置 |
专题GUID |
评估值 |
数据源 |
1 |
A1484645-786e-4f7e-bc09-0ecf36add696 |
95.32 |
元数据 |
2 |
b3d4074c-ed0c-46b1-9078-7f1d49bf7c12 |
86.23 |
元数据 |
3 |
db03e971-1fab-444d-a761-11f5b25330ea |
93.56 |
词句数据 |
于本实施例中,最终查询结果依次排列元数据查询结果及词句数据查询结果,且每个类型中按照评估算法获得的每个专题数据的评估值由大至小的顺序排列。如此,根据上述评估算法得到的评估值可得到如表7所示的最终查询结果。
1 |
a1484645-786e-4f7e-bc09-0ecf36add696 |
2 |
b3d4074c-ed0c-46b1-9078-7f1d49bf7c12 |
3 |
db03e971-1fab-444d-a761-11f5b25330ea |
表7
于此,查询服务器根据最终查询结果(例如,表7)可向专题数据存储器获取相应的专题数据,并将获取的专题数据输出给用户。此外,查询服务器还会将此次的最终查询结果保存下来,以供下一次相关查询时,直接获取对应的最终查询结果,从而提高查询效率。
于步骤106,若于一周期内所述查询信息的搜索次数大于预设值,则所述查询服务器重新根据所述查询信息进行数据搜索,获得并存储所述查询信息对应的最新的最终查询结果。
于本实施例中,查询服务器还会统计每个周期内某个查询信息的搜索次数。于此,关于周期及预设值的设置可分别根据实际需要进行设定,本发明对此并不限定。于此,以12小时为一个周期为例,具体而言,若查询服务器经过统计获得在所述一个周期内,查询信息(例如,生命周期)的搜索次数大于预设值,则查询服务器根据步骤105所述的查询服务器在当前周期内没有存储相应查询信息对应的最终查询结果的具体处理操作重新获得该查询信息(即,生命周期)的最终查询结果,并进行保存。之后,用户再搜索该查询信息(即,生命周期)时,可直接获取该次得到的最终查询结果。另外,若于一周期内查询信息的搜索次数不大于预设值,则于用户搜索所述查询信息时,查询服务器根据存储的查询信息对应的最终查询结果从专题数据存储器获取相应的专题数据,并将获取的专题数据输出给用户。如此,提高了用户的查询效率。
图2所示为根据本发明的较佳实施例提供的云教育平台的数据搜索实现系统的示意图。如图2所示,本发明的较佳实施例提供的云教育平台的数据搜索实现系统包括教学数据存储器10、专题数据提取服务器12、专题数据存储器14、索引数据处理服务器16以及查询服务器18。专题数据提取服务器12连接教学数据存储器10及专题数据存储器14,索引数据处理服务器16连接专题数据存储器14及查询服务器18。
于本实施例中,专题数据提取服务器12,用于无限循环遍历教学数据存储器10内的数据,根据其维护的GUID列表,按照第一规则,获得专题数据,并将专题数据存储至专题数据存储器14。索引数据处理服务器16,用于无限循环遍历专题数据存储器14内的专题数据,并根据专题数据生成专题数据索引表。索引数据处理服务器16,用于根据专题数据索引表,按照第二规则生成元数据索引表及按照第三规则生成词句数据索引表。当用户进行数据搜索时,查询服务器18将认证请求发送至索引数据处理服务器16,其中,认证请求中携带的信息包括:当前周期内的当前时刻对相应查询信息的查询次数信息及用户名信息。索引数据处理服务器16,用于根据自身存储的用户认证对照表,对认证请求进行认证,若通过认证,则查询服务器18根据用户输入的查询信息至索引数据处理服务器16依次查询元数据索引表及词句数据索引表,以获得初始查询结果,查询服务器18根据评估算法及初始查询结果得到最终查询结果,并保存最终查询结果,或者,查询服务器18直接获得之前保存的所述查询信息对应的最终查询结果。若于一周期内所述查询信息的搜索次数大于预设值,则查询服务器18重新根据查询信息进行数据搜索,获得并存储查询信息对应的最新的最终查询结果。关于所述系统的具体操作过程同上述方法所述,故于此不再赘述。
综上所述,根据本发明较佳实施例提供的云教育平台的数据搜索实现方法及系统,专题数据提取服务器按照第一规则获得专题数据,并将专题数据存储至专题数据存储器,如此通过专题数据的提炼,提高了数据的查询效率。另外,当用户进行数据搜索时,索引数据处理服务器根据自身存储的用户认证对照表,对查询服务器发送的认证请求进行认证,若通过认证,则查询服务器根据用户输入的查询信息至索引数据处理服务器依次查询元数据索引表及词句数据索引表,以获得初始查询结果,查询服务器根据评估算法及初始查询结果得到最终查询结果,或者查询服务器直接获得之前保存的查询信息对应的最终查询结果。如此,通过依次查询元数据索引表及词句数据索引表,提高了初始查询结果的命中率,而且,再根据评估算法及初始查询结果获取最终查询结果,大大提高了查询的准确性,此外,根据认证请求进行认证更确保了通讯的安全性。此外,若于一周期内相应查询信息的搜索次数大于预设值,则查询服务器重新根据所述查询信息进行数据搜索,获得并存储所述查询信息对应的最新的最终查询结果。如此,便于下一次查询时直接使用,大大提高了查询效率及准确性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。