CN106776878A - 一种基于ElasticSearch对MOOC课程进行分面检索的方法 - Google Patents
一种基于ElasticSearch对MOOC课程进行分面检索的方法 Download PDFInfo
- Publication number
- CN106776878A CN106776878A CN201611074980.5A CN201611074980A CN106776878A CN 106776878 A CN106776878 A CN 106776878A CN 201611074980 A CN201611074980 A CN 201611074980A CN 106776878 A CN106776878 A CN 106776878A
- Authority
- CN
- China
- Prior art keywords
- mooc
- retrieval
- facet
- elasticsearch
- course
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000006116 polymerization reaction Methods 0.000 claims abstract description 6
- 238000013507 mapping Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000008439 repair process Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 230000009471 action Effects 0.000 claims 1
- 238000007689 inspection Methods 0.000 description 5
- 230000008676 import Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
- G06F16/244—Grouping and aggregation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
- G06Q50/2053—Education institution selection, admissions, or financial aid
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于ElasticSearch对MOOC课程进行分面检索的方法,所采用的技术方案为:首先获取MOOC课程元数据,解析后存储;然后创建一个索引,将MOOC课程元数据在ElasticSearch集群中建立索引;其次将若干个字段的数据加入到待检索字段中,实现多字段检索,对不同字段通过设置不同的权重;再次设置若干个分面,从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索,设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;最后设置检索服务接口,提供MOOC课程检索服务,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果。
Description
技术领域
本发明涉及一种对MOOC课程进行检索的方法,具体涉及一种基于ElasticSearch对MOOC课程进行分面检索的方法。
背景技术
MOOC中国作为至关重要的教育合作平台,将带领中国远程教育走向国际舞台。MOOC中国与丝路学院的结合,将成为互联网+教育的全新模式,以崭新的技术、资源、商业和服务理念和手段,实现网络教育的转型升级,实现中国的网络教育走向世界。
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。ElasticSearch是用Java开发的,其设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。
现有国内外MOOC平台中,课程检索主要包括三个步骤:(1)对课程名称的索引;(2)用户在MOOC网站对课程名称进行检索;(3)MOOC检索系统直接返回数据。
上述方法中的索引内容不够全面,检索方式单一,检索结果输出不够智能。因此,这种大众化的检索方式并不能满足用户更全面的需求。
发明内容
为了解决现有技术中的问题,本发明提出一种基于ElasticSearch对MOOC课程进行分面检索的方法,将繁杂、无序的课程资源整合成一个可个性化高效搜索的形式,缓解用户搜索所需课程信息慢的弊端,提高用户获得有效信息的精准度,使用户能够检索更全面的内容,更快检索到想要的课程。
为了实现以上目的,本发明所采用的技术方案为:包括以下步骤:
1)元数据的获取:首先从MOOC资源服务平台获取MOOC课程元数据,然后解析数据并将MOOC课程元数据存储在本地资源数据库中;
2)索引构建:首先在ElasticSearch中创建一个索引,然后通过ElasticSearch的批量导入机制,将本地资源数据库中的MOOC课程元数据在ElasticSearch集群中建立索引;
3)多字段检索和字段权重设置:首先根据MOOC课程资源的特点分析出若干个字段的数据并加入到待检索字段中,然后利用ElasticSearch的Bool查询嵌套,实现多字段检索;最后对不同字段通过设置不同的权重,排除检索结果中的干扰信息;
4)分面检索和查询结果排序:首先设置若干个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索;然后设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;
5)设置检索服务接口,提供MOOC课程检索服务,检索服务接口要求用户提供检索关键词和检索分面信息,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果。
所述步骤1)中元数据的获取具体包括以下步骤:
1.1)通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程列表;
1.2)将所有课程的CourseID放入队列中进行循环遍历,根据CourseID这个字段通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取每一课程的JSON文件;
1.3)利用JsonPath解析语法,对JSON文件进行解析,获取MOOC课程元数据;
1.4)将MOOC课程元数据存入本地的MySQL资源数据库中。
所述步骤2)中索引构建具体包括:首先构建ElasticSearch的Mapping描述文件,指明每一个字段如何索引数据以及是否被检索到,并使用一个默认的分析器Analyzer;然后将Mapping文件写入ElasticSearch集群中,创建一个索引Indexmooc;最后从本地MySQL资源数据库中获取MOOC课程元数据,利用ElasticSearch的Bulk批量导入索引Indexmooc中。
所述步骤3)中多字段检索和字段权重设置具体包括以下步骤:
3.1)根据MOOC课程资源的特点分析出七个字段的数据,七个字段包括课程名称CourseName、课程简介Introduction、课程机构名称OrgName、章节列表Chapterlist、教师团队TeacherInfo、先修知识Priorknowledge和授课语言Language;
3.2)设置ElasticSearch的查询器TermQuery和MatchQuery,并用ElasticSearch的Bool查询进行嵌套,实现多字段检索;
3.3)设置不同字段的权重,引入权重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC课程名称CourseName的系数为1.0,其他字段系数ω1、ω2、ω3、ω4、ω5和ω6为待定系数。
所述权重公式的字段系数的确定过程为:首先利用信息量权数法通过控制变量在不同字段检索一定数量的关键词,然后通过计算结果中TF-IDF指标来衡量该字段的分辨信息的数量,来衡量该字段的权重大小,并确定最终的权重公式的系数。
所述步骤4)中分面检索和查询结果排序具体过程:首先用户输入关键词,创建查询器,对步骤3)中的若干个字段进行检索,利用权重公式对结果进行排序,排除干扰信息;然后对检索结果进行分面聚合查询处理,获得分面集合以及每一个分面包含的MOOC课程数量信息,每次增加新的分面进行检索,在Bool嵌套查询中插入Matchquery查询器;最后检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序。
所述检索结果还按照热度、开课时间和上课周数对MOOC课程进行排序。
所述步骤5)中检索服务接口为基于HTTP协议面向Web的检索服务接口,检索服务接口基于Jersey 2.0的Restful API框架对检索服务进行封装,检索服务接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面信息。
所述HTTP协议GET请求的Header中加入检索服务接口的请求序列号。
与现有技术相比,本发明首先从MOOC资源服务平台获取MOOC课程元数据,并解析后存储在本地资源数据库中;然后在ElasticSearch中创建一个索引,通过ElasticSearch的批量导入机制,将本地资源数据库中的MOOC课程元数据在ElasticSearch集群中建立索引;其次根据MOOC课程资源的特点分析出若干个字段的数据并加入到待检索字段中,利用ElasticSearch的Bool查询嵌套,实现多字段检索,对不同字段通过设置不同的权重,排除检索结果中的干扰信息;再次设置若干个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索,设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;最后设置检索服务接口,提供MOOC课程检索服务,检索服务接口要求用户提供检索关键词和检索分面信息,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果,完成对MOOC课程的分面检索,本发明在将繁杂、无序的课程资源整合成一个可个性化高效搜索的形式,缓解用户搜索所需课程信息慢的弊端,提高用户获得有效信息的精准度,使用户能够检索更全面的内容,更快检索到想要的课程。
进一步,目前的MOOC课程在线教育网站在检索字段的选取上有明显的不足;在检索内容的选择问题上,大多数的MOOC课程检索都是对课程名称的检索,或者仅仅加入了课程简介等内容,索引内容不够全面,检索方式单一,本发明根据MOOC中国课程资源的特点,共分析出7个字段的数据可供加入到待检索字段中,这七个字段分别是:课程名称、课程简介、课程类别、章节列表、教师团队、先修知识和授课语言,索引内容全面,索引方式多样化,检索方式能满足用户更全面的需求。
进一步,本发明检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序,再此基础上增加按照热度、开课时间和上课周数等对MOOC课程进行排序,使检索的内容多样化,满足用户更全面的需求。
进一步,HTTP协议GET请求的Header中加入检索服务接口的请求序列号,保证了检索服务接口的使用安全。
附图说明
图1为本发明的流程框图;
图2为本发明分面检索中字段权重设置图。
具体实施方式
下面结合具体的实施例和说明书附图对本发明作进一步的解释说明。
本发明对MOOC课程进行分面检索的方法,实现了通过分面检索实现MOOC课程检索,包括如下步骤。
(1)元数据的获取:首先通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程元数据,然后解析数据并将元数据存储在本地资源数据库中;
(2)索引构建:首先通过Mapping文件在ElasticSearch中创建一个索引,然后通过ElasticSearch的批量导入机制,将步骤(1)中本地资源数据库中的MOOC课程数据在ElasticSearch集群中建立索引;
(3)多字段检索和字段权重设置:首先,调研和实际分析MOOC课程资源的特色,共分析出了7个字段的数据可供加入到待检索字段中,然后巧妙利用ElasticSearch的Bool查询嵌套,实现多字段检索;然后对不同字段通过设置不同的权重,排除检索结果中的干扰信息;
(4)分面检索和查询结果排序:首先设计5个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索;然后设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;
(5)设置面向Web的检索服务接口,提供基于HTTP协议的MOOC课程检索服务,该检索接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面等信息,该接口返回课程的一个MOOC课程信息列表以及课程分面聚合结果。
具体地,如图1所示,分为如下五个过程:
(1)元数据的获取,包括如下四个步骤:
第1步:通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程列表;
第2步:将所有课程的CourseID放入队列中进行循环遍历,根据CourseID这个字段通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取每一课程的JSON文件;
第3步:利用JsonPath解析语法,对JSON文件进行解析,获取MOOC课程的元数据;
第4步:将MOOC课程元数据存入本地的MySQL资源数据库中;
(2)索引构建,包括如下三个步骤:
第1步:构建ElasticSearch的Mapping描述文件,指明每一个字段如何索引数据以及是否被检索到,并使用一个默认的分析器Analyzer;
第2步:将Mapping文件写入ElasticSearch集群中,创建一个索引Indexmooc;
第3步:从本地MySQL资源数据库中获取MOOC课程元数据,利用ElasticSearch的Bulk批量导入索引Indexmooc中,每次导入5000条数据;
(3)多字段检索和字段权重设置,包括如下五个步骤。
第1步:调研国内外知名的MOOC课程在线教育网站,发现目前的MOOC课程在线教育网站在检索字段的选取上有明显的不足;在检索内容的选择问题上,大多数的MOOC课程检索都是对课程名称的检索,或者仅仅加入了课程简介等内容;
第2步:实际分析MOOC中国课程资源的特点,共分析出7个字段的数据可供加入到待检索字段中,这7个字段分别是:课程名称、课程简介、课程机构名称、章节列表、教师团队、先修知识和授课语言。
第3步:设计ElasticSearch的查询器TermQuery和MatchQuery,用ElasticSearch的Bool查询进行嵌套,实现多字段检索;
第4步:如图2所示,设计不同字段的权重,引入权重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC课程名称的系数为1.0,其他是待定系数;
第5步:利用信息量权数法,通过控制变量地在不同字段检索一定数量的关键词,计算结果中TF-IDF指标来衡量该字段的分辨信息的多少,来衡量该字段的权重大小,并确定最终的权重公式的系数。
(4)分面检索和查询结果排序,包括如下过程:
首先,用户输入关键词,创建Elasticsearch的查询器,对步骤(3)中的7个字段进行检索,利用权重公式对结果进行排序,排除一定的干扰信息;其次,对检索结果进行分面聚合查询处理,获得分面集合以及每一个分面包含的MOOC课程数量信息;每次增加新的分面进行检索,在Bool嵌套查询中插入一个新的Matchquery查询器;再次,检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序,并在检索结果页面增加按照热度、开课时间和上课周数等对MOOC课程进行排序;
(5)设计面向Web的检索服务接口,包括如下过程:
首先,基于HTTP协议的Web检索服务接口主要采用基于Jersey 2.0的Restful API框架,对检索服务进行封装;其次,该检索服务接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面等信息;再次,在HTTP请求的Header中,需要加入该服务接口的请求序列号,保证检索服务接口的使用安全。
Claims (9)
1.一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,包括以下步骤:
1)元数据的获取:首先从MOOC资源服务平台获取MOOC课程元数据,然后解析数据并将MOOC课程元数据存储在本地资源数据库中;
2)索引构建:首先在ElasticSearch中创建一个索引,然后通过ElasticSearch的批量导入机制,将本地资源数据库中的MOOC课程元数据在ElasticSearch集群中建立索引;
3)多字段检索和字段权重设置:首先根据MOOC课程资源的特点分析出若干个字段的数据并加入到待检索字段中,然后利用ElasticSearch的Bool查询嵌套,实现多字段检索;最后对不同字段通过设置不同的权重,排除检索结果中的干扰信息;
4)分面检索和查询结果排序:首先设置若干个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索;然后设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;
5)设置检索服务接口,提供MOOC课程检索服务,检索服务接口要求用户提供检索关键词和检索分面信息,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果。
2.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤1)中元数据的获取具体包括以下步骤:
1.1)通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程列表;
1.2)将所有课程的CourseID放入队列中进行循环遍历,根据CourseID这个字段通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取每一课程的JSON文件;
1.3)利用JsonPath解析语法,对JSON文件进行解析,获取MOOC课程元数据;
1.4)将MOOC课程元数据存入本地的MySQL资源数据库中。
3.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤2)中索引构建具体包括:首先构建ElasticSearch的Mapping描述文件,指明每一个字段如何索引数据以及是否被检索到,并使用一个默认的分析器Analyzer;然后将Mapping文件写入ElasticSearch集群中,创建一个索引Indexmooc;最后从本地MySQL资源数据库中获取MOOC课程元数据,利用ElasticSearch的Bulk批量导入索引Indexmooc中。
4.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤3)中多字段检索和字段权重设置具体包括以下步骤:
3.1)根据MOOC课程资源的特点分析出七个字段的数据,七个字段包括课程名称CourseName、课程简介Introduction、课程机构名称OrgName、章节列表Chapterlist、教师团队TeacherInfo、先修知识Priorknowledge和授课语言Language;
3.2)设置ElasticSearch的查询器TermQuery和MatchQuery,并用ElasticSearch的Bool查询进行嵌套,实现多字段检索;
3.3)设置不同字段的权重,引入权重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC课程名称CourseName的系数为1.0,其他字段系数ω1、ω2、ω3、ω4、ω5和ω6为待定系数。
5.根据权利要求4所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述权重公式的字段系数的确定过程为:首先利用信息量权数法通过控制变量在不同字段检索一定数量的关键词,然后通过计算结果中TF-IDF指标来衡量该字段的分辨信息的数量,来衡量该字段的权重大小,并确定最终的权重公式的系数。
6.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤4)中分面检索和查询结果排序具体过程:首先用户输入关键词,创建查询器,对步骤3)中的若干个字段进行检索,利用权重公式对结果进行排序,排除干扰信息;然后对检索结果进行分面聚合查询处理,获得分面集合以及每一个分面包含的MOOC课程数量信息,每次增加新的分面进行检索,在Bool嵌套查询中插入Matchquery查询器;最后检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序。
7.根据权利要求6所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述检索结果还按照热度、开课时间和上课周数对MOOC课程进行排序。
8.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤5)中检索服务接口为基于HTTP协议面向Web的检索服务接口,检索服务接口基于Jersey 2.0的Restful API框架对检索服务进行封装,检索服务接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面信息。
9.根据权利要求8所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述HTTP协议GET请求的Header中加入检索服务接口的请求序列号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611074980.5A CN106776878A (zh) | 2016-11-29 | 2016-11-29 | 一种基于ElasticSearch对MOOC课程进行分面检索的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611074980.5A CN106776878A (zh) | 2016-11-29 | 2016-11-29 | 一种基于ElasticSearch对MOOC课程进行分面检索的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106776878A true CN106776878A (zh) | 2017-05-31 |
Family
ID=58898401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611074980.5A Pending CN106776878A (zh) | 2016-11-29 | 2016-11-29 | 一种基于ElasticSearch对MOOC课程进行分面检索的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106776878A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491415A (zh) * | 2018-02-05 | 2018-09-04 | 武汉国贸通大数据有限公司 | 一种国际贸易数据的搜索方法以及搜索系统 |
CN108897819A (zh) * | 2018-06-20 | 2018-11-27 | 北京密境和风科技有限公司 | 一种数据搜索方法和装置 |
CN109599186A (zh) * | 2018-11-21 | 2019-04-09 | 金色熊猫有限公司 | 数据处理方法、装置及介质 |
CN109840266A (zh) * | 2019-01-25 | 2019-06-04 | 网联清算有限公司 | 存储系统搭建方法及装置 |
CN110781211A (zh) * | 2018-07-31 | 2020-02-11 | 网宿科技股份有限公司 | 一种数据的解析方法及装置 |
CN110807038A (zh) * | 2019-09-18 | 2020-02-18 | 国网江苏省电力有限公司 | 一种基于Elasticsearch的CMDB信息全文检索方法 |
CN111026574A (zh) * | 2019-11-25 | 2020-04-17 | 中盈优创资讯科技有限公司 | 诊断Elasticsearch集群问题的方法及装置 |
CN112131295A (zh) * | 2020-09-27 | 2020-12-25 | 平安医疗健康管理股份有限公司 | 基于Elasticsearch的数据处理方法及设备 |
CN112380416A (zh) * | 2020-11-25 | 2021-02-19 | 北京慕华信息科技有限公司 | 一种更新课程索引的方法、课程搜索方法和装置 |
CN113032436A (zh) * | 2021-04-16 | 2021-06-25 | 苏州臻璇数据信息技术有限公司 | 基于文章内容和标题的搜索方法和装置 |
CN114490526A (zh) * | 2022-04-02 | 2022-05-13 | 北京新唐思创教育科技有限公司 | 选课索引文件更新方法、课程搜索方法及装置 |
CN115098690A (zh) * | 2022-08-24 | 2022-09-23 | 中信天津金融科技服务有限公司 | 一种基于聚类分析的多数据文档分类方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005590A1 (en) * | 2005-07-02 | 2007-01-04 | Steven Thrasher | Searching data storage systems and devices |
CN102087669A (zh) * | 2011-03-11 | 2011-06-08 | 北京汇智卓成科技有限公司 | 基于语义关联的智能搜索引擎系统 |
CN103605665A (zh) * | 2013-10-24 | 2014-02-26 | 杭州电子科技大学 | 一种基于关键词的评审专家智能检索与推荐方法 |
CN104572918A (zh) * | 2014-12-26 | 2015-04-29 | 清华大学 | 一种在线课程的搜索方法 |
CN104616546A (zh) * | 2015-02-17 | 2015-05-13 | 浙江工商大学 | 一种基于移动终端的在线教学互动系统及其实现方法 |
CN105373898A (zh) * | 2015-11-26 | 2016-03-02 | 中国农业大学 | 在线课程平台的学生选课与管理方法和系统 |
CN106096037A (zh) * | 2016-06-27 | 2016-11-09 | 北京百度网讯科技有限公司 | 基于人工智能的搜索结果聚合方法、装置以及搜索引擎 |
-
2016
- 2016-11-29 CN CN201611074980.5A patent/CN106776878A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005590A1 (en) * | 2005-07-02 | 2007-01-04 | Steven Thrasher | Searching data storage systems and devices |
CN102087669A (zh) * | 2011-03-11 | 2011-06-08 | 北京汇智卓成科技有限公司 | 基于语义关联的智能搜索引擎系统 |
CN103605665A (zh) * | 2013-10-24 | 2014-02-26 | 杭州电子科技大学 | 一种基于关键词的评审专家智能检索与推荐方法 |
CN104572918A (zh) * | 2014-12-26 | 2015-04-29 | 清华大学 | 一种在线课程的搜索方法 |
CN104616546A (zh) * | 2015-02-17 | 2015-05-13 | 浙江工商大学 | 一种基于移动终端的在线教学互动系统及其实现方法 |
CN105373898A (zh) * | 2015-11-26 | 2016-03-02 | 中国农业大学 | 在线课程平台的学生选课与管理方法和系统 |
CN106096037A (zh) * | 2016-06-27 | 2016-11-09 | 北京百度网讯科技有限公司 | 基于人工智能的搜索结果聚合方法、装置以及搜索引擎 |
Non-Patent Citations (1)
Title |
---|
宋志恒: "分面元数据在网站检索系统中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491415A (zh) * | 2018-02-05 | 2018-09-04 | 武汉国贸通大数据有限公司 | 一种国际贸易数据的搜索方法以及搜索系统 |
CN108897819A (zh) * | 2018-06-20 | 2018-11-27 | 北京密境和风科技有限公司 | 一种数据搜索方法和装置 |
CN108897819B (zh) * | 2018-06-20 | 2021-09-21 | 北京密境和风科技有限公司 | 一种数据搜索方法和装置 |
CN110781211B (zh) * | 2018-07-31 | 2022-04-05 | 网宿科技股份有限公司 | 一种数据的解析方法及装置 |
CN110781211A (zh) * | 2018-07-31 | 2020-02-11 | 网宿科技股份有限公司 | 一种数据的解析方法及装置 |
CN109599186A (zh) * | 2018-11-21 | 2019-04-09 | 金色熊猫有限公司 | 数据处理方法、装置及介质 |
CN109840266A (zh) * | 2019-01-25 | 2019-06-04 | 网联清算有限公司 | 存储系统搭建方法及装置 |
CN110807038A (zh) * | 2019-09-18 | 2020-02-18 | 国网江苏省电力有限公司 | 一种基于Elasticsearch的CMDB信息全文检索方法 |
CN111026574A (zh) * | 2019-11-25 | 2020-04-17 | 中盈优创资讯科技有限公司 | 诊断Elasticsearch集群问题的方法及装置 |
CN111026574B (zh) * | 2019-11-25 | 2024-03-12 | 中盈优创资讯科技有限公司 | 诊断Elasticsearch集群问题的方法及装置 |
CN112131295A (zh) * | 2020-09-27 | 2020-12-25 | 平安医疗健康管理股份有限公司 | 基于Elasticsearch的数据处理方法及设备 |
CN112380416A (zh) * | 2020-11-25 | 2021-02-19 | 北京慕华信息科技有限公司 | 一种更新课程索引的方法、课程搜索方法和装置 |
CN113032436B (zh) * | 2021-04-16 | 2022-05-31 | 苏州臻璇数据信息技术有限公司 | 基于文章内容和标题的搜索方法和装置 |
CN113032436A (zh) * | 2021-04-16 | 2021-06-25 | 苏州臻璇数据信息技术有限公司 | 基于文章内容和标题的搜索方法和装置 |
CN114490526A (zh) * | 2022-04-02 | 2022-05-13 | 北京新唐思创教育科技有限公司 | 选课索引文件更新方法、课程搜索方法及装置 |
CN115098690A (zh) * | 2022-08-24 | 2022-09-23 | 中信天津金融科技服务有限公司 | 一种基于聚类分析的多数据文档分类方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106776878A (zh) | 一种基于ElasticSearch对MOOC课程进行分面检索的方法 | |
US10423677B2 (en) | Time-box constrained searching in a distributed search system | |
JP6054465B2 (ja) | 検索エンジンの結果ページ内に目的別アプリケーションを提供する装置、方法、プログラム、及びシステム | |
CN109240901B (zh) | 性能分析方法、性能分析装置、存储介质和电子设备 | |
US9268826B2 (en) | System and method for crowdsourced template based search | |
US9613165B2 (en) | Autocomplete searching with security filtering and ranking | |
Larivière et al. | A bibliometric chronicling of library and information science's first hundred years | |
CN110597981B (zh) | 一种采用多策略自动生成摘要的网络新闻概要系统 | |
US20040158567A1 (en) | Constraint driven schema association | |
CN103310012A (zh) | 一种分布式网络爬虫系统 | |
US20090210407A1 (en) | Method and system for adaptive discovery of content on a network | |
CN104199833B (zh) | 一种网络搜索词的聚类方法和聚类装置 | |
US20160378853A1 (en) | Systems and methods for reducing search-ability of problem statement text | |
CN102597991A (zh) | 文档分析与关联系统及方法 | |
WO2015120125A1 (en) | Rules-based generation of search results | |
RU2012138707A (ru) | Настраиваемый семантический поиск на основе роли пользователя | |
WO2013030823A2 (en) | An intelligent job recruitment system and method | |
CN102314461B (zh) | 一种导航提示方法及系统 | |
Turoń et al. | What car for car-sharing? Conventional, electric, hybrid or hydrogen fleet? Analysis of the vehicle selection criteria for car-sharing systems | |
TWI284821B (en) | Patent family analysis system and method | |
CN110196869B (zh) | 一种人才信息智能匹配方法、系统及互动终端 | |
Feng et al. | A simulation study of cadaveric liver allocation with a single-score patient prioritization formula | |
Faba‐Pérez et al. | Comparative analysis of webometric measurements in thematic environments | |
Roy et al. | Problems in searching online databases: A case study of select central university libraries in India | |
CN106951517A (zh) | 狭隘范围内文献的多样性查询方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170531 |