CN106776878A - 一种基于ElasticSearch对MOOC课程进行分面检索的方法 - Google Patents

一种基于ElasticSearch对MOOC课程进行分面检索的方法 Download PDF

Info

Publication number
CN106776878A
CN106776878A CN201611074980.5A CN201611074980A CN106776878A CN 106776878 A CN106776878 A CN 106776878A CN 201611074980 A CN201611074980 A CN 201611074980A CN 106776878 A CN106776878 A CN 106776878A
Authority
CN
China
Prior art keywords
mooc
retrieval
facet
elasticsearch
course
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611074980.5A
Other languages
English (en)
Inventor
刘均
石磊
魏笔凡
王萌
姚思雨
曾宏伟
郭朝彤
王瑞杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201611074980.5A priority Critical patent/CN106776878A/zh
Publication of CN106776878A publication Critical patent/CN106776878A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • G06Q50/2053Education institution selection, admissions, or financial aid

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于ElasticSearch对MOOC课程进行分面检索的方法,所采用的技术方案为:首先获取MOOC课程元数据,解析后存储;然后创建一个索引,将MOOC课程元数据在ElasticSearch集群中建立索引;其次将若干个字段的数据加入到待检索字段中,实现多字段检索,对不同字段通过设置不同的权重;再次设置若干个分面,从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索,设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;最后设置检索服务接口,提供MOOC课程检索服务,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果。

Description

一种基于ElasticSearch对MOOC课程进行分面检索的方法
技术领域
本发明涉及一种对MOOC课程进行检索的方法,具体涉及一种基于ElasticSearch对MOOC课程进行分面检索的方法。
背景技术
MOOC中国作为至关重要的教育合作平台,将带领中国远程教育走向国际舞台。MOOC中国与丝路学院的结合,将成为互联网+教育的全新模式,以崭新的技术、资源、商业和服务理念和手段,实现网络教育的转型升级,实现中国的网络教育走向世界。
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。ElasticSearch是用Java开发的,其设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。
现有国内外MOOC平台中,课程检索主要包括三个步骤:(1)对课程名称的索引;(2)用户在MOOC网站对课程名称进行检索;(3)MOOC检索系统直接返回数据。
上述方法中的索引内容不够全面,检索方式单一,检索结果输出不够智能。因此,这种大众化的检索方式并不能满足用户更全面的需求。
发明内容
为了解决现有技术中的问题,本发明提出一种基于ElasticSearch对MOOC课程进行分面检索的方法,将繁杂、无序的课程资源整合成一个可个性化高效搜索的形式,缓解用户搜索所需课程信息慢的弊端,提高用户获得有效信息的精准度,使用户能够检索更全面的内容,更快检索到想要的课程。
为了实现以上目的,本发明所采用的技术方案为:包括以下步骤:
1)元数据的获取:首先从MOOC资源服务平台获取MOOC课程元数据,然后解析数据并将MOOC课程元数据存储在本地资源数据库中;
2)索引构建:首先在ElasticSearch中创建一个索引,然后通过ElasticSearch的批量导入机制,将本地资源数据库中的MOOC课程元数据在ElasticSearch集群中建立索引;
3)多字段检索和字段权重设置:首先根据MOOC课程资源的特点分析出若干个字段的数据并加入到待检索字段中,然后利用ElasticSearch的Bool查询嵌套,实现多字段检索;最后对不同字段通过设置不同的权重,排除检索结果中的干扰信息;
4)分面检索和查询结果排序:首先设置若干个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索;然后设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;
5)设置检索服务接口,提供MOOC课程检索服务,检索服务接口要求用户提供检索关键词和检索分面信息,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果。
所述步骤1)中元数据的获取具体包括以下步骤:
1.1)通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程列表;
1.2)将所有课程的CourseID放入队列中进行循环遍历,根据CourseID这个字段通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取每一课程的JSON文件;
1.3)利用JsonPath解析语法,对JSON文件进行解析,获取MOOC课程元数据;
1.4)将MOOC课程元数据存入本地的MySQL资源数据库中。
所述步骤2)中索引构建具体包括:首先构建ElasticSearch的Mapping描述文件,指明每一个字段如何索引数据以及是否被检索到,并使用一个默认的分析器Analyzer;然后将Mapping文件写入ElasticSearch集群中,创建一个索引Indexmooc;最后从本地MySQL资源数据库中获取MOOC课程元数据,利用ElasticSearch的Bulk批量导入索引Indexmooc中。
所述步骤3)中多字段检索和字段权重设置具体包括以下步骤:
3.1)根据MOOC课程资源的特点分析出七个字段的数据,七个字段包括课程名称CourseName、课程简介Introduction、课程机构名称OrgName、章节列表Chapterlist、教师团队TeacherInfo、先修知识Priorknowledge和授课语言Language;
3.2)设置ElasticSearch的查询器TermQuery和MatchQuery,并用ElasticSearch的Bool查询进行嵌套,实现多字段检索;
3.3)设置不同字段的权重,引入权重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC课程名称CourseName的系数为1.0,其他字段系数ω1、ω2、ω3、ω4、ω5和ω6为待定系数。
所述权重公式的字段系数的确定过程为:首先利用信息量权数法通过控制变量在不同字段检索一定数量的关键词,然后通过计算结果中TF-IDF指标来衡量该字段的分辨信息的数量,来衡量该字段的权重大小,并确定最终的权重公式的系数。
所述步骤4)中分面检索和查询结果排序具体过程:首先用户输入关键词,创建查询器,对步骤3)中的若干个字段进行检索,利用权重公式对结果进行排序,排除干扰信息;然后对检索结果进行分面聚合查询处理,获得分面集合以及每一个分面包含的MOOC课程数量信息,每次增加新的分面进行检索,在Bool嵌套查询中插入Matchquery查询器;最后检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序。
所述检索结果还按照热度、开课时间和上课周数对MOOC课程进行排序。
所述步骤5)中检索服务接口为基于HTTP协议面向Web的检索服务接口,检索服务接口基于Jersey 2.0的Restful API框架对检索服务进行封装,检索服务接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面信息。
所述HTTP协议GET请求的Header中加入检索服务接口的请求序列号。
与现有技术相比,本发明首先从MOOC资源服务平台获取MOOC课程元数据,并解析后存储在本地资源数据库中;然后在ElasticSearch中创建一个索引,通过ElasticSearch的批量导入机制,将本地资源数据库中的MOOC课程元数据在ElasticSearch集群中建立索引;其次根据MOOC课程资源的特点分析出若干个字段的数据并加入到待检索字段中,利用ElasticSearch的Bool查询嵌套,实现多字段检索,对不同字段通过设置不同的权重,排除检索结果中的干扰信息;再次设置若干个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索,设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;最后设置检索服务接口,提供MOOC课程检索服务,检索服务接口要求用户提供检索关键词和检索分面信息,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果,完成对MOOC课程的分面检索,本发明在将繁杂、无序的课程资源整合成一个可个性化高效搜索的形式,缓解用户搜索所需课程信息慢的弊端,提高用户获得有效信息的精准度,使用户能够检索更全面的内容,更快检索到想要的课程。
进一步,目前的MOOC课程在线教育网站在检索字段的选取上有明显的不足;在检索内容的选择问题上,大多数的MOOC课程检索都是对课程名称的检索,或者仅仅加入了课程简介等内容,索引内容不够全面,检索方式单一,本发明根据MOOC中国课程资源的特点,共分析出7个字段的数据可供加入到待检索字段中,这七个字段分别是:课程名称、课程简介、课程类别、章节列表、教师团队、先修知识和授课语言,索引内容全面,索引方式多样化,检索方式能满足用户更全面的需求。
进一步,本发明检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序,再此基础上增加按照热度、开课时间和上课周数等对MOOC课程进行排序,使检索的内容多样化,满足用户更全面的需求。
进一步,HTTP协议GET请求的Header中加入检索服务接口的请求序列号,保证了检索服务接口的使用安全。
附图说明
图1为本发明的流程框图;
图2为本发明分面检索中字段权重设置图。
具体实施方式
下面结合具体的实施例和说明书附图对本发明作进一步的解释说明。
本发明对MOOC课程进行分面检索的方法,实现了通过分面检索实现MOOC课程检索,包括如下步骤。
(1)元数据的获取:首先通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程元数据,然后解析数据并将元数据存储在本地资源数据库中;
(2)索引构建:首先通过Mapping文件在ElasticSearch中创建一个索引,然后通过ElasticSearch的批量导入机制,将步骤(1)中本地资源数据库中的MOOC课程数据在ElasticSearch集群中建立索引;
(3)多字段检索和字段权重设置:首先,调研和实际分析MOOC课程资源的特色,共分析出了7个字段的数据可供加入到待检索字段中,然后巧妙利用ElasticSearch的Bool查询嵌套,实现多字段检索;然后对不同字段通过设置不同的权重,排除检索结果中的干扰信息;
(4)分面检索和查询结果排序:首先设计5个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索;然后设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;
(5)设置面向Web的检索服务接口,提供基于HTTP协议的MOOC课程检索服务,该检索接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面等信息,该接口返回课程的一个MOOC课程信息列表以及课程分面聚合结果。
具体地,如图1所示,分为如下五个过程:
(1)元数据的获取,包括如下四个步骤:
第1步:通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程列表;
第2步:将所有课程的CourseID放入队列中进行循环遍历,根据CourseID这个字段通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取每一课程的JSON文件;
第3步:利用JsonPath解析语法,对JSON文件进行解析,获取MOOC课程的元数据;
第4步:将MOOC课程元数据存入本地的MySQL资源数据库中;
(2)索引构建,包括如下三个步骤:
第1步:构建ElasticSearch的Mapping描述文件,指明每一个字段如何索引数据以及是否被检索到,并使用一个默认的分析器Analyzer;
第2步:将Mapping文件写入ElasticSearch集群中,创建一个索引Indexmooc
第3步:从本地MySQL资源数据库中获取MOOC课程元数据,利用ElasticSearch的Bulk批量导入索引Indexmooc中,每次导入5000条数据;
(3)多字段检索和字段权重设置,包括如下五个步骤。
第1步:调研国内外知名的MOOC课程在线教育网站,发现目前的MOOC课程在线教育网站在检索字段的选取上有明显的不足;在检索内容的选择问题上,大多数的MOOC课程检索都是对课程名称的检索,或者仅仅加入了课程简介等内容;
第2步:实际分析MOOC中国课程资源的特点,共分析出7个字段的数据可供加入到待检索字段中,这7个字段分别是:课程名称、课程简介、课程机构名称、章节列表、教师团队、先修知识和授课语言。
第3步:设计ElasticSearch的查询器TermQuery和MatchQuery,用ElasticSearch的Bool查询进行嵌套,实现多字段检索;
第4步:如图2所示,设计不同字段的权重,引入权重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC课程名称的系数为1.0,其他是待定系数;
第5步:利用信息量权数法,通过控制变量地在不同字段检索一定数量的关键词,计算结果中TF-IDF指标来衡量该字段的分辨信息的多少,来衡量该字段的权重大小,并确定最终的权重公式的系数。
(4)分面检索和查询结果排序,包括如下过程:
首先,用户输入关键词,创建Elasticsearch的查询器,对步骤(3)中的7个字段进行检索,利用权重公式对结果进行排序,排除一定的干扰信息;其次,对检索结果进行分面聚合查询处理,获得分面集合以及每一个分面包含的MOOC课程数量信息;每次增加新的分面进行检索,在Bool嵌套查询中插入一个新的Matchquery查询器;再次,检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序,并在检索结果页面增加按照热度、开课时间和上课周数等对MOOC课程进行排序;
(5)设计面向Web的检索服务接口,包括如下过程:
首先,基于HTTP协议的Web检索服务接口主要采用基于Jersey 2.0的Restful API框架,对检索服务进行封装;其次,该检索服务接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面等信息;再次,在HTTP请求的Header中,需要加入该服务接口的请求序列号,保证检索服务接口的使用安全。

Claims (9)

1.一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,包括以下步骤:
1)元数据的获取:首先从MOOC资源服务平台获取MOOC课程元数据,然后解析数据并将MOOC课程元数据存储在本地资源数据库中;
2)索引构建:首先在ElasticSearch中创建一个索引,然后通过ElasticSearch的批量导入机制,将本地资源数据库中的MOOC课程元数据在ElasticSearch集群中建立索引;
3)多字段检索和字段权重设置:首先根据MOOC课程资源的特点分析出若干个字段的数据并加入到待检索字段中,然后利用ElasticSearch的Bool查询嵌套,实现多字段检索;最后对不同字段通过设置不同的权重,排除检索结果中的干扰信息;
4)分面检索和查询结果排序:首先设置若干个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索;然后设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;
5)设置检索服务接口,提供MOOC课程检索服务,检索服务接口要求用户提供检索关键词和检索分面信息,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果。
2.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤1)中元数据的获取具体包括以下步骤:
1.1)通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程列表;
1.2)将所有课程的CourseID放入队列中进行循环遍历,根据CourseID这个字段通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取每一课程的JSON文件;
1.3)利用JsonPath解析语法,对JSON文件进行解析,获取MOOC课程元数据;
1.4)将MOOC课程元数据存入本地的MySQL资源数据库中。
3.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤2)中索引构建具体包括:首先构建ElasticSearch的Mapping描述文件,指明每一个字段如何索引数据以及是否被检索到,并使用一个默认的分析器Analyzer;然后将Mapping文件写入ElasticSearch集群中,创建一个索引Indexmooc;最后从本地MySQL资源数据库中获取MOOC课程元数据,利用ElasticSearch的Bulk批量导入索引Indexmooc中。
4.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤3)中多字段检索和字段权重设置具体包括以下步骤:
3.1)根据MOOC课程资源的特点分析出七个字段的数据,七个字段包括课程名称CourseName、课程简介Introduction、课程机构名称OrgName、章节列表Chapterlist、教师团队TeacherInfo、先修知识Priorknowledge和授课语言Language;
3.2)设置ElasticSearch的查询器TermQuery和MatchQuery,并用ElasticSearch的Bool查询进行嵌套,实现多字段检索;
3.3)设置不同字段的权重,引入权重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC课程名称CourseName的系数为1.0,其他字段系数ω1、ω2、ω3、ω4、ω5和ω6为待定系数。
5.根据权利要求4所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述权重公式的字段系数的确定过程为:首先利用信息量权数法通过控制变量在不同字段检索一定数量的关键词,然后通过计算结果中TF-IDF指标来衡量该字段的分辨信息的数量,来衡量该字段的权重大小,并确定最终的权重公式的系数。
6.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤4)中分面检索和查询结果排序具体过程:首先用户输入关键词,创建查询器,对步骤3)中的若干个字段进行检索,利用权重公式对结果进行排序,排除干扰信息;然后对检索结果进行分面聚合查询处理,获得分面集合以及每一个分面包含的MOOC课程数量信息,每次增加新的分面进行检索,在Bool嵌套查询中插入Matchquery查询器;最后检索结果默认设置为综合排序,即MOOC课程按照相关度进行降序排序。
7.根据权利要求6所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述检索结果还按照热度、开课时间和上课周数对MOOC课程进行排序。
8.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤5)中检索服务接口为基于HTTP协议面向Web的检索服务接口,检索服务接口基于Jersey 2.0的Restful API框架对检索服务进行封装,检索服务接口的入口参数采用HTTP协议的GET请求规范,并要求用户提供检索关键词和检索分面信息。
9.根据权利要求8所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述HTTP协议GET请求的Header中加入检索服务接口的请求序列号。
CN201611074980.5A 2016-11-29 2016-11-29 一种基于ElasticSearch对MOOC课程进行分面检索的方法 Pending CN106776878A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611074980.5A CN106776878A (zh) 2016-11-29 2016-11-29 一种基于ElasticSearch对MOOC课程进行分面检索的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611074980.5A CN106776878A (zh) 2016-11-29 2016-11-29 一种基于ElasticSearch对MOOC课程进行分面检索的方法

Publications (1)

Publication Number Publication Date
CN106776878A true CN106776878A (zh) 2017-05-31

Family

ID=58898401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611074980.5A Pending CN106776878A (zh) 2016-11-29 2016-11-29 一种基于ElasticSearch对MOOC课程进行分面检索的方法

Country Status (1)

Country Link
CN (1) CN106776878A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491415A (zh) * 2018-02-05 2018-09-04 武汉国贸通大数据有限公司 一种国际贸易数据的搜索方法以及搜索系统
CN108897819A (zh) * 2018-06-20 2018-11-27 北京密境和风科技有限公司 一种数据搜索方法和装置
CN109599186A (zh) * 2018-11-21 2019-04-09 金色熊猫有限公司 数据处理方法、装置及介质
CN109840266A (zh) * 2019-01-25 2019-06-04 网联清算有限公司 存储系统搭建方法及装置
CN110781211A (zh) * 2018-07-31 2020-02-11 网宿科技股份有限公司 一种数据的解析方法及装置
CN110807038A (zh) * 2019-09-18 2020-02-18 国网江苏省电力有限公司 一种基于Elasticsearch的CMDB信息全文检索方法
CN111026574A (zh) * 2019-11-25 2020-04-17 中盈优创资讯科技有限公司 诊断Elasticsearch集群问题的方法及装置
CN112131295A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 基于Elasticsearch的数据处理方法及设备
CN112380416A (zh) * 2020-11-25 2021-02-19 北京慕华信息科技有限公司 一种更新课程索引的方法、课程搜索方法和装置
CN113032436A (zh) * 2021-04-16 2021-06-25 苏州臻璇数据信息技术有限公司 基于文章内容和标题的搜索方法和装置
CN114490526A (zh) * 2022-04-02 2022-05-13 北京新唐思创教育科技有限公司 选课索引文件更新方法、课程搜索方法及装置
CN115098690A (zh) * 2022-08-24 2022-09-23 中信天津金融科技服务有限公司 一种基于聚类分析的多数据文档分类方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070005590A1 (en) * 2005-07-02 2007-01-04 Steven Thrasher Searching data storage systems and devices
CN102087669A (zh) * 2011-03-11 2011-06-08 北京汇智卓成科技有限公司 基于语义关联的智能搜索引擎系统
CN103605665A (zh) * 2013-10-24 2014-02-26 杭州电子科技大学 一种基于关键词的评审专家智能检索与推荐方法
CN104572918A (zh) * 2014-12-26 2015-04-29 清华大学 一种在线课程的搜索方法
CN104616546A (zh) * 2015-02-17 2015-05-13 浙江工商大学 一种基于移动终端的在线教学互动系统及其实现方法
CN105373898A (zh) * 2015-11-26 2016-03-02 中国农业大学 在线课程平台的学生选课与管理方法和系统
CN106096037A (zh) * 2016-06-27 2016-11-09 北京百度网讯科技有限公司 基于人工智能的搜索结果聚合方法、装置以及搜索引擎

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070005590A1 (en) * 2005-07-02 2007-01-04 Steven Thrasher Searching data storage systems and devices
CN102087669A (zh) * 2011-03-11 2011-06-08 北京汇智卓成科技有限公司 基于语义关联的智能搜索引擎系统
CN103605665A (zh) * 2013-10-24 2014-02-26 杭州电子科技大学 一种基于关键词的评审专家智能检索与推荐方法
CN104572918A (zh) * 2014-12-26 2015-04-29 清华大学 一种在线课程的搜索方法
CN104616546A (zh) * 2015-02-17 2015-05-13 浙江工商大学 一种基于移动终端的在线教学互动系统及其实现方法
CN105373898A (zh) * 2015-11-26 2016-03-02 中国农业大学 在线课程平台的学生选课与管理方法和系统
CN106096037A (zh) * 2016-06-27 2016-11-09 北京百度网讯科技有限公司 基于人工智能的搜索结果聚合方法、装置以及搜索引擎

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋志恒: "分面元数据在网站检索系统中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491415A (zh) * 2018-02-05 2018-09-04 武汉国贸通大数据有限公司 一种国际贸易数据的搜索方法以及搜索系统
CN108897819A (zh) * 2018-06-20 2018-11-27 北京密境和风科技有限公司 一种数据搜索方法和装置
CN108897819B (zh) * 2018-06-20 2021-09-21 北京密境和风科技有限公司 一种数据搜索方法和装置
CN110781211B (zh) * 2018-07-31 2022-04-05 网宿科技股份有限公司 一种数据的解析方法及装置
CN110781211A (zh) * 2018-07-31 2020-02-11 网宿科技股份有限公司 一种数据的解析方法及装置
CN109599186A (zh) * 2018-11-21 2019-04-09 金色熊猫有限公司 数据处理方法、装置及介质
CN109840266A (zh) * 2019-01-25 2019-06-04 网联清算有限公司 存储系统搭建方法及装置
CN110807038A (zh) * 2019-09-18 2020-02-18 国网江苏省电力有限公司 一种基于Elasticsearch的CMDB信息全文检索方法
CN111026574A (zh) * 2019-11-25 2020-04-17 中盈优创资讯科技有限公司 诊断Elasticsearch集群问题的方法及装置
CN111026574B (zh) * 2019-11-25 2024-03-12 中盈优创资讯科技有限公司 诊断Elasticsearch集群问题的方法及装置
CN112131295A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 基于Elasticsearch的数据处理方法及设备
CN112380416A (zh) * 2020-11-25 2021-02-19 北京慕华信息科技有限公司 一种更新课程索引的方法、课程搜索方法和装置
CN113032436B (zh) * 2021-04-16 2022-05-31 苏州臻璇数据信息技术有限公司 基于文章内容和标题的搜索方法和装置
CN113032436A (zh) * 2021-04-16 2021-06-25 苏州臻璇数据信息技术有限公司 基于文章内容和标题的搜索方法和装置
CN114490526A (zh) * 2022-04-02 2022-05-13 北京新唐思创教育科技有限公司 选课索引文件更新方法、课程搜索方法及装置
CN115098690A (zh) * 2022-08-24 2022-09-23 中信天津金融科技服务有限公司 一种基于聚类分析的多数据文档分类方法及系统

Similar Documents

Publication Publication Date Title
CN106776878A (zh) 一种基于ElasticSearch对MOOC课程进行分面检索的方法
US10423677B2 (en) Time-box constrained searching in a distributed search system
JP6054465B2 (ja) 検索エンジンの結果ページ内に目的別アプリケーションを提供する装置、方法、プログラム、及びシステム
CN109240901B (zh) 性能分析方法、性能分析装置、存储介质和电子设备
US9268826B2 (en) System and method for crowdsourced template based search
US9613165B2 (en) Autocomplete searching with security filtering and ranking
Larivière et al. A bibliometric chronicling of library and information science's first hundred years
CN110597981B (zh) 一种采用多策略自动生成摘要的网络新闻概要系统
US20040158567A1 (en) Constraint driven schema association
CN103310012A (zh) 一种分布式网络爬虫系统
US20090210407A1 (en) Method and system for adaptive discovery of content on a network
CN104199833B (zh) 一种网络搜索词的聚类方法和聚类装置
US20160378853A1 (en) Systems and methods for reducing search-ability of problem statement text
CN102597991A (zh) 文档分析与关联系统及方法
WO2015120125A1 (en) Rules-based generation of search results
RU2012138707A (ru) Настраиваемый семантический поиск на основе роли пользователя
WO2013030823A2 (en) An intelligent job recruitment system and method
CN102314461B (zh) 一种导航提示方法及系统
Turoń et al. What car for car-sharing? Conventional, electric, hybrid or hydrogen fleet? Analysis of the vehicle selection criteria for car-sharing systems
TWI284821B (en) Patent family analysis system and method
CN110196869B (zh) 一种人才信息智能匹配方法、系统及互动终端
Feng et al. A simulation study of cadaveric liver allocation with a single-score patient prioritization formula
Faba‐Pérez et al. Comparative analysis of webometric measurements in thematic environments
Roy et al. Problems in searching online databases: A case study of select central university libraries in India
CN106951517A (zh) 狭隘范围内文献的多样性查询方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531