CN115114505A - 在线教育内容分发系统 - Google Patents

在线教育内容分发系统 Download PDF

Info

Publication number
CN115114505A
CN115114505A CN202211036325.6A CN202211036325A CN115114505A CN 115114505 A CN115114505 A CN 115114505A CN 202211036325 A CN202211036325 A CN 202211036325A CN 115114505 A CN115114505 A CN 115114505A
Authority
CN
China
Prior art keywords
interest
education
content
factor
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211036325.6A
Other languages
English (en)
Other versions
CN115114505B (zh
Inventor
杨道军
王丽莉
陈勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Guancheng Education Technology Co ltd
Original Assignee
Anhui Guancheng Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Guancheng Education Technology Co ltd filed Critical Anhui Guancheng Education Technology Co ltd
Priority to CN202211036325.6A priority Critical patent/CN115114505B/zh
Publication of CN115114505A publication Critical patent/CN115114505A/zh
Application granted granted Critical
Publication of CN115114505B publication Critical patent/CN115114505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及在线教育学习技术领域,具体公开了一种在线教育内容分发系统,所述系统通过在线抓取或输入与教育内容相关的检索信息;统计每个教育内容的相关检索信息中出现的关键词及每个关键词出现的次数,以及所有教育内容的相关检索信息中出现的关键词及每个关键词出现的次数;根据所述所有教育内容的相关检索信息中出现的关键词及每个关键词出现的次数,获得各个关键词的全域权重和局域权重;将局域权重符合预置条件的关键词确定为教育内容的感兴趣因子;根据所述教育内容的感兴趣因子进行在线搜索并对搜索的教育内容进行在线分发至教育内容显示栏。通过本发明,能够实现在线教育内容分发且相对精准的个性化分发。

Description

在线教育内容分发系统
技术领域
本发明涉及在线教育技术领域,特别是涉及一种在线教育内容分发系统。
背景技术
随着互联网的发展,在线教育内容已经称为互联网应用中非常大的组成部分。各大教育网站、教育软件等为用户提供了数百万计的教育内容。但是用户却无法在短时间内了解全部,因此也很难方便地找到自己所喜爱的教育内容。这就需要通过某种方法来为用户智能地分发其可能感兴趣的教育,也即个性化的教育分发。
在线教育内容是支持学习的资源,包括教育材料、支持系统、学习环境;甚至可以包括能帮助个人有效接收教育的学习和操作的任何因素;大部分教育内容的查找通常是通过自己去寻找,或是在网页文件中进行大范围的找寻,通常所得到的教育内容资源都是大致范围内的结果,无法进行体系化或是分类化的表现,从而满足不了不同人群的需求;同时,直接从网络端进行检索,无法对用户的学习信息数据进行分析,分发的内容可能会与用户想要的产生较大的分歧,从而对用户的时间造成浪费。
发明内容
本发明提供在线教育内容分发系统,能够实现在线教育内容分发且相对精准的个性化分发。
本发明提供了如下方案:
一种在线教育内容分发系统,包括:
信息输入模块,用于在线抓取或输入与教育内容相关的检索信息;
关键词提取模块,用于对所述检索信息进行分词处理,提取关键词,统计每个教育内容的相关检索信息中出现的关键词及每个关键词出现的次数,以及所有教育内容的相关检索信息中出现的关键词及每个关键词出现的次数;
权重划分模块,用于根据所述关键词提取模块中统计的关键词及每个关键词出现的次数,获得各个关键词的全域权重和局域权重;
分发因子确定模块,用于将局域权重符合预置条件的关键词确定为教育内容的感兴趣因子;
教育内容分发模块,用于根据所述教育内容的感兴趣因子进行在线搜索并对搜索的教育内容进行在线分发至教育内容显示栏。
作为本发明的进一步方案,所述教育内容分发模块包括:
感兴趣因子更新模块,用于对新增输入的教育内容构成的集合,合并并更新该集合中各教育内容的感兴趣因子;
权重叠加模块,用于根据各感兴趣因子相对于各教育内容中的局域权重,得到叠加后的各感兴趣因子的权重;
集合因子确定模块,用于将权重符合预置条件的感兴趣因子确定为该教育内容集合的感兴趣因子。
作为本发明的进一步方案,所述教育内容分发模块还包括:
集合内容分发模块,用于根据所述教育内容集合的感兴趣因子进行教育内容的在线分发。
作为本发明的进一步方案,所述教育内容集合包括各个网站的教育内容,所述教育内容集合的感兴趣因子包括各个网站的感兴趣因子,所述集合内容分发模块还包括:
向量获取模块,用于将每个网站的感兴趣因子的权重映射到向量高维空间,得到每个网站的感兴趣因子向量;
相似度计算模块,用于两两计算感兴趣因子向量之间的余弦相似度,得到各网站两两之间的相似度;
网站内容分发模块,用于根据网站之间的相似度进行教育内容的在线分发。
作为本发明的进一步方案,所述教育内容集合包括各个用户输入过的所有教育内容,所述教育内容集合的感兴趣因子包括各个用户的感兴趣因子。
作为本发明的进一步方案,所述集合内容分发模块还包括:
列表生成模块,用于基于每个教育内容的感兴趣因子建立序列表,得到每个感兴趣因子对应的教育内容列表;
列表内容分发模块,用于根据用户的感兴趣因子以及感兴趣因子对应的教育内容列表进行教育内容的在线分发。
作为本发明的进一步方案,所述在线教育内容分发系统,还包括:
权重更新模块,用于根据各用户的学习行为历史记录,更新各感兴趣因子相对各用户的权重。
作为本发明的进一步方案,所述在线教育内容分发系统,还包括:
目标因子确定模块,用于对用户的感兴趣因子按照权重从大到小的顺序排序,并将排在前面的预置数目的感兴趣因子,确定为该用户的目标因子。
作为本发明的进一步方案,所述列表内容分发模块还用于根据所述用户的目标因子以及目标因子对应的教育内容列表进行教育内容的在线分发。
作为本发明的进一步方案,所述在线教育内容分发系统,还包括:
平均权重计算模块,用于根据每个用户的感兴趣因子的权重,计算每个感兴趣因子在所有用户中的平均权重;
最优感兴趣因子获取模块,用于将该用户的感兴趣因子按照相对该用户的权重与所述平均权重的商的大小来排序,并将排在前面的预置数目的感兴趣因子,确定为该用户的最优感兴趣因子。
作为本发明的进一步方案,所述列表内容分发模块还用于根据所述用户的最优感兴趣因子以及感兴趣因子对应的教育内容列表进行教育内容的在线分发。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明通过在线抓取或输入教育内容的相关检索信息,然后从相关检索信息中提取教育内容的感兴趣因子,以便根据教育内容的感兴趣因子向用户进行个性化的教育内容分发,因此,能够实现在线教育内容分发且相对精准的个性化分发。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例。在附图中:
图1为本发明在线教育内容分发系统的系统框图;
图2为本发明在线教育内容分发系统中教育内容分发模块的结构框图;
图3为本发明在线教育内容分发系统中包含权重更新模块的系统框图;
图4示意性示出本发明示例性实施例中一种在线教育内容分发系统应用于在线教育内容分发时的流程图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
图1示出了在线教育内容分发系统的架构图,本发明实施例中,一种在线教育内容分发系统,所述系统包括信息输入模块100、关键词提取模块200、权重划分模块300、分发因子确定模块400和教育内容分发模块500:
所述信息输入模块100,用于在线抓取或输入与教育内容相关的检索信息;
其中,抓取的操作可以通过在线教育内容分发的程序完成,其中抓取的教育内容相关的检索信息可以包括网站或专家对教育内容标注的感兴趣因子、教育内容所述的分类信息、所关联的内容合集名称、内容文档名称等等。
所述关键词提取模块200,用于对所述检索信息进行分词处理,提取关键词,统计每个教育内容的相关检索信息中出现的关键词及每个关键词出现的次数,以及所有教育内容的相关检索信息中出现的关键词及每个关键词出现的次数。
由于在线抓取的检索信息可能是句子,还可能是文章段落等等,因此,还需要对抓取的检索信息进行分词处理,提取关键词。也即,将句子或者文章段落按照中按照语法语义等切分出一个个词语。当然,切分的过程也是自动完成的,具体进行自动切分时可以采用现有技术中提供的方法,这里不再赘述。
对于感兴趣因子的统计,由于教育内容的感兴趣因子用于标识教育内容具有的特征,因此,具体实现时,可以预先设置一些关键词,例如“阅读”、“习惯”、“学习”等等,通过这些关键词来确定每个教育内容的感兴趣因子。为此,还需要在对某个教育内容的相关检索信息进行切分之后,首先统计出这些切分得到的词语中出现各个关键词的次数,例如某教育内容的相关检索信息中可能出现“阅读”10次,“习惯”7次,“学习”11次,等等。此外,还需要统计所有的教育内容相关检索信息中出现各个关键词的次数,例如,共有教育内容30篇,在这些教育内容的相关检索信息中,可能出现“阅读”50次,“习惯”20次,“学习”60次,等等。
所述权重划分模块300,用于根据所述关键词提取模块200中统计的关键词及每个关键词出现的次数,获得各个关键词的全域权重和局域权重。
具体实现时,可以将关键词作为标签,将每个教育内容作为一个文件,计算每个关键词的全域权重。通过评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在文件集或语料库中出现的频率成反比下降。
对于一个关键词而言,全域权重越高,则表示该关键词越具代表性,区分度也就越高。通过这种方法,不但一些错乱的关键词由于出现次数过少而被过滤掉,而且一些出现次数很多但没有区分度(例如“中文”、“阅读”等)的关键词也可以被过滤掉。
所述分发因子确定模块400,用于将局域权重符合预置条件的关键词确定为教育内容的感兴趣因子。
例如,对于一个教育内容而言,可以将局域权重排在前几位的关键词作为该教育内容的感兴趣因子。
所述教育内容分发模块500,用于根据所述教育内容的感兴趣因子进行在线搜索并对搜索的教育内容进行在线分发至教育内容显示栏。
通过前述几个步骤实现了教育内容感兴趣因子的自动获取,这样,就可以根据各个教育内容的感兴趣因子进行教育内容的个性化分发了。
具体在利用教育内容的感兴趣因子进行在线搜索并对搜索的教育内容进行在线分发至教育内容显示栏时,可以有多种实现方式,下面分别进行详细地介绍。
实际应用中,通常会存在一些教育内容集合,例如,教育内容文档、网站内容合集等等,对于这些教育内容集合。可以计算出教育内容集合的感兴趣因子,并根据教育集合的感兴趣因子进行教育内容的个性化分发。具体的计算教育内容集合的感兴趣因子时,可以首先合并并更新该集合中各教育内容的感兴趣因子,根据各感兴趣因子相对于各教育内容中的局域权重以及各教育内容的重要程度,得到叠加后的各感兴趣因子的权重;将权重符合预置条件的感兴趣因子确定为该教育内容集合的感兴趣因子。
在一些实施例中,参见图1和图2所示,所述教育内容分发模块500包括:
感兴趣因子更新模块501,用于对新增输入的教育内容构成的集合,合并并更新该集合中各教育内容的感兴趣因子;
权重叠加模块502,用于根据各感兴趣因子相对于各教育内容中的局域权重,得到叠加后的各感兴趣因子的权重;
集合因子确定模块503,用于将权重符合预置条件的感兴趣因子确定为该教育内容集合的感兴趣因子。
在一些实施例中,所述教育内容分发模块500还包括:
集合内容分发模块504,用于根据所述教育内容集合的感兴趣因子进行教育内容的在线分发。
在一些实施例中,所述教育内容集合包括各个网站的教育内容,所述教育内容集合的感兴趣因子包括各个网站的感兴趣因子,所述集合内容分发模块504还包括:
向量获取模块5041,用于将每个网站的感兴趣因子的权重映射到向量高维空间,得到每个网站的感兴趣因子向量;
相似度计算模块5042,用于两两计算感兴趣因子向量之间的余弦相似度,得到各网站两两之间的相似度;
网站内容分发模块5043,用于根据网站之间的相似度进行教育内容的在线分发。
在一些实施例中,所述教育内容集合包括各个用户输入过的所有教育内容,所述教育内容集合的感兴趣因子包括各个用户的感兴趣因子。
在一些实施例中,所述集合内容分发模块504还包括:
列表生成模块5044,用于基于每个教育内容的感兴趣因子建立序列表,得到每个感兴趣因子对应的教育内容列表;
列表内容分发模块5045,用于根据用户的感兴趣因子以及感兴趣因子对应的教育内容列表进行教育内容的在线分发。
在一些实施例中,参见图3所示,所述在线教育内容分发系统,还包括:
权重更新模块600,用于根据各用户的学习行为历史记录,更新各感兴趣因子相对各用户的权重。
在一些实施例中,所述在线教育内容分发系统,还包括:
目标因子确定模块700,用于对用户的感兴趣因子按照权重从大到小的顺序排序,并将排在前面的预置数目的感兴趣因子,确定为该用户的目标因子。
在一些实施例中,所述列表内容分发模块5045还用于根据所述用户的目标因子以及目标因子对应的教育内容列表进行教育内容的在线分发。
在一些实施例中,所述在线教育内容分发系统,还包括:
平均权重计算模块800,用于根据每个用户的感兴趣因子的权重,计算每个感兴趣因子在所有用户中的平均权重;
最优感兴趣因子获取模块900,用于将该用户的感兴趣因子按照相对该用户的权重与所述平均权重的商的大小来排序,并将排在前面的预置数目的感兴趣因子,确定为该用户的最优感兴趣因子。
在一些实施例中,所述列表内容分发模块5045还用于根据所述用户的最优感兴趣因子以及感兴趣因子对应的教育内容列表进行教育内容的在线分发。
本发明通过在线抓取或输入教育内容的相关检索信息,然后从相关检索信息中提取教育内容的感兴趣因子,以便根据教育内容的感兴趣因子向用户进行个性化的教育内容分发,因此,能够实现在线教育内容分发且相对精准的个性化分发。
在实际应用中,用户可能会以教育内容文档等方式提交多个教育内容,此时,可以根据前述方法计算出该教育内容文档的感兴趣因子,然后根据该内容文档的感兴趣因子,以及计算出的教育内容集合的感兴趣因子,向用户分发其他的教育内容集合。
或者,如果将一个网站的各个教育内容组成一个教育内容集合,则前述教育内容集合的感兴趣因子就可以代表每个网站的感兴趣因子。也即,将一个网站的多个教育内容的感兴趣因子进行合并,最终可以得到该网站的感兴趣因子,用以代表该网站具有的特点。在此基础上,还可以计算每个网站之间的相似性,根据网站的相似性,向用户进行教育内容的个性化分发。具体的,可以将每个网站的感兴趣因子的权重映射到向量高维空间,得到每个网站的感兴趣因子向量,然后通过两两计算感兴趣因子向量之间的余弦相似度的方式,便可以得到各网站两两之间的相似度。根据网站之间的相似度进行教育内容的在线分发时,可以在用户提交某网站后,将该网站与其他网站的相似度进行排序,将排名靠前的网站,作为该网站的相似网站分发给该用户。
除了将一个网站的教育内容作为一个教育内容集合之外,还可以将一个用户输入过的教育内容组成一个教育内容集合,这样,通过获取教育内容集合的感兴趣因子,可以获得该用户的感兴趣因子,用以代表用户的学习兴趣,这样,还可以根据用户的感兴趣因子向用户进行教育内容的个性化分发。具体实现时,可以获取用户的学习日志,记录用户的在线学习历史,这样便可以将一个用户输入过的教育内容组成一个教育内容集合,并按照前述方法提取教育内容集合的感兴趣因子,该感兴趣因子就可以作为该用户的感兴趣因子。当然,其他用户也可以做类似处理。
具体进行教育内容的在线分发时,除了获得用户的感兴趣因子,还可以基于所有教育内容的感兴趣因子建立序列表,得到每个感兴趣因子对应的教育内容列表,这样,根据用户的感兴趣因子,以及感兴趣因子对应的教育内容,就可以向用户进行教育内容的在线分发了。具体实现时,在获得了各用户的感兴趣因子之后,可以在系统中保存用户ID与其感兴趣因子之间的对应关系,当用户使用自己的ID登录到系统中时,就可以获取该用户ID对应的感兴趣因子,然后将该感兴趣因子对应的教育内容分发给该用户即可。
需要说明的是,还可以根据用户的学习历史记录,更新各感兴趣因子相对各用户的权重。其中,学习历史记录可以包括学习的时间、学习来源(包括主动搜索、点击内容文档、本地磁盘等)、用户的行为(包括在线观看或下载等等)、是否重复学习、对教育内容喜爱程度的评价等等。
具体实现时,由于将一个用户学习的所有教育内容的感兴趣因子进行合并之后,得到的用户感兴趣因子可能有很多个,但并不一定每个感兴趣因子都能很好的体现出用户的学习兴趣。因此,可以将对用户的感兴趣因子按照权重从大到小的顺序排序,并将排在前面的预置数目的感兴趣因子,确定为该用户的目标因子,然后根据用户的目标因子以及目标因子对应的教育内容列表进行教育内容的在线分发。其中,由于前述用户感兴趣因子的排序完全是由用户自身学习的教育内容来决定的,与其他用户学习的教育内容没有关系,因此,将该排序中排在前面的若干个感兴趣因子称为该用户的目标因子。
在实际应用中还可能存在这种情况:某用户的某些感兴趣因子,可能在该用户的感兴趣因子列表中排序较为靠后,但是其权重相对于其他用户的同感兴趣因子的权重要高很多,这种感兴趣因子实际上能够体现出该用户的特殊偏好,因此,可以称之为最优感兴趣因子。具体实现时,可以累加每个用户的感兴趣因子的权重,算出每个感兴趣因子在所有用户中的平均权重。然后就可以根据用户的最优感兴趣因子以及感兴趣因子对应的教育内容列表向该用户进行教育内容的在线分发了。
在本发明实施例的一种在线教育内容分发系统在进行在线教育内容分发时,参见图4所示,采用以下步骤进行:
S10:在线抓取或输入与教育内容相关的检索信息。
其中,抓取的操作可以通过在线教育内容分发的程序完成,其中抓取的教育内容相关的检索信息可以包括网站或专家对教育内容标注的感兴趣因子、教育内容所述的分类信息、所关联的内容合集名称、内容文档名称等等。
S20:对所述检索信息进行分词处理,提取关键词,统计每个教育内容的相关检索信息中出现的关键词及每个关键词出现的次数,以及所有教育内容的相关检索信息中出现的关键词及每个关键词出现的次数。
由于在线抓取的检索信息可能是句子,还可能是文章段落等等,因此,还需要对抓取的检索信息进行分词处理,提取关键词。也即,将句子或者文章段落按照中按照语法语义等切分出一个个词语。当然,切分的过程也是自动完成的,具体进行自动切分时可以采用现有技术中提供的方法,这里不再赘述。
对于感兴趣因子的统计,由于教育内容的感兴趣因子用于标识教育内容具有的特征,因此,具体实现时,可以预先设置一些关键词,例如“阅读”、“习惯”、“学习”等等,通过这些关键词来确定每个教育内容的感兴趣因子。为此,还需要在对某个教育内容的相关检索信息进行切分之后,首先统计出这些切分得到的词语中出现各个关键词的次数,例如某教育内容的相关检索信息中可能出现“阅读”10次,“习惯”7次,“学习”11次,等等。此外,还需要统计所有的教育内容相关检索信息中出现各个关键词的次数,例如,共有教育内容30篇,在这些教育内容的相关检索信息中,可能出现“阅读”50次,“习惯”20次,“学习”60次,等等。
S30:根据所述所有教育内容的相关检索信息中出现的关键词及每个关键词出现的次数,获得各个关键词的全域权重和局域权重;
具体实现时,可以将关键词作为标签,将每个教育内容作为一个文件,计算每个关键词的全域权重。通过评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在文件集或语料库中出现的频率成反比下降。
对于一个关键词而言,全域权重越高,则表示该关键词越具代表性,区分度也就越高。通过这种方法,不但一些错乱的关键词由于出现次数过少而被过滤掉,而且一些出现次数很多但没有区分度(例如“中文”、“阅读”等)的关键词也可以被过滤掉。
S40:将局域权重符合预置条件的关键词确定为教育内容的感兴趣因子;
例如,对于一个教育内容而言,可以将局域权重排在前几位的关键词作为该教育内容的感兴趣因子。
S50:根据所述教育内容的感兴趣因子进行在线搜索并对搜索的教育内容进行在线分发至教育内容显示栏。
通过前述几个步骤实现了教育内容感兴趣因子的自动获取,这样,就可以根据各个教育内容的感兴趣因子进行教育内容的个性化分发了。
上述在线教育内容分发系统所能实现的功能均由计算机设备完成,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现所述在线教育内容分发系统的功能。
处理器从存储器中逐条取出指令、分析指令,然后根据指令要求完成相应操作,产生一系列控制命令,使计算机各部分自动、连续并协调动作,成为一个有机的整体,实现程序的输入、数据的输入以及运算并输出结果,这一过程中产生的算术运算或逻辑运算均由运算器完成;所述存储器包括只读存储器(Read-Only Memory,ROM),所述只读存储器用于存储计算机程序,所述存储器外部设有保护装置。
示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在终端设备中的执行过程。
本领域技术人员可以理解,上述服务设备的描述仅仅是示例,并不构成对终端设备的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,上述处理器是上述终端设备的控制中心,利用各种接口和线路连接整个用户终端的各个部分。
上述存储器可用于存储计算机程序和/或模块,上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如信息采集模板展示功能、产品信息发布功能等)等;存储数据区可存储根据泊位状态显示系统的使用所创建的数据(比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例系统中的全部或部分模块/单元,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个系统实施例的功能。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
本发明通过在线抓取或输入教育内容的相关检索信息,然后从相关检索信息中提取教育内容的感兴趣因子,以便根据教育内容的感兴趣因子向用户进行个性化的教育内容分发,因此,能够实现在线教育内容分发且相对精准的个性化分发。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种在线教育内容分发系统,其特征在于,所述系统包括:
信息输入模块,用于在线抓取或输入与教育内容相关的检索信息;
关键词提取模块,用于对所述检索信息进行分词处理,提取关键词,统计每个教育内容的相关检索信息中出现的关键词及每个关键词出现的次数,以及所有教育内容的相关检索信息中出现的关键词及每个关键词出现的次数;
权重划分模块,用于根据所述关键词提取模块中统计的关键词及每个关键词出现的次数,获得各个关键词的全域权重和局域权重;
分发因子确定模块,用于将局域权重符合预置条件的关键词确定为教育内容的感兴趣因子;
教育内容分发模块,用于根据所述教育内容的感兴趣因子进行在线搜索并对搜索的教育内容进行在线分发至教育内容显示栏。
2.根据权利要求1所述的在线教育内容分发系统,其特征在于,所述教育内容分发模块包括:
感兴趣因子更新模块,用于对新增输入的教育内容构成的集合,合并并更新该集合中各教育内容的感兴趣因子;
权重叠加模块,用于根据各感兴趣因子相对于各教育内容中的局域权重,得到叠加后的各感兴趣因子的权重;
集合因子确定模块,用于将权重符合预置条件的感兴趣因子确定为该教育内容集合的感兴趣因子。
3.根据权利要求2所述的在线教育内容分发系统,其特征在于,所述教育内容分发模块还包括:
集合内容分发模块,用于根据所述教育内容集合的感兴趣因子进行教育内容的在线分发。
4.根据权利要求3所述的在线教育内容分发系统,其特征在于,所述教育内容集合包括各个网站的教育内容,所述教育内容集合的感兴趣因子包括各个网站的感兴趣因子,所述集合内容分发模块还包括:
向量获取模块,用于将每个网站的感兴趣因子的权重映射到向量高维空间,得到每个网站的感兴趣因子向量;
相似度计算模块,用于两两计算感兴趣因子向量之间的余弦相似度,得到各网站两两之间的相似度;
网站内容分发模块,用于根据网站之间的相似度进行教育内容的在线分发。
5.根据权利要求4所述的在线教育内容分发系统,其特征在于,所述教育内容集合包括各个用户输入过的所有教育内容,所述教育内容集合的感兴趣因子包括各个用户的感兴趣因子。
6.根据权利要求5所述的在线教育内容分发系统,其特征在于,所述集合内容分发模块还包括:
列表生成模块,用于基于每个教育内容的感兴趣因子建立序列表,得到每个感兴趣因子对应的教育内容列表;
列表内容分发模块,用于根据用户的感兴趣因子以及感兴趣因子对应的教育内容列表进行教育内容的在线分发。
7.根据权利要求6所述的在线教育内容分发系统,其特征在于,所述在线教育内容分发系统,还包括:
权重更新模块,用于根据各用户的学习行为历史记录,更新各感兴趣因子相对各用户的权重。
8.根据权利要求6所述的在线教育内容分发系统,其特征在于,所述在线教育内容分发系统,还包括:
目标因子确定模块,用于对用户的感兴趣因子按照权重从大到小的顺序排序,并将排在前面的预置数目的感兴趣因子,确定为该用户的目标因子。
9.根据权利要求8所述的在线教育内容分发系统,其特征在于,所述列表内容分发模块还用于根据所述用户的目标因子以及目标因子对应的教育内容列表进行教育内容的在线分发。
10.根据权利要求6所述的在线教育内容分发系统,其特征在于,所述在线教育内容分发系统,还包括:
平均权重计算模块,用于根据每个用户的感兴趣因子的权重,计算每个感兴趣因子在所有用户中的平均权重;
最优感兴趣因子获取模块,用于将该用户的感兴趣因子按照相对该用户的权重与所述平均权重的商的大小来排序,并将排在前面的预置数目的感兴趣因子,确定为该用户的最优感兴趣因子。
CN202211036325.6A 2022-08-28 2022-08-28 在线教育内容分发系统 Active CN115114505B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211036325.6A CN115114505B (zh) 2022-08-28 2022-08-28 在线教育内容分发系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211036325.6A CN115114505B (zh) 2022-08-28 2022-08-28 在线教育内容分发系统

Publications (2)

Publication Number Publication Date
CN115114505A true CN115114505A (zh) 2022-09-27
CN115114505B CN115114505B (zh) 2022-11-25

Family

ID=83335416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211036325.6A Active CN115114505B (zh) 2022-08-28 2022-08-28 在线教育内容分发系统

Country Status (1)

Country Link
CN (1) CN115114505B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030149580A1 (en) * 2000-03-01 2003-08-07 Toby Moores Customized interaction with computer network resources
CN101158971A (zh) * 2007-11-15 2008-04-09 深圳市迅雷网络技术有限公司 一种基于搜索引擎的搜索结果排序方法及装置
US20100057568A1 (en) * 2007-08-11 2010-03-04 Tencent Technology (Shenzhen) Company Ltd. Method and Apparatus for Searching for Online Advertisement Resource
US8386509B1 (en) * 2006-06-30 2013-02-26 Amazon Technologies, Inc. Method and system for associating search keywords with interest spaces
US20130204894A1 (en) * 2012-02-02 2013-08-08 Patrick Faith Multi-Source, Multi-Dimensional, Cross-Entity, Multimedia Analytical Model Sharing Database Platform Apparatuses, Methods and Systems
CN109767658A (zh) * 2019-03-25 2019-05-17 重庆医药高等专科学校 一种英语影视例句分享方法及系统
CN110147504A (zh) * 2019-04-12 2019-08-20 北京百度网讯科技有限公司 区域教育资源满足度评价方法及系统
CN114860791A (zh) * 2022-05-19 2022-08-05 青岛黄海学院 一种基于大数据的教育资源推荐方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030149580A1 (en) * 2000-03-01 2003-08-07 Toby Moores Customized interaction with computer network resources
US8386509B1 (en) * 2006-06-30 2013-02-26 Amazon Technologies, Inc. Method and system for associating search keywords with interest spaces
US20100057568A1 (en) * 2007-08-11 2010-03-04 Tencent Technology (Shenzhen) Company Ltd. Method and Apparatus for Searching for Online Advertisement Resource
CN101158971A (zh) * 2007-11-15 2008-04-09 深圳市迅雷网络技术有限公司 一种基于搜索引擎的搜索结果排序方法及装置
US20130204894A1 (en) * 2012-02-02 2013-08-08 Patrick Faith Multi-Source, Multi-Dimensional, Cross-Entity, Multimedia Analytical Model Sharing Database Platform Apparatuses, Methods and Systems
CN109767658A (zh) * 2019-03-25 2019-05-17 重庆医药高等专科学校 一种英语影视例句分享方法及系统
CN110147504A (zh) * 2019-04-12 2019-08-20 北京百度网讯科技有限公司 区域教育资源满足度评价方法及系统
CN114860791A (zh) * 2022-05-19 2022-08-05 青岛黄海学院 一种基于大数据的教育资源推荐方法

Also Published As

Publication number Publication date
CN115114505B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
CN109885773B (zh) 一种文章个性化推荐方法、系统、介质及设备
CN105989004B (zh) 一种信息投放的预处理方法和装置
CN109492180A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN110532479A (zh) 一种信息推荐方法、装置及设备
CN110019669B (zh) 一种文本检索方法及装置
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
US9773252B1 (en) Discovery of new business openings using web content analysis
KR102249466B1 (ko) 인공지능 추천 모델을 사용하여 추천 정보를 제공하는 데이터 카탈로그 제공 방법 및 시스템
US20130339369A1 (en) Search Method and Apparatus
CN110851729A (zh) 资源信息推荐方法、装置、设备及计算机存储介质
Fletcher A quality-based web api selection for mashup development using affinity propagation
CN101211368B (zh) 一种对查询词分类的方法、装置及搜索引擎系统
CN113706253A (zh) 实时产品推荐方法、装置、电子设备及可读存储介质
CN114329207A (zh) 多业务信息排序系统、方法、存储介质及电子设备
CN114040012B (zh) 一种信息查询推送方法、装置及计算机设备
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
CN117151823A (zh) 一种基于大数据的购车评估方法、系统、电子设备及介质
CN108595498B (zh) 问题反馈方法及装置
CN115114505B (zh) 在线教育内容分发系统
CN110955845A (zh) 用户兴趣识别方法及装置、搜索结果处理方法及装置
CN113724817A (zh) 基于人工智能的知识推荐方法、装置、计算机设备及介质
CN110019771B (zh) 文本处理的方法及装置
Gil et al. Design and implementation of mapreduce-based book recommendation system by analysis of large-scale book-rental data
CN111611494A (zh) 一种业务对象排序方法及设备
CN111506671B (zh) 处理实体对象的属性的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant