CN112231513A - 一种学习视频推荐方法、装置及系统 - Google Patents

一种学习视频推荐方法、装置及系统 Download PDF

Info

Publication number
CN112231513A
CN112231513A CN202011106079.8A CN202011106079A CN112231513A CN 112231513 A CN112231513 A CN 112231513A CN 202011106079 A CN202011106079 A CN 202011106079A CN 112231513 A CN112231513 A CN 112231513A
Authority
CN
China
Prior art keywords
video
learning
address information
recommended
inverted index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011106079.8A
Other languages
English (en)
Inventor
王枫
马镇筠
谢恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Love Theory Technology Co ltd
Original Assignee
Beijing Love Theory Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Love Theory Technology Co ltd filed Critical Beijing Love Theory Technology Co ltd
Priority to CN202011106079.8A priority Critical patent/CN112231513A/zh
Publication of CN112231513A publication Critical patent/CN112231513A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种学习视频推荐方法、装置及系统,涉及数据处理技术领域,该学习视频推荐方法包括:先获取学生端正在输出的学习内容,并获取学习内容包括的搜索关键词;然后再根据搜索关键词和预设的倒排索引进行搜索,得到与搜索关键词相匹配的待推荐视频的视频地址信息;最后发送视频地址信息至学生端,以使学生端根据视频地址信息获取待推荐视频并输出,进而实现快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。

Description

一种学习视频推荐方法、装置及系统
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种学习视频推荐方法、装置及系统。
背景技术
目前,越来越多的在线教育资源出现在互联网之中,给予了众多学生更多的学习途径。在实践中发现,目前的大多在线教育资源通常会以浏览量进行排序,以使学生可以更直接地观看到流量资源,然而,在不同学生的需求不同的基础上,流量资源并不能满足一部分学生的学习需求,同时,容易出现由于推荐的学习视频文件过大导致学生端接收内存不足、数据传输时间过长的问题,进而出现推荐失败的问题,影响了学生的学习效率。可见,现有的学习视频的推荐方法,容易出现推荐失败的问题,进而影响了学生的学习效率。
发明内容
本申请实施例的目的在于提供一种学习视频推荐方法、装置及系统,能够快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
本申请实施例第一方面提供了一种学习视频推荐方法,包括:
获取学生端正在输出的学习内容,并获取所述学习内容包括的搜索关键词;
根据所述搜索关键词、预设的倒排索引在进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息;
发送所述视频地址信息至所述学生端,以使所述学生端根据所述视频地址信息获取所述待推荐视频并输出。
在上述实现过程中,先获取学生端正在输出的学习内容,并获取学习内容包括的搜索关键词;然后再根据搜索关键词和预设的倒排索引进行搜索,得到与搜索关键词相匹配的待推荐视频的视频地址信息;最后发送视频地址信息至学生端,以使学生端根据视频地址信息获取待推荐视频并输出,进而实现快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
进一步地,所述根据所述搜索关键词和预设的倒排索引进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息,包括:
对所述搜索关键词进行分词处理,得到统计分词;
根据预设的词典对所述统计分词进行词语识别,得到识别结果;
根据所述识别结果和预设的倒排索引进行搜索,得到视频地址信息。
在上述实现过程中,通过直接搜索出待推荐视频的视频地址信息,避免了直接推送待推荐视频导致的推荐失败的问题,同时也减少了存储压力,进而提升视频推荐效率。
进一步地,所述根据所述识别结果和预设的倒排索引进行搜索,得到视频地址信息包括:
根据识别结果在预设的倒排索引中进行匹配,得到索引结果;
根据所述索引结果进行匹配分数计算,得到计算结果;
根据计算结果从所述索引结果中确定待推荐索引结果;
根据所述待推荐索引结果和所述倒排索引确定待推荐视频的视频地址信息。
在上述实现过程中,通过倒排索引可以确定出待推荐视频的视频地址信息,而不是直接搜索出待推荐视频的文件本身,提升了信息获取效率,同时也可以避免待推荐视频的文件本身过大导致的推荐失败的问题,同时也减少了存储压力。
进一步地,所述方法还包括:
获取多个学习视频以及与每个所述学习视频的网络地址;
构建所述学习视频与所述学习视频的网络地址之间的映射关系;
根据所述学习视频与所述映射关系构建倒排索引。
在上述实现过程中,通过构建代拍索引,能够加快信息查找过程,进而有利于提升查询搜索的效率。
进一步地,所述根据所述学习视频与所述映射关系构建倒排索引包括:
获取每个所述学习视频对应的关键词项;
对所述关键词项进行词项构造处理,得到每个所述学习视频对应的词项标识;
根据每个所述学习视频对应的词项标识进行词项归并处理,得到归并结果;
根据所述归并结果和所述映射关系,构建倒排索引。
在上述实现过程中,在构建倒排索引时,通过对关键词项的词项构造处理和词项归并处理,能够提升词项的准确性,进而有力提升倒排索引的准确性,提升检索效率。
进一步地,所述获取每个所述学习视频对应的关键词项,包括:
对每个学习视频的音频进行语音识别,得到每个所述学习视频的音频包括的语音关键词;
对每个所述学习视频的视频画面进行图像识别处理,得到每个所述学习视频的视频画面包括的图像关键词;
根据所述语音关键词和所述图像关键词,生成每个所述学习视频对应的关键词项。
在上述实现过程中,学习视频对应的关键词项的获取,是从相应的学习视频的语音和视频画面中获取的,通过对学习视频进行语音识别和画面图像识别,能够确定出该学习视频对应的视频内容,进而更准确地确定出学习视频对应的关键词项,进一步提升了检索的精确度。
本申请实施例第二方面提供了一种学习视频推荐装置,所述学习视频推荐装置包括:
获取模块,用于获取学生端正在输出的学习内容,并获取所述学习内容包括的搜索关键词;
搜索模块,用于根据所述搜索关键词和预设的倒排索引进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息;
发送模块,用于发送所述视频地址信息至所述学生端,以使所述学生端根据所述视频地址信息获取所述待推荐视频并输出。
在上述实现过程中,获取模块先获取学生端正在输出的学习内容,并获取学习内容包括的搜索关键词;然后搜索模块再根据搜索关键词和预设的倒排索引进行搜索,得到与搜索关键词相匹配的待推荐视频的视频地址信息;最后发送模块发送视频地址信息至学生端,以使学生端根据视频地址信息获取待推荐视频并输出,进而实现快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
本申请实施例第三方面提供了一种学习视频推荐系统,所述学习视频推荐系统包括学生端和服务端,其中,
所述学生端,用于输出学习内容供用户学习;
所述服务端,用于获取所述学习内容对应的知识点,并获取所述知识点包括的搜索关键词;以及根据所述搜索关键词和预设的倒排索引进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息;以及发送所述视频地址信息至所述学生端;
所述学生端,接收所述视频地址信息,并根据所述视频地址信息获取所述待推荐视频,并输出所述待推荐视频。
在上述实现过程中,服务器能够获取学生端输出的学习内容,并能够根据学习内容和倒排索引搜索到相应的待推荐视频的视频地址信息,并将视频地址信息发送到学生端,然后学生端就能够根据推荐的视频地址信息获取相应的待推荐视频并输出,服务器发送待推荐视频的视频地址信息至学生端,而不是直接发送待推荐视频至学生端,有利于提升推荐速度,减少流量消耗,同时也减少了存储压力。
本申请实施例第四方面提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本申请实施例第一方面中任一项所述的学习视频推荐方法。
本申请实施例第五方面提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例第一方面中任一项所述的学习视频推荐方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例一提供的一种学习视频推荐方法的流程示意图;
图2为本申请实施例二提供的一种学习视频推荐方法的流程示意图;
图3为本申请实施例三提供的一种学习视频推荐装置的结构示意图;
图4为本申请实施例四提供的一种学习视频推荐装置的结构示意图;
图5为本申请实施例五提供的一种学习视频推荐系统的系统构架示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
请参看图1,图1为本申请实施例提供了一种学习视频推荐方法的流程示意图。其中,该学习视频推荐方法包括:
S101、获取学生端正在输出的学习内容,并获取学习内容包括的搜索关键词。
本申请实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。
在本申请实施例中,该学生端可以为智能手机、平板电脑、智能学习机等智能设备,对此本实施例中不作任何限定。
S102、根据搜索关键词和预设的倒排索引进行搜索,得到与搜索关键词相匹配的待推荐视频的视频地址信息。
本申请实施例中,在步骤S102之前,还需要构建倒排索引,构建倒排索引是搜索引擎里面至关重要的一个步骤。对于构造一个倒排索引,需要先进行词项构造,然后再构建倒排索引。
本申请实施例中,视频地址信息为CDN(Content Delivery Network)地址,即内容分发网络地址。
S103、发送视频地址信息至学生端,以使学生端根据视频地址信息获取待推荐视频并输出。
本申请实施例中,预先在网络各处部署服务节点,当学生端根据视频地址信息获取待推荐视频并输出时,系统实时地根据网络流量、负载状况、服务节点到学生端的响应时间等信息,自动将学生端请求到导向离学生端最近的节点上。目的就是让学生端就近取得数据(即待推荐视频),提高响应速度。
在上述实施方式中,服务器通过对象存储OSS方式将学习视频存储到内容分发网络上,将数据通道(需要访问的数据)和控制通路(元数据,即索引)分离,在进行学习视频推荐的时候,先根据倒排索引(也就是元数据)找到数据存储的位置(即视频地址信息),当学生端根据视频地址信息获取待推荐视频时,服务器通过底层的存储接口来访问数据,以获取待推荐视频,然后通过CDN将待推荐视频发送至学生端。
本申请实施例中,还可以将学习视频挂载到知识图谱上的相应的知识点,并且通过Mysql存储关联关系,这样在输出学习视频的时候,还可以输出相应的知识点。
本申请实施例中,知识图谱可以根据学习教材内容建立相应的知识图谱。知识图谱在逻辑结构上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。如果用(实体1、关系、实体2)和/或(实体、属性、属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,模式层构建在数据层之上,主要是通过本体库来规范数据层的一系列事实表达。本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。
可见,实施本实施例所描述的学习视频推荐方法,能够快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
实施例2
请参看图2,图2为本申请实施例提供的一种学习视频推荐方法的流程示意图。如图2所示,其中,该学习视频推荐方法包括:
S201、获取多个学习视频以及每个学习视频与该学习视频的网络地址之间的映射关系。
S202、对每个学习视频的音频进行语音识别,得到每个学习视频的音频包括的语音关键词。
本申请实施例中,可以通过预设的人工智能语音识别模型对学习视频进行语音识别,将学习视频直接输入至人工智能语音识别模型中,就能够得到该学习视频的语音关键词。
本申请实施例中,语音关键词为文本字符信息。
S203、对每个学习视频的视频画面进行图像识别处理,得到每个学习视频的视频画面包括的图像关键词。
本申请实施例中,可以通过预设的人工智能视频识别模型对学习视频进行图像识别,将学习视频直接输入至人工智能图像识别模型中,就能够得到该学习视频的图像关键词。
本申请实施例中,图像关键词为文本字符信息。
S204、根据语音关键词和图像关键词,生成每个学习视频对应的关键词项。
本申请实施例中,学习视频对应的关键词项,表示该学习视频的音频和视频画面所涵盖的关键词信息。
本申请实施例中,关键词项为文本字符信息,可以是单个字、词或者长句等,对此本申请实施例不作限定。
本申请实施例中,实施上述步骤S202~步骤S204,能够获取每个学习视频对应的关键词项。
S205、对关键词项进行词项构造处理,得到每个学习视频对应的词项标识。
本申请实施例中,词项构造是在构建倒排索引过程中必不可或缺的一个步骤,词项构造效果的好坏往往会直接影响到用户的搜索体验,以及搜索结果的召回。对关键词项进行词项构造处理,主要是将学习视频对应的关键词项拆分成一些表意较强且重要的词汇,便于用户查找。
本申请实施例中,关键词项是文本信息,它本身是一个由语言组成的字符串系列,对关键词项进行词项构造处理,是将一段连续的文本序列信息拆分成多个子序列。
作为一种可选的实施方式,对关键词项进行词项构造处理,得到每个学习视频对应的词项标识,可以包括以下步骤:
对关键词项进行文本词条化处理,得到第一处理词项集合;
对第一处理词项集合进行停用词过滤处理,得到第二处理词项集合;
对第二处理词项集合进行词条归一化处理,得到第三处理词项集合;
对第三处理词项集合进行词干提取处理,得到第四处理词项集合;
对第四处理词项集合进行词形还原处理,得到每个学习视频对应的词项标识。
在上述实施方式中,对关键词项进行文本词条化处理之前,对于关键词项中的中文字符,通常通过NLP(Natural Language Processing,自然语言处理)技术、人工标注技术对常用中文词项进行特征抽取,生成对应的词典。然后再根据词典对关键词项进行文本词条化处理,得到第一处理词项集合。
在上述实施方式中,对于关键词项中的英文字符,以空格符、预设特殊字符(如“—”等)对关键词项中的英文字符进行拆分得到第一处理词项集合。
在上述实施方式中,停用词是指在文档列表中出现的频数较高且价值不大的词。以英文为例,在英文文档中出现次数较多的停用词如:“is”、“the”、“I”、“and”、“me”等等;这一类词语在往往出现在所有文档中,若以此类词语为term进行索引构建,则会产生多个全量文档索引列表。
在上述实施方式中,通常通过预设的停用词库对第一处理词项集合进行停用词过滤处理得到第二处理词项集合。
在上述实施方式中,对第二处理词项集合进行词条归一化处理,就是将一些看起来不完全一致的词条划分为一个等价类,比如英式单词colour和美式单词color归为一类、Air-conditioner和airconditioner归为一类等等。这样,用户在查询时,只要对等价类中的任意单词进行搜索,都会返回包含等价类中的任意一个单词的文档。
在上述实施方式中,对第三处理词项集合进行词干提取处理,以及对第四处理词项集合进行词形还原处理,有利于提升扩展检索范围。
在上述实施方式中,对第三处理词项集合进行词干提取处理,即将第三处理词项集合中的词项转化为词干,如:将“beaches”处理成“beach”,将“apples”处理成“apple”等。
在上述实施方式中,对第三处理词项集合进行词干提取处理,通常根据预设规则对第三处理词项集合中的词项后缀进行缩减。
在上述实施方式中,对进行词形还原处理,举例来说,当第四处理词项集合中的词项为英文字符时,就是将“doing”、“done”、“did”转化成原型“do”,将“given”、“gave”转化成原型“give”等。
在上述实施方式中,对第四处理词项集合进行词形还原处理时,需要通过预设的词形还原词典来进行词形变化的映射,进而得到词项标识,通过进行词形还原处理,能够进一步提升扩展检索范围。
在步骤S205之后,还包括以下步骤:
S206、根据每个学习视频对应的词项标识进行词项归并处理,得到归并结果,并根据归并结果和映射关系,构建倒排索引。
本申请实施例中,对词项标识进行词项归并处理,即将具有相同词项的学习视频的网络地址归并到该词项所对应的倒排索引中。
本申请实施例中,索引,是为了加快信息查找过程,基于目标信息内容预先创建的一种储存结构,有利于提升查询搜索的效率。倒排索引,是索引技术中的一种,是基于信息主体的关键属性值进行构建的。
本申请实施例中,实施上述步骤S201~步骤S206,能够构建倒排索引,构建倒排索引是搜索引擎里面至关重要的一个步骤。对于构造一个倒排索引,需要先进行词项构造,然后再构建倒排索引。
S207、获取学生端正在输出的学习内容,并获取学习内容包括的搜索关键词。
S208、对搜索关键词进行分词处理,得到统计分词。
本申请实施例中,统计分词是根据相邻的两个(或者多个)字出现的概率判断这两个(或者多个)字组合后是否会形成一个词。对搜索关键词进行通农机分词处理,得到统计分词。
S209、根据预设的词典对统计分词进行词语识别,得到识别结果。
本申请实施例中,对搜索关键词进行分词处理,包括对搜索关键词进行字符串匹配分词以及统计分词处理。
本申请实施例中,字符串匹配分词处理时,将统计分词与预设的字符串库进行匹配处理,得到识别结果。
本申请实施例中,将字符串匹配分词以及统计分词两种方法结合使用,能够尽可能地保证分词处理的准确性,有利于提升搜索的准确性,进而有利于提升学习视频推荐的准确性。
S210、根据识别结果在预设的倒排索引中进行匹配,得到索引结果。
本申请实施例中,根据识别结果在预设的倒排索引中进行匹配,得到索引结果,可以包括以下步骤:
根据识别结果生成对应的terms;
根据terms在倒排索引中的词项列表中查找对应的terms的结果列表,该结果列表即为索引结果。
在上述实施方式中,terms为搜索用的一个单元组合。
S211、根据索引结果进行匹配分数计算,得到计算结果。
本申请实施例中,根据索引结果进行匹配分数计算,即对索引结果进行微运算,包括计算文档静态分、文档相关性等等中的一种或者多种,进而得到计算结果。
S212、根据计算结果从索引结果中确定待推荐索引结果。
本申请实施例中,在确定待推荐索引结果时,先根据计算结果对索引结果进行综合排序,得到排序表,然后根据排序表确定待推荐索引结果。
本申请实施例中,当排序表是按照计算结果从大到小的顺序进行排序得到的,则可以取排序表前预设数量的索引结果,得到待推荐索引结果。具体的,预设数量可以为3个、5个、10个等,对此本申请实施例不作限定。
S213、根据待推荐索引结果和倒排索引确定待推荐视频的视频地址信息。
本申请实施例中,实施上述步骤S210~步骤S213,能够根据识别结果和预设的倒排索引进行搜索,得到视频地址信息。
本申请实施例中,实施上述步骤S208~步骤S213,能够根据搜索关键词和预设的倒排索引进行搜索,得到与搜索关键词相匹配的待推荐视频的视频地址信息。
本申请实施例中,倒排索引实际上是词项ID与地址ID的映射表,其中,词项ID为上述归并结果中的词项标识,地址ID为学习视频的网络地址。
在步骤S213之后,还包括以下步骤:
S214、发送视频地址信息至学生端,以使学生端根据视频地址信息获取待推荐视频并输出。
可见,实施本实施例所描述的学习视频推荐方法,能够快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
实施例3
请参看图3,图3为本申请实施例提供的一种学习视频推荐装置的结构示意图。如图3所示,该学习视频推荐装置包括:
获取模块310,用于获取学生端正在输出的学习内容,并获取学习内容包括的搜索关键词。
搜索模块320,用于根据搜索关键词和预设的倒排索引进行搜索,得到与搜索关键词相匹配的待推荐视频的视频地址信息。
发送模块330,用于发送视频地址信息至学生端,以使学生端根据视频地址信息获取待推荐视频并输出。
本申请实施例中,对于学习视频推荐装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的学习视频推荐装置,能够快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
实施例4
请一并参阅图4,图4是本申请实施例提供的一种学习视频推荐装置的结构示意图。其中,图4所示的学习视频推荐装置是由图3所示的学习视频推荐装置进行优化得到的。如图4所示,搜索模块320包括:
分词处理子模块321,用于对搜索关键词进行分词处理,得到统计分词;
词语识别子模块322,用于根据预设的词典对统计分词进行词语识别,得到识别结果;
搜索子模块323,用于根据识别结果和预设的倒排索引进行搜索,得到视频地址信息。
作为一种可选的实施方式,搜索子模块323包括:
匹配单元,用于根据识别结果在预设的倒排索引中进行匹配,得到索引结果。
分数计算单元,用于根据索引结果进行匹配分数计算,得到计算结果。
确定单元,用于根据计算结果从索引结果中确定待推荐索引结果。
搜索单元,用于根据待推荐索引结果和倒排索引确定待推荐视频的视频地址信息。
作为一种可选的实施方式,该学习视频推荐装置还包括:
视频获取模块340,用于获取多个学习视频以及每个学习视频与该学习视频的网络地址之间的映射关系。
构建模块350,用于根据学习视频与映射关系构建倒排索引。
作为一种可选的实施方式,构建模块350包括:
获取子模块351,用于获取每个学习视频对应的关键词项。
归并子模块352,用于根据每个学习视频对应的词项标识进行词项归并处理,得到归并结果。
构建子模块353,用于根据归并结果和映射关系,构建倒排索引。
作为一种可选的实施方式,获取子模块351包括:
语音识别单元,用于对每个学习视频的音频进行语音识别,得到每个学习视频的音频包括的语音关键词;
图像识别单元,用于对每个学习视频的视频画面进行图像识别处理,得到每个学习视频的视频画面包括的图像关键词;
词项生成单元,用于根据语音关键词和图像关键词,生成每个学习视频对应的关键词项。
本申请实施例中,对于学习视频推荐装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的学习视频推荐装置,能够快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
实施例5
请参看图5,图5为本申请实施例提供的一种学习视频推荐系统的结构示意图。如图5所示,该学习视频推荐系统包括学生端400和服务端500。
学生端400,用于输出学习内容供用户学习。
服务端500,用于获取学习内容对应的知识点,并获取知识点包括的搜索关键词;以及根据搜索关键词、预设的倒排索引在进行搜索,得到与搜索关键词相匹配的待推荐视频的视频地址信息;以及发送视频地址信息至学生端400。
学生端400,接收视频地址信息,并根据视频地址信息获取待推荐视频,并输出待推荐视频。
本申请实施例中,对于学习视频推荐系统的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的学习视频推荐系统,能够快速准确地进行学习视频的推荐,避免出现推荐失败的问题,进而有利于提升学生的学习效率。
本申请实施例提供了一种电子设备,包括存储器以及处理器,存储器用于存储计算机程序,处理器运行计算机程序以使电子设备执行本申请实施例1或实施例2中任一项学习视频推荐方法。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例1或实施例2中任一项学习视频推荐方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种学习视频推荐方法,其特征在于,包括:
获取学生端正在输出的学习内容,并获取所述学习内容包括的搜索关键词;
根据所述搜索关键词和预设的倒排索引进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息;
发送所述视频地址信息至所述学生端,以使所述学生端根据所述视频地址信息获取所述待推荐视频并输出。
2.根据权利要求1所述的学习视频推荐方法,其特征在于,所述根据所述搜索关键词和预设的倒排索引进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息,包括:
对所述搜索关键词进行分词处理,得到统计分词;
根据预设的词典对所述统计分词进行词语识别,得到识别结果;
根据所述识别结果和预设的倒排索引进行搜索,得到视频地址信息。
3.根据权利要求2所述的学习视频推荐方法,其特征在于,所述根据所述识别结果和预设的倒排索引进行搜索,得到视频地址信息包括:
根据识别结果在预设的倒排索引中进行匹配,得到索引结果;
根据所述索引结果进行匹配分数计算,得到计算结果;
根据计算结果从所述索引结果中确定待推荐索引结果;
根据所述待推荐索引结果和所述倒排索引确定待推荐视频的视频地址信息。
4.根据权利要求1所述的学习视频推荐方法,其特征在于,所述方法还包括:
获取多个学习视频以及每个所述学习视频与该学习视频的网络地址之间的映射关系;
根据所述学习视频与所述映射关系构建倒排索引。
5.根据权利要求4所述的学习视频推荐方法,其特征在于,所述根据所述学习视频与所述映射关系构建倒排索引包括:
获取每个所述学习视频对应的关键词项;
对所述关键词项进行词项构造处理,得到每个所述学习视频对应的词项标识;
根据每个所述学习视频对应的词项标识进行词项归并处理,得到归并结果;
根据所述归并结果和所述映射关系,构建倒排索引。
6.根据权利要求5所述的学习视频推荐方法,所述获取每个所述学习视频对应的关键词项,包括:
对每个所述学习视频的音频进行语音识别,得到每个所述学习视频的音频包括的语音关键词;
对每个所述学习视频的视频画面进行图像识别处理,得到每个所述学习视频的视频画面包括的图像关键词;
根据所述语音关键词和所述图像关键词,生成每个所述学习视频对应的关键词项。
7.一种学习视频推荐装置,其特征在于,所述学习视频推荐装置包括:
获取模块,用于获取学生端正在输出的学习内容,并获取所述学习内容包括的搜索关键词;
搜索模块,用于根据所述搜索关键词和预设的倒排索引进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息;
发送模块,用于发送所述视频地址信息至所述学生端,以使所述学生端根据所述视频地址信息获取所述待推荐视频并输出。
8.一种学习视频推荐系统,其特征在于,所述学习视频推荐系统包括学生端和服务端,其中,
所述学生端,用于输出学习内容供用户学习;
所述服务端,用于获取所述学习内容对应的知识点,并获取所述知识点包括的搜索关键词;以及根据所述搜索关键词和预设的倒排索引进行搜索,得到与所述搜索关键词相匹配的待推荐视频的视频地址信息;以及发送所述视频地址信息至所述学生端;
所述学生端,接收所述视频地址信息,并根据所述视频地址信息获取所述待推荐视频,并输出所述待推荐视频。
9.一种电子设备,其特征在于,所述电子设备包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1至6中任一项所述的学习视频推荐方法。
10.一种可读存储介质,其特征在于,所述可读取存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行权利要求1至6任一项所述的学习视频推荐方法。
CN202011106079.8A 2020-10-15 2020-10-15 一种学习视频推荐方法、装置及系统 Pending CN112231513A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011106079.8A CN112231513A (zh) 2020-10-15 2020-10-15 一种学习视频推荐方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011106079.8A CN112231513A (zh) 2020-10-15 2020-10-15 一种学习视频推荐方法、装置及系统

Publications (1)

Publication Number Publication Date
CN112231513A true CN112231513A (zh) 2021-01-15

Family

ID=74117687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011106079.8A Pending CN112231513A (zh) 2020-10-15 2020-10-15 一种学习视频推荐方法、装置及系统

Country Status (1)

Country Link
CN (1) CN112231513A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641241A (zh) * 2021-08-10 2021-11-12 西安领跑网络传媒科技股份有限公司 一种基于专注度的课堂辅助教学系统、设备及方法
CN113726876A (zh) * 2021-08-27 2021-11-30 维沃移动通信有限公司 学习内容的推送方法、装置、电子设备和可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789956A (zh) * 2009-12-29 2010-07-28 广东中大讯通软件科技有限公司 一种实现数字家庭远程通讯服务的系统及方法
CN102436513A (zh) * 2012-01-18 2012-05-02 中国电子科技集团公司第十五研究所 分布式检索方法和系统
CN103164405A (zh) * 2011-12-08 2013-06-19 盛乐信息技术(上海)有限公司 相关视频数据库生成方法、相关视频推荐方法及系统
CN106709042A (zh) * 2016-12-30 2017-05-24 北京小度互娱科技有限公司 索引更新方法及设备
CN109543102A (zh) * 2018-11-12 2019-03-29 百度在线网络技术(北京)有限公司 基于视频播放的信息推荐方法、装置及存储介质
CN111291086A (zh) * 2020-01-15 2020-06-16 北京爱论答科技有限公司 一种课程内容搜索方法、系统、设备及存储介质
CN111432282A (zh) * 2020-04-01 2020-07-17 腾讯科技(深圳)有限公司 一种视频推荐方法及装置
CN111522970A (zh) * 2020-04-10 2020-08-11 广东小天才科技有限公司 习题推荐方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789956A (zh) * 2009-12-29 2010-07-28 广东中大讯通软件科技有限公司 一种实现数字家庭远程通讯服务的系统及方法
CN103164405A (zh) * 2011-12-08 2013-06-19 盛乐信息技术(上海)有限公司 相关视频数据库生成方法、相关视频推荐方法及系统
CN102436513A (zh) * 2012-01-18 2012-05-02 中国电子科技集团公司第十五研究所 分布式检索方法和系统
CN106709042A (zh) * 2016-12-30 2017-05-24 北京小度互娱科技有限公司 索引更新方法及设备
CN109543102A (zh) * 2018-11-12 2019-03-29 百度在线网络技术(北京)有限公司 基于视频播放的信息推荐方法、装置及存储介质
CN111291086A (zh) * 2020-01-15 2020-06-16 北京爱论答科技有限公司 一种课程内容搜索方法、系统、设备及存储介质
CN111432282A (zh) * 2020-04-01 2020-07-17 腾讯科技(深圳)有限公司 一种视频推荐方法及装置
CN111522970A (zh) * 2020-04-10 2020-08-11 广东小天才科技有限公司 习题推荐方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641241A (zh) * 2021-08-10 2021-11-12 西安领跑网络传媒科技股份有限公司 一种基于专注度的课堂辅助教学系统、设备及方法
CN113726876A (zh) * 2021-08-27 2021-11-30 维沃移动通信有限公司 学习内容的推送方法、装置、电子设备和可读存储介质
CN113726876B (zh) * 2021-08-27 2024-09-13 维沃移动通信有限公司 学习内容的推送方法、装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN111104794B (zh) 一种基于主题词的文本相似度匹配方法
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
US10558754B2 (en) Method and system for automating training of named entity recognition in natural language processing
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
US20160098433A1 (en) Method for facet searching and search suggestions
KR102491172B1 (ko) 자연어 질의응답 시스템 및 그 학습 방법
CN110209808A (zh) 一种基于文本信息的事件生成方法以及相关装置
EP3077919A1 (en) Method for disambiguating features in unstructured text
CN109582847B (zh) 一种信息处理方法及装置、存储介质
CN112115232A (zh) 一种数据纠错方法、装置及服务器
CN112633000B (zh) 一种文本中实体的关联方法、装置、电子设备及存储介质
JP2018124914A (ja) パッセージ型質問応答装置、方法、及びプログラム
WO2016121048A1 (ja) 文章生成装置及び方法
US20200184345A1 (en) Method and system for generating a transitory sentiment community
CN115168567B (zh) 一种基于知识图谱的对象推荐方法
CN115794995A (zh) 目标答案获取方法及相关装置、电子设备和存储介质
CN111813993A (zh) 视频内容的拓展方法、装置、终端设备及存储介质
CN112231513A (zh) 一种学习视频推荐方法、装置及系统
WO2015084757A1 (en) Systems and methods for processing data stored in a database
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
US9547701B2 (en) Method of discovering and exploring feature knowledge
US20230090601A1 (en) System and method for polarity analysis
US20160085760A1 (en) Method for in-loop human validation of disambiguated features
CN111460177A (zh) 影视类表情搜索方法、装置、存储介质、计算机设备
CN116484829A (zh) 用于信息处理的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210115

RJ01 Rejection of invention patent application after publication