CN106095842B - 在线课程搜索方法和装置 - Google Patents

在线课程搜索方法和装置 Download PDF

Info

Publication number
CN106095842B
CN106095842B CN201610387557.4A CN201610387557A CN106095842B CN 106095842 B CN106095842 B CN 106095842B CN 201610387557 A CN201610387557 A CN 201610387557A CN 106095842 B CN106095842 B CN 106095842B
Authority
CN
China
Prior art keywords
course
user
behavior data
historical behavior
courses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610387557.4A
Other languages
English (en)
Other versions
CN106095842A (zh
Inventor
尤马彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610387557.4A priority Critical patent/CN106095842B/zh
Publication of CN106095842A publication Critical patent/CN106095842A/zh
Application granted granted Critical
Publication of CN106095842B publication Critical patent/CN106095842B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种在线课程搜索方法和装置,上述方法包括以下步骤:接收课程搜索请求,课程搜索请求中携带用户标识和搜索条件数据;根据用户标识查找用户的课程偏好度,课程偏好度是通过对用户的历史行为数据统计得到的且反映了用户对课程的偏好程度;搜索得到与搜索条件数据匹配的课程;根据用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前,上述课程搜索方法在课程的搜索加入了用户历史行为限定,搜索结果更加贴合用户需求。

Description

在线课程搜索方法和装置
技术领域
本发明涉及计算机应用领域,特别是涉及一种在线课程搜索方法和装置。
背景技术
随着网络技术和计算机技术的发展,在线教学模式越来越受到人们推崇。在线教学主要以互联网为传播平台并搭载课程视频供用户选择学习。为了满足不同用户的学习需求,在线平台囊括的课程内容的种类十分丰富、数量繁多,一家在线课程网站就可能提供几百甚至上千门在线课程。
基于搜索引擎进行课程搜索有效的节约了用户搜索的时间,传统的课程搜索方式是通过用户输入的课程搜索词为用户提供搜索服务,即,用户向搜索引擎提交课程搜索词,搜索引擎检索与课程搜索词相关的课程搜索结果列表并返回给用户。传统的这种基于搜索词的课程搜索方法,由于搜索词携带的信息量有限,单纯依托搜索词进行课程搜索存在着课程搜索结果不准确的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能提高课程数据的搜索准确度的在线课程搜索方法和装置。
一种在线课程搜索方法,包括以下步骤:
接收课程搜索请求,所述课程搜索请求中携带用户标识和搜索条件数据;
根据所述用户标识查找用户的课程偏好度,所述课程偏好度是通过对用户的历史行为数据统计得到的且反映了用户对课程的偏好程度;
搜索得到与所述搜索条件数据匹配的课程;
根据所述用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前。
一种在线课程搜索装置,包括:
搜索请求模块,用于接收课程搜索请求,所述课程搜索请求中携带用户标识和搜索条件数据;
偏好度获取模块,用于根据所述用户标识查找用户的课程偏好度,所述课程偏好度是通过对用户的历史行为数据统计得到的且反映了用户对课程的偏好程度;
匹配模块,用于搜索得到与所述搜索条件数据匹配的课程;
排序模块,用于根据所述用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前。
上述在线课程搜索方法和装置,通过接收课程搜索请求,课程搜索请求中携带用户标识和搜索条件数据;根据用户标识查找用户的课程偏好度,课程偏好度是通过对用户的历史行为数据统计得到的且反映了用户对课程的偏好程度;搜索得到与搜索条件数据匹配的课程;根据用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前,使课程的搜索中加入了用户历史行为限定,用户历史行为反映了用户对课程的实际需求,提高了搜索结果的准确性。
附图说明
图1为一个实施例中在线课程搜索方法的应用环境示意图;
图2为一个实施例中服务器的内部结构示意图;
图3为一个实施例中在线课程搜索方法的流程图;
图4为一个实施例中添加属性匹配的搜索的流程图;
图5为一个实施例中课程排序方法的流程图;
图6为一个实施例中准备课程搜索数据的流程图;
图7为一个实施例中历史行为数据划分示意图;
图8为一个实施例中计算课程偏好度的流程图;
图9为一个实施例中调整课程偏好度的流程图;
图10为一个实施例中服务器的架构图;
图11为一个实施例中在线课程搜索装置的结构框图;
图12为另一个实施例中在线课程搜索装置的结构框图;
图13为又一个实施例中在线课程搜索装置的结构框图;
图14为一个实施例中偏好度计算模块的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,在一个实施例中,提供了一种在线课程搜索方法运行的应用环境图。该应用环境包括终端110和服务器120,其中终端110和服务器120通过网络进行通信,其中,终端110可为智能手机、平板电脑、笔记本电脑、台式计算机中的至少一种,但并不局限于此。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群。
如图2所示,在一个实施例中,提供了一种服务器120,该服务器120包括通过系统总线连接的处理器、存储介质、内存和网络接口。其中,该后台服务器120的存储介质存储有操作系统、数据库和一种在线课程搜索装置,该装置用于实现一种在线课程搜索方法。数据库用于存储数据,如存储识别指令集和对应的识别信息集等。处理器用于提供计算和控制能力,支撑整个服务器120的运行。内存为存储介质中的在线课程搜索装置的运行提供环境。网络接口用于与外部的终端110通过网络连接通信,比如接收终端110发送的搜索请求以及向终端110返回搜索结果等。
在一个实施例中,如图3所示,提供了一种在线课程搜索方法,该方法以应用于如图1所示的服务器中进行举例说明,包括以下步骤:
步骤S210:接收课程搜索请求,课程搜索请求中携带用户标识和搜索条件数据。
搜索条件数据是指用户在终端界面上输入的反映用户课程需求的限定条件。该限定条件可以是用户在终端应用的内容输入框中输入的搜索词,也可以是下拉框中的选项或者是终端显示列表中的具体的课程类目,还可以是上述列举的限定条件的任意组合。
具体的,如服务器接收到的限定条件是输入的搜索词,当服务器接收的搜索词的字节数大于设定数值时,服务器将对搜索词进行分词处理,也就是将查询串分割成若干子查询串,这里的将复杂的搜索词做分词处理能够有效避免搜索命中率过低的问题。
用户标识用于唯一标识用户,终端向服务器发送课程搜索请求时携带当前登录的用户的用户标识。用户标识可以是即时通信号码、移动通信号码、社交网络应用账号等中的一种。
步骤S220:根据用户标识查找用户的课程偏好度,该课程偏好度是通过对用户的历史行为数据统计得到的且反映了用户对课程的偏好程度。
历史行为数据是指用户在历史时间对课程的操作行为数据,其中,用户对课程的操作行为可以是用户对课程进行的报名、收藏、分享、试听、上课、评价等行为。当用户对课程进行诸如此类的操作行为时,在服务器中会保存用户的操作行为数据。
通过对用户的历史行为数据统计得到的课程偏好度反映了用户对于课程的偏好程度,其在一定程度上代表了相应课程与用户需求贴合程度,一般的,课程的课程偏好度越高表示该课程与用户需求的贴合程度越高。
在一个实施例中,服务器可以根据课程请求中携带的用户标识优先查找缓存是否存储有该用户标识对应的课程偏好度,如果缓存命中,则可以快速获取到相应数据,如果缓存未命中,则通过访问数据库获取相应的课程偏好度,并将课程偏好度数据拉取到缓存中,以便该用户在后续搜索中,服务器可直接从缓存中获取数据,缩短了搜索时间。
步骤S230:搜索得到与搜索条件数据匹配的课程。
具体的,服务器根据接收到的搜索条件数据搜索全量课程中与搜索条件数据相匹配的课程,并形成课程列表。例如,服务器接收到的用户输入的搜索条件数据为“C语言”时,服务器将搜索与“C语言”相关的课程,并形成匹配课程列表,或者,服务器接收到用户选择的课程类目数据,比如“IT-互联网”这一课程类目,服务器将搜索与该类目相关的课程,形成上述课程列表。
步骤S240:根据用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前。
通过用户的历史行为数据对应的偏好度对与搜索得到的课程进行排序,将课程偏好度高的课程排布在课程列表的前面,实现了对课程的搜索同时进行了搜索条件数据和历史行为数据的限定,课程搜索结果更加明确的体现出了用户的实际需求,提高了课程搜索的准确性。另外,不同的用户在进行搜索时,由于用户之间的历史行为差异,即使限定的搜索条件数据相同,最终课程搜索结果可能也存在差异,因此,上述的针对不同用户的具有差异性的搜索结果更能满足不同用户的不同需求。
在一个实施例中,如图4所示,在线课程搜索方法中还包括以下步骤:
步骤S310:获取搜索得到的课程所面向的用户属性标签。
具体的,课程所面向的用户属性标签为课程的课程内容所适合的用户所属人群便签,人群标签反映用户的年龄、学历、专业或者职业等信息。课程所面向的用户属性标签可根据课程类型做具体划分,一个课程可以标记的标签不仅限于一个,也可以为多个。
具体为,根据课程内容预先对服务器中的所有课程标记课程所面向的用户属性标签,比如对“基础英语”类目下的课程根据课程内容标记“青少年”标签或“大学生”标签或“商务人士”标签或“专业从业人士”标签或“求职者”标签或“剧迷”标签或“英语爱好者”标签等,还比如对“医疗卫生”类目下的课程标记反映职位的标签,“医师”标签或“药师”标签或“护士”标签等。
步骤S320:获取与用户标识对应的用户属性信息。
具体的,用户属性信息的获取可以是获取用户在注册时在终端应用输入的用户属性信息,用户属性信息可以包括用户的年龄、学历、专业及职业、爱好等信息,用户还可以在不同类目下终端显示页面中的人群列表中进行选择,例如,如果用户是英语爱好者,相应的选择“英语爱好者”标签,用户也可以选择多个用户属性标签。
步骤S330:获取用户属性信息与用户属性标签之间的匹配度。
通过对比分析用户属性标识与用户属性标签得到两者之间的匹配度实质上反映了用户与课程之间的匹配度。其中,匹配度的获取可以只考虑用户属性中的其一属性参数,如只考虑年龄匹配度,也可以综合考虑多个属性参数,如同时考虑学历匹配度和专业匹配度。
步骤S340:根据匹配度和课程偏好度对搜索得到的课程进行排序,其中,用户的课程偏好度越高则对应的课程的排序越靠前,匹配度越高则对应的课程的排序越靠前。
本实施例对课程的适合人群标签化,在进行了用户历史行为限定的基础上添加了课程面向的用户属性与用户属性之间匹配度的限定,搜索结果不仅更加明确的体现出了用户的实际需求,而且更加贴合用户的属性身份。
在一个实施例中,如图5所示,步骤S340:根据匹配度和课程偏好度对搜索得到的课程进行排序,包括:
步骤S341:分别获取匹配度和课程偏好度对应的权重。
具体的,服务器可通过调用预存的配置文件分别获取到匹配度和课程偏好度的权重,这里的权重指的是匹配度和课程偏好度相对的比例分配,权重的大小体现两个参数对课程的排序结果的影响程度。
步骤S342:根据权重对搜索得到的课程进行打分,得到每个课程对应的分值。
获取到匹配度和课程偏好度的权重后,服务器将根据课程的匹配度的大小、课程偏好度的大小以及所获取的权重进行计算,根据计算结果为每个课程分配一个分值,使该分值能够同时反映课程偏好度以及匹配度,课程偏好度越大,分值越高,匹配度越大,分值越高。
步骤S343:根据课程对应的分值对搜索得到的课程进行排序,其中,分值越高则课程的排序越靠前。
根据课程偏好度和匹配度计算得到课程的分值,根据该分值进行课程的排序,课程的排序顺序能够同时体现用户对与该课程偏好度和以及课程属性的匹配度。本实施例中,将两个参数用一个分值来体现,依据分值进行排序,分值高则靠前,分值低则靠后,排序过程将更加简单,另外,通过为课程偏好度和属性的匹配度分配权重,能够根据需求对两个参数所占比重进行优化以得到与用户需求更加贴合的课程搜索结果。
在一个实施例中,如图6所示,在线搜索课程方法还包括如下步骤:
步骤S410:统计用户的历史行为数据,历史行为数据是用户在历史时间对课程的操作行为数据。
具体的,终端应用将获取到的用户对于课程的操作数据上报到服务器,服务器将对应用户标识存储该上报的数据,服务器存储的用户对于课程的操作数据即为用户历史行为数据。随着用户对于课程的操作数据的不断产生,服务器中将不断更新存储的用户的历史行为数据。
步骤S420:根据历史行为数据,计算用户对于课程的课程偏好度。
服务器统计分析存储的历史行为数据,通过调用预存的计算算法计算得到用户对于课程的偏好度。
其中,服务器中预先存储有多个计算算法,为验证多个计算算法的优劣,可以通过对不同的用户标识分配不同的计算算法来计算用户偏好度,例如为尾号为1-5的用户标识分配第一计算算法,为尾号为6-9的用户标识分配第二计算算法。统计根据不同计算算法所得的偏好度进行课程搜索得到的搜索结果与用户的实际需求的贴合程度,如果贴合程度高,则计算算法的计算准确度高。
步骤S430:对应用户标识存储用户对课程的课程偏好度。
存储课程偏好度时,以该课程偏好度对应的历史行为数据的发起人的用户标识作为存储标签以便于用户搜索时快速准确的获取用户对应的课程偏好度。
在一个实施例中,历史行为数据包括第一历史行为数据和第二历史行为数据,第一历史行为数据为在设定历史时刻统计的用户的行为数据,第二历史行为数据为当前搜索时刻前设定时间段内的用户的行为数据。
如图7所示,历史时刻t1之前的行为数据为第一历史行为数据,第一历史行为数据为服务器在历史时刻t1统计的数据,第二历史行为数据为当前搜索时刻t0前t时间段内的历史行为数据,即t2-t0之间的历史行为数据。其中,时间段t不具体限定,可以为两个小时、三个小时等。随着搜索的不断继续,第二历史行为数据将不断发生变化。在设定时间后,服务器可以重新收集某一时刻前的所有的用户的行为数据,并将重新收集的用户行为数据作为第一历史行为数据进行离线计算,且随着搜索的继续,第二历史行为数据将产生。
如图8所示,步骤S420:根据历史行为数据,计算用户对于课程的课程偏好度的步骤,包括:
步骤S421:根据第一历史行为数据离线计算用户对于课程的课程偏好度。
在一个实施例中,应用Hive数据仓库对第一历史数据进行离线分析计算,得到第一历史行为数据对应的课程偏好度。
Hive是Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据表,提供完整的结构化查询语言(SQL,Structured Query Language)查询功能,可以将SQL语句转换为MapReduce任务进行运行,也可以通过类SQL语句快速实现简单的MapReduce统计。通过向Hive提供计算用户偏好度的算法,Hive基于相应算法对历史行为数据进行统计分析。其中,Hadoop实现了一个分布式文件系统,HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。
步骤S422:根据第二历史行为数据调整课程偏好度。
服务器对第一历史行为数据的收集为定期收集,第一历史行为数据中没有包括当前搜索时刻与服务器最近一次收集第一历史行为数据对应的历史时刻之间的数据。当第一历史行为数据对应的历史时刻与当前搜索时刻之间的时间间距小于设定值,为了节省计算资源,可以不执行根据第二历史行为数据调整课程偏好度的步骤,但当第一历史行为数据对应的历史时刻与当前搜索时刻之间的时间间距较长时,仅依据第一历史行为数据进行计算会使计算得到的偏好度不能很好的反反映用于实际对课程的偏好程度。
因此,本实施例中在根据第一历史行为数据进行计算的基础上,通过第二历史行为数据对根据第一历史行为数据计算的偏好度进行调整,使得偏好度的计算更加准确,进而根据偏好度得到的搜索结果能够更加准确反映用户的实际需求,搜索结果准确度更高。
在一个实施例中,如图9所示,步骤S422:根据第二历史行为数据调整课程偏好度,包括:
步骤S4221:根据第二历史行为数据获取第二历史行为数据所处时间段内用户对课程的操作频率。
步骤S4222:获取第二历史行为数据所处时间段内的课程搜索结果,根据搜索结果获取课程的曝光率。
步骤S4223:当曝光率与操作频率的比值大于预设值时,降低课程的偏好度;当曝光率与操作频率的比值小于预设值,则提高课程的偏好度。
曝光率与操作频率的比值大于预设值说明课程曝光率较高而用户对课程的操作频率相对较低,在这种情况下,降低该课程的用户偏好度,向后调整该课程;相应的,提高曝光率较低而用户对课程的操作频率较高的课程的课程偏好度,向前调整该课程。调整后的课程偏好度能够更加准确反映用户当前的课程需求,同时避免了只根据用户对课程的第一历史行为对搜索结果排序,导致一些历史得分不好的课程没有曝光的机会。
在一个实施例中,可以应用Spark分析计算第二历史行为数据,并根据操作频率和曝光率快速调整课程偏好度。Spark是基于内存计算的计算框架Spark的查询和计算速速度较快。在另一个实施例中,也可以应用Spark分析计算第二历史行为数据。
本实施例中,在根据第一历史行为数据进行离线分析的基础上,使用第二历史行为数据对偏好度数值进行调整,进一步提高了课程偏好度与用户实际需求的贴合程度。
在一个实施例中,采用如图10所示的架构实现课程搜索方法,具体为:
终端获取用户对于课程的操作行为数据并将该数据上报给数据收集服务器,该操作行为数据作为用户的历史行为数据。数据收集服务器定期将该数据传送给Hadoop接口集群,计算集群中的Hive将对该数据(上述的第一历史行为数据)进行计算分析,得到对应课程信息库中每一门课程的课程偏好度,此外,数据收集服务器将用户的历史行为数据中准实时数据流(上述的第二历史行为数据)传送给计算集群中的Spark,Spark对该准实时数据流进行计算分析,根据分析结果对上述计算得到的课程偏好度进行调整,得到最终的课程偏好度,并将该数据传送给Mysql数据库存储,Mysql数据库可将部分课程偏好度数据拉取到Cache缓存中,以便于搜索服务器进行查询。
计算集群还获取用户的属性信息,结合课程信息库中每一门课程标识的课程面向的用户属性标签,计算得到用户的属性信息与课程的用户属性标签的匹配度,并将该数据传送给Mysql数据库存储,Mysql数据库可将部分课程的属性匹配度数据拉取到Cache缓存中,以便于搜索服务器进行查询。
终端将获取到的用户触发的搜索请求发送给搜索服务器,搜索服务器根据搜索请求中携带的搜索条件数据搜索相匹配的课程,并向Cache缓存中获取匹配课程的课程偏好度和课程的属性匹配度,根据课程的偏好度和属性匹配度对匹配的课程进行排序,生成课程搜索结果并返回给终端,终端显示该课程搜索结果。
如图11所示,在一个实施例中,提供了一种在线课程搜索装置,包括:
搜索请求模块510,用于接收课程搜索请求,所述课程搜索请求中携带用户标识和搜索条件数据。
偏好度获取模块520,用于根据所述用户标识查找用户的课程偏好度,所述课程偏好度是通过对用户的历史行为数据统计得到的且反映了用户对课程的偏好程度。
匹配模块530,用于搜索得到与所述搜索条件数据匹配的课程。
排序模块540,用于根据所述用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前。
在一个实施例中,如图12所示,课程搜索装置还包括:
属性标签获取模块610,用于获取搜索得到的课程所面向的用户属性标签。
属性信息获取模块620,用于获取与所述用户标识对应的用户属性信息。
匹配度获取模块630,用于获取所述用户属性信息与所述用户属性标签之间的匹配度。
排序模块540,还用于根据所述匹配度和所述课程偏好度对搜索得到的课程进行排序,其中,用户的课程偏好度越高则对应的课程的排序越靠前,所述匹配度越高则对应的课程的排序越靠前。
在一个实施例中,如图12所示,排序模块540还用于分别获取所述匹配度和所述课程偏好度对应的权重,根据所述权重对所述搜索得到的课程进行打分,得到每个课程对应的分值,根据所述课程对应的分值对搜索得到的课程进行排序,其中,分值越高则课程的排序越靠前。
在一个实施例中,如图13所示,课程搜索装置还包括:
统计模块710,用于统计用户的历史行为数据,所述历史行为数据是用户在历史时间对课程的操作行为数据。
偏好度计算模块720,用于根据所述历史行为数据计算用户对课程的课程偏好度。
存储模块730,用于对应用户标识存储所述用户对课程的课程偏好度。
在一个实施例中,所述历史行为数据包括第一历史行为数据和第二历史行为数据,所述第一历史行为数据为在设定历史时刻统计的用户的行为数据,所述第二历史行为数据为当前搜索时刻前设定时间段内的用户的行为数据;
如图14所示,所述偏好度计算模块720包括:
计算模块721,用于根据所述第一历史行为数据离线计算所述用户对于课程的课程偏好度。
调整模块722,根据所述第二历史行为数据调整所述课程偏好度。
在一个实施例中,调整模块722还用于根据所述第二历史行为数据获取第二历史行为数据所处时间段内用户对课程的操作频率;获取所述第二历史行为数据所处时间段内生成的课程搜索结果,根据所述搜索结果获取课程的曝光率;当所述曝光率与所述操作频率的比值大于预设值时,降低所述课程偏好度;当所述曝光率与所述操作频率的比值小于预设值,则提高所述课程偏好度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (14)

1.一种在线课程搜索方法,包括以下步骤:
接收课程搜索请求,所述课程搜索请求中携带用户标识和搜索条件数据;
根据所述用户标识查找用户的课程偏好度;所述课程偏好度反映了用户对课程的偏好程度,所述课程偏好度是通过第二历史行为数据对根据第一历史行为数据计算的偏好度调整得到的,所述第二历史行为数据为当前搜索时刻前设定时间段内的用户的行为数据,所述第一历史行为数据为定期收集的设定历史时刻统计的用户的行为数据;
搜索得到与所述搜索条件数据匹配的课程;
根据所述用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前;
通过第二历史行为数据对根据第一历史行为数据计算的偏好度进行调整的步骤,包括:
当所述第一历史行为数据对应的历史时刻与当前搜索时刻之间的时间间距不小于时间间距设定值时,根据所述第二历史行为数据获取第二历史行为数据所处时间段内用户对课程的操作频率;
获取所述第二历史行为数据所处时间段内生成的课程搜索结果,根据所述课程搜索结果获取课程的曝光率;
当所述曝光率与所述操作频率的比值大于预设值时,降低根据第一历史行为数据计算的偏好度;当所述曝光率与所述操作频率的比值小于预设值,则提高所述课程偏好度;
当所述第一历史行为数据对应的历史时刻与当前搜索时刻之间的时间间距小于所述时间间距设定值时,将根据所述第一历史行为数据计算的偏好度确定为所述用户标识对应用户的课程偏好度。
2.根据权利要求1所述的方法,其特征在于,在所述搜索得到与所述搜索条件数据匹配的课程之后,还包括:
获取搜索得到的课程所面向的用户属性标签;
获取与所述用户标识对应的用户属性信息;
获取所述用户属性信息与所述用户属性标签之间的匹配度;
所述根据用户的课程偏好度对搜索得到的课程进行排序的步骤,包括:
根据所述匹配度和所述课程偏好度对搜索得到的课程进行排序,其中,用户的课程偏好度越高则对应的课程的排序越靠前,所述匹配度越高则对应的课程的排序越靠前。
3.根据权利要求2所述的方法,其特征在于,所述根据所述匹配度和所述课程偏好度对搜索得到的课程进行排序,包括:
分别获取所述匹配度和所述课程偏好度对应的权重;
根据所述权重对所述搜索得到的课程进行打分,得到每个课程对应的分值;
根据所述课程对应的分值对搜索得到的课程进行排序,其中,分值越高则课程的排序越靠前。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
统计用户的历史行为数据,所述历史行为数据是用户在历史时间对课程的操作行为数据;
根据所述历史行为数据计算用户对课程的课程偏好度;
对应用户标识存储所述用户对课程的课程偏好度。
5.根据权利要求4所述的方法,其特征在于,
所述根据所述历史行为数据计算用户对课程的课程偏好度的步骤,包括:
根据所述第一历史行为数据离线计算所述用户对于课程的课程偏好度;
根据所述第二历史行为数据调整所述课程偏好度。
6.根据权利要求1所述的方法,其特征在于,所述第一历史行为数据和所述第二历史行为数据包括对课程进行的报名操作、收藏操作、分享操作、试听操作、上课操作和评价操作。
7.一种在线课程搜索装置,其特征在于,包括:
搜索请求模块,用于接收课程搜索请求,所述课程搜索请求中携带用户标识和搜索条件数据;
偏好度获取模块,用于根据所述用户标识查找用户的课程偏好度;所述课程偏好度反映了用户对课程的偏好程度,所述课程偏好度是通过第二历史行为数据对根据第一历史行为数据计算的偏好度调整得到的,所述第二历史行为数据为当前搜索时刻前设定时间段内的用户的行为数据,所述第一历史行为数据为定期收集的设定历史时刻统计的用户的行为数据;
匹配模块,用于搜索得到与所述搜索条件数据匹配的课程;
排序模块,用于根据所述用户的课程偏好度对搜索得到的课程进行排序,生成课程搜索结果,其中用户的课程偏好度越高则对应的课程的排序越靠前;
偏好度计算模块,所述偏好度计算模块包括调整模块,所述调整模块用于根据所述第二历史行为数据调整所述课程偏好度;所述调整模块还用于当所述第一历史行为数据对应的历史时刻与当前搜索时刻之间的时间间距不小于时间间距设定值时,根据所述第二历史行为数据获取第二历史行为数据所处时间段内用户对课程的操作频率;获取所述第二历史行为数据所处时间段内生成的课程搜索结果,根据所述搜索结果获取课程的曝光率;当所述曝光率与所述操作频率的比值大于预设值时,降低所述课程偏好度;当所述曝光率与所述操作频率的比值小于预设值,则提高所述课程偏好度;当所述第一历史行为数据对应的历史时刻与当前搜索时刻之间的时间间距小于所述时间间距设定值时,将根据所述第一历史行为数据计算的偏好度确定为所述用户标识对应用户的课程偏好度。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
属性标签获取模块,用于获取搜索得到的课程所面向的用户属性标签;
属性信息获取模块,用于获取与所述用户标识对应的用户属性信息;
匹配度获取模块,用于获取所述用户属性信息与所述用户属性标签之间的匹配度;
所述排序模块还用于根据所述匹配度和所述课程偏好度对搜索得到的课程进行排序,其中,用户的课程偏好度越高则对应的课程的排序越靠前,所述匹配度越高则对应的课程的排序越靠前。
9.根据权利要求8所述的装置,其特征在于,所述排序模块还用于分别获取所述匹配度和所述课程偏好度对应的权重,根据所述权重对所述搜索得到的课程进行打分,得到每个课程对应的分值,根据所述课程对应的分值对搜索得到的课程进行排序,其中,分值越高则课程的排序越靠前。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括统计模块和存储模块:
所述统计模块,用于统计用户的历史行为数据,所述历史行为数据是用户在历史时间对课程的操作行为数据;
所述偏好度计算模块,用于根据所述历史行为数据计算用户对课程的课程偏好度;
所述存储模块,用于对应用户标识存储所述用户对课程的课程偏好度。
11.根据权利要求10所述的装置,其特征在于,
所述偏好度计算模块还包括:
计算模块,用于根据所述第一历史行为数据离线计算所述用户对于课程的课程偏好度。
12.根据权利要求7所述的装置,其特征在于,所述第一历史行为数据和所述第二历史行为数据包括对课程进行的报名操作、收藏操作、分享操作、试听操作、上课操作和评价操作。
13.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的方法的步骤。
14.一种移动终端,包括存储器及处理器,所述存储器中储存有计算机可读指令,所述指令被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述的方法的步骤。
CN201610387557.4A 2016-06-01 2016-06-01 在线课程搜索方法和装置 Active CN106095842B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610387557.4A CN106095842B (zh) 2016-06-01 2016-06-01 在线课程搜索方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610387557.4A CN106095842B (zh) 2016-06-01 2016-06-01 在线课程搜索方法和装置

Publications (2)

Publication Number Publication Date
CN106095842A CN106095842A (zh) 2016-11-09
CN106095842B true CN106095842B (zh) 2021-06-25

Family

ID=57448162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610387557.4A Active CN106095842B (zh) 2016-06-01 2016-06-01 在线课程搜索方法和装置

Country Status (1)

Country Link
CN (1) CN106095842B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682144B (zh) * 2016-12-20 2018-07-13 深圳壹账通智能科技有限公司 页面展示方法和装置
CN107392812A (zh) * 2017-09-01 2017-11-24 安徽教育网络出版有限公司 一种基于语义的中小学教育资源应用服务系统
CN108319646B (zh) * 2017-12-26 2020-10-09 金瓜子科技发展(北京)有限公司 基于用户历史行为的车源搜索方法及装置
CN108416072A (zh) * 2018-05-16 2018-08-17 广东心里程教育集团有限公司 一种自动推送在线课程的方法和系统
CN109063127A (zh) * 2018-08-02 2018-12-21 深圳市京华信息技术有限公司 一种搜索方法、装置、服务器及存储介质
CN110223133B (zh) * 2019-04-23 2024-03-08 平安科技(深圳)有限公司 产品展示方法、装置、计算机设备和存储介质
CN110516979A (zh) * 2019-09-02 2019-11-29 西南大学 一种个性化学习评价方法及装置
CN111080339B (zh) * 2019-11-18 2024-01-30 口口相传(北京)网络技术有限公司 基于场景的类目偏好数据生成方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462573A (zh) * 2014-12-29 2015-03-25 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置
CN104484380A (zh) * 2014-12-09 2015-04-01 百度在线网络技术(北京)有限公司 个性化搜索方法及装置
CN104951441A (zh) * 2014-03-24 2015-09-30 阿里巴巴集团控股有限公司 一种对对象进行排序的方法及装置
CN104978483A (zh) * 2015-06-10 2015-10-14 南京邮电大学 支持偏好度动态修正的Web服务选择方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030208399A1 (en) * 2002-05-03 2003-11-06 Jayanta Basak Personalized product recommendation
CN101334796B (zh) * 2008-02-29 2011-01-12 浙江师范大学 一种个性化及协同化融合的网上多媒体检索与查询方法
JP5424583B2 (ja) * 2008-06-13 2014-02-26 キヤノン株式会社 X線画像診断装置、及びその制御方法
CN102542474B (zh) * 2010-12-07 2015-10-21 阿里巴巴集团控股有限公司 查询结果排序方法及装置
CN103544212B (zh) * 2013-09-09 2017-04-05 Tcl集团股份有限公司 一种内容推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951441A (zh) * 2014-03-24 2015-09-30 阿里巴巴集团控股有限公司 一种对对象进行排序的方法及装置
CN104484380A (zh) * 2014-12-09 2015-04-01 百度在线网络技术(北京)有限公司 个性化搜索方法及装置
CN104462573A (zh) * 2014-12-29 2015-03-25 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置
CN104978483A (zh) * 2015-06-10 2015-10-14 南京邮电大学 支持偏好度动态修正的Web服务选择方法

Also Published As

Publication number Publication date
CN106095842A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN106095842B (zh) 在线课程搜索方法和装置
WO2022141861A1 (zh) 情感分类方法、装置、电子设备及存储介质
US20190311024A1 (en) Techniques for combining human and machine learning in natural language processing
US9390378B2 (en) System and method for high accuracy product classification with limited supervision
JP2019504371A (ja) 自動質問応答システムにおける質問クラスタリング処理方法及び装置
US20140314311A1 (en) System and method for classification with effective use of manual data input
US11556851B2 (en) Establishing a communication session between client terminals of users of a social network selected using a machine learning model
TW201317814A (zh) 搜索結果排序方法及設備、搜索方法及設備
CN106663104A (zh) 学习和使用用于查询消歧的上下文内容检索规则
US10147020B1 (en) System and method for computational disambiguation and prediction of dynamic hierarchical data structures
US20200005194A1 (en) Machine learning for associating skills with content
US11275994B2 (en) Unstructured key definitions for optimal performance
CN109558384B (zh) 日志分类方法、装置、电子设备和存储介质
JP6307822B2 (ja) プログラム、コンピュータおよび訓練データ作成支援方法
US20190332621A1 (en) Personnel selecting device, personnel selecting system, personnel selecting method, and recording medium
WO2022160442A1 (zh) 答案生成方法、装置、电子设备及可读存储介质
CN109542757A (zh) 接口测试环境确定方法、装置、电子设备及存储介质
CN109409419B (zh) 用于处理数据的方法和装置
CN111639077A (zh) 数据治理方法、装置、电子设备、存储介质
CN114881712A (zh) 智能广告投放方法、装置、设备及存储介质
CN110929169A (zh) 基于改进Canopy聚类协同过滤算法的职位推荐方法
CN114020892A (zh) 基于人工智能的答案选取方法、装置、电子设备及介质
CN111339290A (zh) 一种文本分类方法和系统
US20160063394A1 (en) Computing Device Classifier Improvement Through N-Dimensional Stratified Input Sampling
US8880562B2 (en) Generating a supplemental description of an entity

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant