CN111079002A - 一种基于隐式反馈数据的偏好计算方法及数据生成装置 - Google Patents

一种基于隐式反馈数据的偏好计算方法及数据生成装置 Download PDF

Info

Publication number
CN111079002A
CN111079002A CN201911181837.XA CN201911181837A CN111079002A CN 111079002 A CN111079002 A CN 111079002A CN 201911181837 A CN201911181837 A CN 201911181837A CN 111079002 A CN111079002 A CN 111079002A
Authority
CN
China
Prior art keywords
preference
lesson
value
data
appointment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911181837.XA
Other languages
English (en)
Other versions
CN111079002B (zh
Inventor
刘思喆
杜亚磊
齐琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Havo Online Technology Co ltd
Original Assignee
Beijing Dasheng Online Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dasheng Online Technology Co ltd filed Critical Beijing Dasheng Online Technology Co ltd
Priority to CN201911181837.XA priority Critical patent/CN111079002B/zh
Publication of CN111079002A publication Critical patent/CN111079002A/zh
Application granted granted Critical
Publication of CN111079002B publication Critical patent/CN111079002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

本发明公开了一种基于隐式反馈数据的偏好计算方法,包括如下步骤:获取用户约课数据;根据用户约课数据生成偏好比对数据;根据偏好比对数据和偏好值计算模型获取偏好计算值;根据偏好计算值和偏好预测值对约课集合中的对象进行排序;用户约课数据包括约课对象和约课时间。本发明量化了用户的主观偏好,根据偏好计算值和偏好预测值对约课集合中的对象进行排序;更科学的得到了授课平台中所有可约课对象的排序分值。本发明方法以每位用户下的偏好计算值和偏好预测值为排序指标,能够实现个性化约课对象的搜索和推荐。通过使用本发明方法为用户推荐约课对象后,用户对所约课对象的好评率有了明显的提高。

Description

一种基于隐式反馈数据的偏好计算方法及数据生成装置
技术领域
本发明涉及一种基于隐式反馈数据的偏好计算方法及数据生成装置,属于互联网教育领 域。
背景技术
“互联网+教育”是随着当今科学技术的不断发展,互联网科技与教育领域相结合的一种 新的教育形式。互联网教育是利用信息化技术对教育行业进行变革,让更多人以更低的成本 享受更好教育资源的教育方式。其中一对一的英语外教授课平台,让中国用户有机会通过视 频直接向外国老师学习纯正的英语。在英语外教授课平台上,面对众多老师,用户存在不知 如何选择授课老师的问题,而如何为学员匹配最适合的老师,也是所有一对一授课平台一直 存在的问题。
发明内容
本发明的目的在于,提供一种基于隐式反馈数据的偏好计算方法,其能够量化用户对每 个约课对象的偏好值,通过量化后的偏好值,来获取用户的对约课对象的个性化排序及授课 平台上所有约课对象的排序,既能满足老用户的个性化需求,又能为新用户提供约课对象的 优选方案。
为解决上述技术问题,本发明采用如下的技术方案:一种基于隐式反馈数据的偏好计算 方法,包括如下步骤:
获取用户约课数据;根据用户约课数据生成偏好比对数据;根据偏好比对数据和偏好值 计算模型获取偏好计算值;根据偏好计算值和偏好预测值对约课集合中的对象进行排序;用 户约课数据包括约课对象和约课时间;所述偏好值计算模型包括第一组评分模型r=A,v=B2, 其中r为能力评分,v为方差,B为偏差值,A和B为正整数值;偏好值计算模型包括第二组 评分模型r=rold,v=min(Vold+c2t,B2),其中c为衡量时间因素的常量系数,t为用户约课同一 约课对象的时间间隔;偏好值计算模型包括第三组评分模型
Figure BDA0002291473510000011
Figure BDA0002291473510000012
其中
Figure BDA0002291473510000013
sj等于0或者1,ej表示约课对象被用 户约课的概率。
前述的这种基于隐式反馈数据的偏好计算方法,所述根据用户约课数据生成偏好比对数 据包括如下步骤:
步骤S01:获取偏好对象数据,所述偏好对象数据包括用户近3个月的所约对象和收藏 对象。
步骤S02:判断约课对象是否记录在偏好对象数据中;若在偏好对象数据中记录有所述 约课对象,则执行步骤S03;若在偏好对象数据中未记录有约课对象,则执行步骤S04;
步骤S03:检索偏好对象数据中是否存在其它可约课对象,所述其它可约课对象在所述 约课时间段内可约课;若在所述约课时间段内存在其它可约课对象,则记录所述其它可约课 对象并执行步骤S05;若在所述约课时间段内不存在其它可约课对象,则执行步骤S06;
步骤S04:停止检索,且无偏好比对数据生成;
步骤S05:生成所述偏好比对数据;
步骤S06:停止生成偏好比对数据。
前述的这种基于隐式反馈数据的偏好计算方法,所述根据偏好比对数据和偏好值计算模 型获取偏好计算值包括如下步骤:
步骤S07:判断所述约课对象是否在约课集合中,若判断结果为否,则执行步骤S08;若 判断结果为是,则执行步骤S09;
步骤S08:根据所述第一组评分模型计算约课对象的初评数值;
步骤S09:根据所述第二组评分模型计算约课对象的再评数值,和/或
根据所述第二组评分模型计算所述其他约课对象的再评数值;
步骤S10:根据所述第三组评分模型更新计算约课对象再评数值,和/或
根据所述第三组评分模型更新计算所述其他约课对象的再评数值。其他约课对象可以是授课平台上的任一个或多个用户可约课对象。
前述的这种基于隐式反馈数据的偏好计算方法,在根据所述偏好计算值和偏好预测值对 约课集合中的对象进行排序之前,还包括通过第四组评分模型获取所述偏好预测值,所述第 四组评分模型包括
Figure BDA0002291473510000021
Figure BDA0002291473510000022
其中
Figure BDA0002291473510000023
为U矩阵和T矩阵中的所有 元素集合,g(xui-xuj)表示xui>xuj的概率,U矩阵是代表用户的特征矩阵,T矩阵是代表 约课对象的特征矩阵。
前述的这种基于隐式反馈数据的偏好计算方法,所述通过第四组评分模型获取偏好预测 值包括如下步骤:
步骤S011:随机初始化
Figure BDA0002291473510000024
的值;
步骤S012:随机抽取一位用户u,从X矩阵的第u行中抽取两个非零元素i和j,根据所述i和j之间的值和第四组评分模型
Figure BDA0002291473510000031
获得
Figure BDA0002291473510000032
的更新值;
步骤S013:重复步骤S012直到收敛,收敛的标准是
Figure BDA0002291473510000033
前述的一种基于隐式反馈数据的偏好计算方法,所述约课集合中的元素为授课系统中的 所有可所约对象。
前述的一种基于隐式反馈数据的偏好计算方法,所述约课集合中的元素为用户近3个月 的所约对象和收藏对象。
前述的一种基于隐式反馈数据的偏好计算方法,所述步骤S05之前,当连续30min内所 述用户的约课对象相同时,则执行步骤S06;约课对象加入授课系统的时间小于30天时,则 B的取值大于等于45;所述约课对象加入授课系统的时间大于30天时,则B的取值大于等于 30;所述偏好计算值在24小时内的数值变化小于等于200。
一种基于隐式反馈数据的数据生成装置,所述装置包括:
用户行为数据获取模块,用于获取用户的约课数据,所述约课数据包括约课对象和约课 时间;
偏好数据生成模块,用于根据用户的约课数据生成偏好比对数据;
偏好值计算模块,用于计算约课对象的偏好计算值;
偏好值预测模块,用于预测用户对未约课的对象的偏好预测值;
排序模块,用于根据所述偏好计算值和偏好预测值对约课集合中的对象进行排序,所述 约课集合中的对象包括授课系统中的所有所约对象或用户近3个月的所约对象和收藏对象;
第二数据限定模块,用于限制生成偏好比对数据的非生成条件,所述非生成条件为连续 30min内用户的约课对象相同;
第三数据限定模块,用于限制偏差值的取值范围,所述用户的约课对象加入授课系统的 时间小于30天时,则偏差值的取值大于等于45,所述用户的约课对象加入授课系统的时间 大于30时,则偏差值的取值大于等于30;
第一数据限定模块,用于将24小时内的偏好计算值的数值变化限制在0~200之间。
一种基于隐式反馈数据的处理装置,其特征在于,所述装置包括:
处理器;
存储器,其上存储有可在处理器上运行的计算机程序;
其中,所述计算机程序被处理器执行时实现如权利要求1至10中任一项的基于隐式反馈 数据的偏好计算方法的步骤。
与现有技术相比,本发明量化了用户的主观偏好,根据偏好计算值和偏好预测值对约课 集合中的对象进行排序;更科学的得到了授课平台中所有可约课对象的排序分值。本发明方 法以每位用户下的偏好计算值和偏好预测值为排序指标,能够实现个性化约课对象的搜索和 推荐。通过使用本发明方法为用户推荐约课对象后,用户对所约课对象的好评率有了明显的 提高。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的不当限制。在附图中:
图1是本发明的一种实施例的工作流程图;
图2是本发明的另一种实施例的工作流程图;
图3是本发明实施例2中的偏好值计算模型图。
下面结合附图和具体实施方式对本发明作进一步的说明。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合本发明实施例中的附图,对 本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一 部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有 做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等 是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据 在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那 些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不 排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清 楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或 设备固有的其它步骤或单元。
本发明的实施例1:一种基于隐式反馈数据的偏好计算方法,包括如下步骤:
步骤S1:获取用户约课数据;用户约课数据包括约课对象和约课时间;
步骤S2:根据用户约课数据生成偏好比对数据;
步骤S3:根据偏好比对数据和偏好值计算模型获取偏好计算值;
步骤S4:根据所述偏好计算值和偏好预测值对约课集合中的对象进行排序;
其中,偏好值计算模型包括第一组评分模型r=A,v=B2,其中r为能力评分,v为方差, B为偏差值,A和B为正整数值;
偏好值计算模型包括第二组评分模型r=rold,v=min(Vold+c2t,B2),其中c为衡量时间因素 的常量系数,t为用户约课同一约课对象的时间间隔;
偏好值计算模型包括第三组评分模型
Figure BDA0002291473510000051
其中
Figure BDA0002291473510000052
sj等于0或者1,ej表示约课对象被用户约课的概率。
进一步的,根据用户约课数据生成偏好比对数据包括如下步骤:
步骤S01:获取偏好对象数据,所述偏好对象数据包括用户近3个月的所约对象和收藏 对象。
步骤S02:判断约课对象是否记录在偏好对象数据中;若在偏好对象数据中记录有所述 约课对象,则执行步骤S03;若在偏好对象数据中未记录有所述约课对象,则执 行步骤S04;
步骤S03:检索偏好对象数据中是否存在其它可约课对象,所述其它可约课对象在所述 约课时间段内可约课;若在所述约课时间段内存在其它可约课对象,则记录所述 其它可约课对象并执行步骤S05;若在所述约课时间段内不存在其它可约课对象, 则执行步骤S06;
步骤S04:停止检索,且无偏好比对数据生成;
步骤S05:生成所述偏好比对数据;
步骤S06:停止生成偏好比对数据。
更进一步的,根据偏好比对数据和偏好值计算模型获取偏好计算值包括如下步骤:
步骤S07:判断所述约课对象是否在约课集合中,若判断结果为否,则执行步骤S08;若 判断结果为是,则执行步骤S09;
步骤S08:根据所述第一组评分模型计算所述约课对象的初评数值;
步骤S09:根据所述第二组评分模型计算所述约课对象的再评数值,和/或 根据所述第二组评分模型计算所述其他约课对象的再评数值;
步骤S10:根据所述第三组评分模型更新计算所述约课对象再评数值,和/或根据所述第 三组评分模型更新计算所述其他约课对象的再评数值。
其中,偏好预测值通过第四组评分模型来获取,所述第四组评分模型包括
Figure BDA0002291473510000053
Figure BDA0002291473510000054
其中
Figure BDA0002291473510000055
为U矩阵和T矩阵中的 所有元素集合,g(xui-xuj)表示xui>xuj的概率,U矩阵是代表用户的特征矩阵,T矩阵是代表约课对象的特征矩阵。
进一步的,通过第四组评分模型获取偏好预测值包括如下步骤:
步骤S011:随机初始化
Figure BDA0002291473510000063
的值;
步骤S012:随机抽取一位用户u,从X矩阵的第u行中抽取两个非零元素i和j,根据所述i和j之间的值和第四组评分模型
Figure BDA0002291473510000061
获得
Figure BDA0002291473510000064
的更新值;
步骤S013:重复步骤S012直到收敛,收敛的标准是
Figure BDA0002291473510000062
具体的,约课集合中的元素为授课系统中的所有可所约对象。
具体的,约课集合中的元素为用户近3个月的所约对象和收藏对象。
其中,在步骤S05之前,当连续30min内所述用户的约课对象相同时,则执行步骤S06; 约课对象加入授课系统的时间小于30天时,则B的取值大于等于45;所述约课对象加入授 课系统的时间大于30天时,则B的取值大于等于30;所述偏好计算值在24小时内的数值变 化小于等于200。
本发明实施例2:获取英语授课平台中的用户约课数据,根据用户约课数 据生成偏好比对数据,用户约课数据包括约课对象和约课时间。本例中,用户为 学员Ui,用户约课数据为学员选择上课的时间记为Sloti,约课时间为学员选择 的上课老师记为Tj,学员Ui收藏且上过课的老师有5个,记为 Si={T1,T2,T3,T4,T5},该学员Ui新约了一节课,通过图3所示偏好比对数据获 取模型,学员Ui约课数据获取过程如下:
Step1:检查被约的Tj老师是否在集合Si中。如果是,则进入step2,否则不记录该条数据。
Step2:假设被约的Tj老师就是老师集合Si中的老师T1,对该集合中其他老师(即{T2,...,T5}),查询他们在Sloti这个时段是否可约(即是否在该时段有课并且还未被其他学 员约走)。如果还有可约老师,则进入step3,否则不记录该条数据。
Step3:假设SI集合中的老师T2和T5也可约,则认为学员在约课时,可选的老师集合是{T1,T2,T5},最后选择了老师T1。说明在该学员看来,T1比T2和T5更适合该学员。 因此该数据记录为{Ui:T1>T2}和{Ui:T2>T5}两条老师之间的比对数据。
学员每发生一次约课行为,都会根据上述偏好比对数据获取模型来获取对应的偏好比对 数据。由于老师的可约状态是一直在动态变化的,实时查询其他老师在当时是否可约,才能 最大程度的还原用户约课时面临的选择,因而学员约课数据也是在学员约课时实时获取的。
此外,对比的老师集合Si中必须是学员上过课的老师,能够保证收集到的老师是用户(学 员)真实体验过的。即在本方法中只有学员真正上过所约课老师的课后,才能有评价老师的 权利。用户(学员)必须放弃某些体验过的老师,才会产生对比数据。这种数据获取方式记 录了用户对体验过的老师的真实偏好,相比传统的数据采集方法(例如学员直接根据老师信 息进行打分等)更准确的体现了用户(学员)对不同老师的偏好强弱程度。
进一步的,根据所获取的偏好比对数据{Ui:T1>T2}、{Ui:T2>T5}及偏好值计算模型获 取偏好计算值;
偏好计算值的获取是基于所获取的偏好比对数据和Glicko算法,对每位学员量化其在上 过课的老师的偏好值。其中,Glicko算法为各类竞技比赛中常用的一种评分系统。Glicko算 法中用Rating和RD(rating deviation)两个指标来衡量选手的能力。Rating表示评分的 估计,评分越高,能力越强;RD表示评分的标准差,标准差越大,评分波动的越厉害。每次 比赛之后都会更新参赛选手的Rating和RD两个指标,RD会越来越小,表示对评分估计的越来 越准确。而长时间未参赛的选手,RD会增加,表示随着时间的推移,选手的评分会有更大的 不确定性。
本例中将英语授课平台中的所有老师当作比赛选手,把用户(学员)约课时产生的偏好 比对数据,当作老师之间的比赛结果。例如,偏好比对数据{Ui:T1>T2}则代表:在用户(学 员)Ui的体系下,老师T1在一场比赛中击败了老师T2
具体的评分计算规则如下:
对于老师T1,记其能力评分(rating)为r;偏差(可理解为:标准差)为RD,为了方便计 算,记方差为v(v=RD2);第j次的比赛结果为Sj;在一个周期t+1内,参与了m次比赛。 则其进入系统后。则其进入系统后,随着比赛的增加,得分相应计算如下:
Step1:初始化评分
(a)无历史评分,评分r=rold,方差v=min(vold+c2t,3502),其中c为衡量时间 因素的常量系数,t为本次比赛和上次比赛的时间间隔(几个时间周期)
(b)有历史评分,评分r=rold,方差v=min(vold+c2t,3502),其中c为衡量时间因素的常量系数,t为本次比赛和上次比赛的时间间隔(几个时间周期)
Step2:更新评分rnew与方差vnew
(a)方差:
Figure BDA0002291473510000071
(b)评分:
Figure BDA0002291473510000081
其中:
Figure BDA0002291473510000082
sj等于0或者1,选手比赛胜利时取值为1,选手比 赛失败时取值为0。
Figure BDA0002291473510000083
ej表示选手比赛时获胜的概率,其中rj表示对手当前的 评分。
依照本发明上述算法,可设计两套老师的排序分系统。一套排序分系统是基于所有用户 产生的比对数据,来建立英语授课平台中的所有老师排序分系统;另一套排序分系统是基于 每个用户自己产生的对比数据,来建立英语授课平台中个性化老师(每个用户所选过的老师) 排序分系统。当从模块1中得到{Ui:T1>T2}这条数据(学员Ui的偏好数据)时,认为老师T1在一场比赛中打败了T2。依照Step2所述计算公式,对T1和T2的评分和方差进行更新。实际 应用中会同时更新所有老师排序分系统中的老师得分和个性化老师排序系统中的老师得分。
建立英语授课平台中的所有老师排序分系统的用处是,当一个新用户进入平台时,没有 任何历史行为数据,可以使用所有老师排序分系统中老师的得分作为个性化老师排序系统中 新用户的个性化得分。由此,新用户的起初偏好,取决于所有用户的历史行为;新用户在成 长过程中,会演化出自身的偏好,同时其偏好数据也会融入所有用户的偏好数据,并对下一 批新个体的偏好产生影响。
最后,考虑到英语授课平台中的实际情况(例如新旧老师的交替、老师开课次数限制等), 本发明基于多次试验测试,加入了对方差的上下限,以及每日分数变化的控制,具体数据限 制和阈值设置如下:
(1)同一用户在同一个小时内约课产生的相同老师偏好数据只记录一次,即若连续约两节 课,产生两对一样的老师数据,实际是用户一次比较下的结果,因此只记录一次。
(2)老师进入系统后的一个月内偏差值RD不低于45,一个月后不低于30。由于不同老师 曝光程度不同,维持一定的方差能保证老师的分数能一直根据用户的偏好变化而改变。
(3)同一老师在一天内的分值变化不超过200,为了保障老师分数的稳定性,避免如用户 多次取消再约课的行为导致形成多条老师偏好数据的极端情况,设置每日分数不超过一个档 位(200分)的限制。
进一步的,根据所述偏好计算值和偏好预测值对约课集合中的对象进行排序。
由于根据获取的用户偏好数据,仅能计算出用户上过课的老师偏好值。平台中老师的数 量,远远超过用户上过课的老师数量。因此还需要预测每位学员对未上过课老师的偏好值, 才能实现完整的个性化排序和推荐。
预测未上过课的老师的偏好值(即偏好预测值的获取),可作为矩阵补全的问题。如表1 所示,{U1,...,U5}代表5位学员,{T1,...,T2}代表5位老师,每行数据代表一位学员对所有老师 的偏好值,其中0代表学员从未上过老师的课程。
表1
Figure BDA0002291473510000091
于是,个性化偏好预测即等价于矩阵中0元素的补全问题。个性化的得分矩阵可以分解成:
Figure BDA0002291473510000092
其中ns代表学生数量,nt代表老师数量。每个学生和老师都可以用一个k维向量来表示,Ui表示第i位学员,Tj表示第j位老师。Ui*Tj表示第i个学生在第j个老师上的得分 偏好。通过采用BPFR(Bayesian Personalized Favored Ranking)模型对矩阵进行估计,从缺失的矩阵X中,推算出U矩阵和T矩阵,U矩阵是代表学员的特征矩阵,T矩阵是代表老师的特征矩阵,所有学员可以用U矩阵中的一列向量表示,所有老师可以用T矩阵中的一列向量表示。
传统的矩阵补全方法,都是为了预测矩阵中的非0元素,使得预测值与真实值的差异最小。 然而本发明中设计的BPFR算法,并不关注预测值与真实值之间的差异,而把焦点放在非零元 素的相对大小上。矩阵X中的非零元素,都是学员对上过课的老师的偏好值,BPFR算法拟合 的目标是,满足每行非零位置的数据的相对大小不变。即在预测得到的矩阵中,学员对上过 课的老师的偏好顺序是保持不变的。
使用Sx表示矩阵X中所有行非零元素之间两两比对的集合。例如表1的第一行数据,BPFR 算法构造的Sx集合中的元素是
{(U2,T1)<(U1,T3),(U2,T1)<(U1,T4),(U2,T1)<(U1,T5),(U2,T3)<(U1,T5)},这些数据组合会用于后续模型的训练。
Figure BDA0002291473510000109
表示U矩阵和T矩阵中的所有元素集合,假定
Figure BDA00022914735100001010
的先验分布是一个多维正态分布
Figure BDA0002291473510000101
目标是在给定矩阵X的情况下,计算
Figure BDA00022914735100001011
的后验分布。在已知X矩阵的情况下,
Figure BDA0002291473510000102
的后验似然概率如下:
Figure BDA0002291473510000103
其中,Sx表示X矩阵中的非0集合。
Figure BDA0002291473510000104
表示xui>xuj的概率。我们采用最大后验概率估计,求解
Figure BDA0002291473510000105
使得
Figure BDA0002291473510000106
最大化。具体的计算步骤如下:
(D1)随机初始化
Figure BDA00022914735100001012
的值
(D2)随机抽取一个学员u,从X矩阵的第u行中抽取两个非零元素i和j,根据二者之间的值 来更新
Figure BDA00022914735100001013
的值。
Figure BDA0002291473510000107
(D3)重复第(D2)步操作直到收敛,收敛的标准是
Figure BDA0002291473510000108
Figure BDA00022914735100001014
的值不会 有太大变化。
综合每位已上过课的老师个性化分值(即每位学员对所约课老师的个性化偏好值)以及 未上过课老师的个性化预测分值(每位学员对未上过课老师的偏好预测值),作为该用户下 的老师排序分,排序后分数最高的老师即为最适合该用户(学员Ui)的优质老师。
本实施例的方法量化了学员Ui的主观偏好,更科学的得到了老师的排序分值。以每位用 户(每位学员)下的个性化老师偏好为排序指标,实现了个性化老师搜索和推荐。以学员对 老师的课后好评率(学员上完课后,会评价是否对该老师满意)为评价指标,老师推荐的课后 好评率是89%,本例中的个性化排序系统中,学员的课后好评率是93%,显著提升了学员好评 率。
本发明实施例3:一种基于隐式反馈数据的数据生成装置,所述装置包括:
用户行为数据获取模块,用于获取用户的约课数据,所述约课数据包括约课对象和约课 时间;偏好数据生成模块,用于根据用户的约课数据生成偏好比对数据;偏好值计算模块, 用于计算约课对象的偏好计算值;偏好值预测模块,用于预测用户对未约课的对象的偏好预 测值;排序模块,用于根据所述偏好计算值和偏好预测值对约课集合中的对象进行排序,所 述约课集合中的对象包括授课系统中的所有所约对象或用户近3个月的所约对象和收藏对 象;第二数据限定模块,用于限制生成偏好比对数据的非生成条件,所述非生成条件为连续 30min内用户的约课对象相同;第三数据限定模块,用于限制偏差值的取值范围,所述用户 的约课对象加入授课系统的时间小于30天时,则偏差值的取值大于等于45,所述用户的约 课对象加入授课系统的时间大于30时,则偏差值的取值大于等于30;第一数据限定模块, 用于将24小时内的偏好计算值的数值变化限制在0~200之间。
本发明实施例4:一种基于隐式反馈数据的处理装置,所述装置包括:处理器;存储器, 其上存储有可在所述处理器上运行的计算机程序;其中,所述计算机程序被所述处理器执行 时实现如权利要求1至10中任一项所述的基于隐式反馈数据的偏好计算方法的步骤。

Claims (10)

1.一种基于隐式反馈数据的偏好计算方法,其特征在于,包括如下步骤:
获取用户约课数据;
根据用户约课数据生成偏好比对数据;
根据偏好比对数据和偏好值计算模型获取偏好计算值;
根据所述偏好计算值和偏好预测值对约课集合中的对象进行排序;
所述用户约课数据包括约课对象和约课时间;
所述偏好值计算模型包括第一组评分模型r=A,v=B2,其中r为能力评分,v为方差,B为偏差值,A和B为正整数值;
所述偏好值计算模型包括第二组评分模型r=rold,v=min(Vold+c2t,B2),其中c为衡量时间因素的常量系数,t为用户约课同一约课对象的时间间隔;
所述偏好值计算模型包括第三组评分模型
Figure FDA0002291473500000011
Figure FDA0002291473500000012
Figure FDA0002291473500000013
其中
Figure FDA0002291473500000014
sj等于0或者1,ej表示约课对象被用户约课的概率。
2.如权利要求1所述的一种基于隐式反馈数据的偏好计算方法,其特征在于,所述根据用户约课数据生成偏好比对数据包括如下步骤:
步骤S01:获取偏好对象数据,所述偏好对象数据包括用户近3个月的所约对象和收藏对象。
步骤S02:判断约课对象是否记录在偏好对象数据中;若在偏好对象数据中记录有所述约课对象,则执行步骤S03;若在偏好对象数据中未记录有所述约课对象,则执行步骤S04;
步骤S03:检索偏好对象数据中是否存在其它可约课对象,所述其它可约课对象在所述约课时间段内可约课;若在所述约课时间段内存在其它可约课对象,则记录所述其它可约课对象并执行步骤S05;若在所述约课时间段内不存在其它可约课对象,则执行步骤S06;
步骤S04:停止检索,且无偏好比对数据生成;
步骤S05:生成所述偏好比对数据;
步骤S06:停止生成偏好比对数据。
3.如权利要求2所述的一种基于隐式反馈数据的偏好计算方法,其特征在于,所述根据偏好比对数据和偏好值计算模型获取偏好计算值包括如下步骤:
步骤S07:判断所述约课对象是否在约课集合中,若判断结果为否,则执行步骤S08;若判断结果为是,则执行步骤S09;
步骤S08:根据所述第一组评分模型计算所述约课对象的初评数值;
步骤S09:根据所述第二组评分模型计算所述约课对象的再评数值,和/或
根据所述第二组评分模型计算所述其他约课对象的再评数值;
步骤S10:根据所述第三组评分模型更新计算所述约课对象再评数值,和/或
根据所述第三组评分模型更新计算所述其他约课对象的再评数值。
4.如权利要求3所述的一种基于隐式反馈数据的偏好计算方法,其特征在于,在根据所述偏好计算值和偏好预测值对约课集合中的对象进行排序之前,还包括通过第四组评分模型获取所述偏好预测值,所述第四组评分模型包括
Figure FDA0002291473500000021
Figure FDA0002291473500000022
其中
Figure FDA0002291473500000023
为U矩阵和T矩阵中的所有元素集合,g(xui-xuj)表示xui>xuj的概率,U矩阵是代表用户的特征矩阵,T矩阵是代表约课对象的特征矩阵。
5.如权利要求4所述的一种基于隐式反馈数据的偏好计算方法,其特征在于,所述通过第四组评分模型获取偏好预测值包括如下步骤:
步骤S011:随机初始化
Figure FDA0002291473500000027
的值;
步骤S012:随机抽取一位用户u,从X矩阵的第u行中抽取两个非零元素i和j,根据所述i和j之间的值和第四组评分模型
Figure FDA0002291473500000024
获得
Figure FDA0002291473500000025
的更新值;
步骤S013:重复步骤S012直到收敛,收敛的标准是
Figure FDA0002291473500000026
6.如权利要求5所述的一种基于隐式反馈数据的偏好计算方法,其特征在于,所述约课集合中的元素为授课系统中的所有可所约对象。
7.如权利要求5所述的一种基于隐式反馈数据的偏好计算方法,其特征在于,所述约课集合中的元素为用户近3个月的所约对象和收藏对象。
8.如权利要求6或7所述的一种基于隐式反馈数据的偏好计算方法,其特征在于,所述步骤S05之前,当连续30min内所述用户的约课对象相同时,则执行步骤S06;约课对象加入授课系统的时间小于30天时,则B的取值大于等于45;所述约课对象加入授课系统的时间大于30天时,则B的取值大于等于30;所述偏好计算值在24小时内的数值变化小于等于200。
9.一种基于隐式反馈数据的数据生成装置,其特征在于,所述装置包括:
用户行为数据获取模块,用于获取用户的约课数据,所述约课数据包括约课对象和约课时间;
偏好数据生成模块,用于根据用户的约课数据生成偏好比对数据;
偏好值计算模块,用于计算约课对象的偏好计算值;
偏好值预测模块,用于预测用户对未约课的对象的偏好预测值;
排序模块,用于根据所述偏好计算值和偏好预测值对约课集合中的对象进行排序,所述约课集合中的对象包括授课系统中的所有所约对象或用户近3个月的所约对象和收藏对象;
第二数据限定模块,用于限制生成偏好比对数据的非生成条件,所述非生成条件为连续30min内用户的约课对象相同;
第三数据限定模块,用于限制偏差值的取值范围,所述用户的约课对象加入授课系统的时间小于30天时,则偏差值的取值大于等于45,所述用户的约课对象加入授课系统的时间大于30时,则偏差值的取值大于等于30;
第一数据限定模块,用于将24小时内的偏好计算值的数值变化限制在0~200之间。
10.一种基于隐式反馈数据的处理装置,其特征在于,所述装置包括:
处理器;
存储器,其上存储有可在所述处理器上运行的计算机程序;
其中,所述计算机程序被所述处理器执行时实现如权利要求1至10中任一项所述的基于隐式反馈数据的偏好计算方法的步骤。
CN201911181837.XA 2019-11-27 2019-11-27 一种基于隐式反馈数据的偏好计算方法及数据生成装置 Active CN111079002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911181837.XA CN111079002B (zh) 2019-11-27 2019-11-27 一种基于隐式反馈数据的偏好计算方法及数据生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911181837.XA CN111079002B (zh) 2019-11-27 2019-11-27 一种基于隐式反馈数据的偏好计算方法及数据生成装置

Publications (2)

Publication Number Publication Date
CN111079002A true CN111079002A (zh) 2020-04-28
CN111079002B CN111079002B (zh) 2023-09-22

Family

ID=70311874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911181837.XA Active CN111079002B (zh) 2019-11-27 2019-11-27 一种基于隐式反馈数据的偏好计算方法及数据生成装置

Country Status (1)

Country Link
CN (1) CN111079002B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002079901A2 (en) * 2001-02-16 2002-10-10 Bee-Bee, Inc. Customer preference system
GB0618561D0 (en) * 2006-09-20 2006-11-01 Motorola Inc Context sensitive user preference prediction
CN103559252A (zh) * 2013-11-01 2014-02-05 桂林电子科技大学 给游客推荐其很可能会浏览的景点的方法
CN103870453A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN104965896A (zh) * 2015-06-23 2015-10-07 中国船舶重工集团公司第七0九研究所 基于二次函数表示用户偏好的推荐方法及系统
CN105488216A (zh) * 2015-12-17 2016-04-13 上海中彦信息科技有限公司 基于隐式反馈协同过滤算法的推荐系统及方法
CN106846029A (zh) * 2016-07-08 2017-06-13 华南师范大学 基于遗传算法和新型相似度计算策略的协同过滤推荐算法
CN109582864A (zh) * 2018-11-19 2019-04-05 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109635206A (zh) * 2018-11-22 2019-04-16 华南师范大学 融合隐式反馈和用户社会地位的个性化推荐方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002079901A2 (en) * 2001-02-16 2002-10-10 Bee-Bee, Inc. Customer preference system
GB0618561D0 (en) * 2006-09-20 2006-11-01 Motorola Inc Context sensitive user preference prediction
CN103870453A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN103559252A (zh) * 2013-11-01 2014-02-05 桂林电子科技大学 给游客推荐其很可能会浏览的景点的方法
CN104965896A (zh) * 2015-06-23 2015-10-07 中国船舶重工集团公司第七0九研究所 基于二次函数表示用户偏好的推荐方法及系统
CN105488216A (zh) * 2015-12-17 2016-04-13 上海中彦信息科技有限公司 基于隐式反馈协同过滤算法的推荐系统及方法
CN106846029A (zh) * 2016-07-08 2017-06-13 华南师范大学 基于遗传算法和新型相似度计算策略的协同过滤推荐算法
CN109582864A (zh) * 2018-11-19 2019-04-05 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109635206A (zh) * 2018-11-22 2019-04-16 华南师范大学 融合隐式反馈和用户社会地位的个性化推荐方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NIKI VECEK: "A comparison between different chess rating systems for ranking evolutionary algorithms", 《2014 FEDERATED CONFERENCE ON COMPUTER SCIENCE AND INFORMATION SYSTEMS》 *
段旭良: "等级分制度在学生自助评价中的应用研究", 《中国教育信息化》 *

Also Published As

Publication number Publication date
CN111079002B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
CN109903617B (zh) 个性化练习方法和系统
CN110704732B (zh) 基于认知诊断的时序性习题推荐方法、装置
US6763338B2 (en) Machine decisions based on preferential voting techniques
Barata et al. Early prediction of student profiles based on performance and gaming preferences
CN109816265B (zh) 知识特征掌握度的评价方法、题目推荐方法及电子设备
CN108874960A (zh) 一种在线学习中基于降噪自编码器混合模型的课程视频推荐算法
US20090061408A1 (en) Device and method for evaluating learning
KR20190006409A (ko) 암기학습 데이터를 활용한 단어 인지상태 정량화와 스마트기기 학습 및 스케줄링 장치 및 방법
CN116383481B (zh) 一种基于学生画像的个性化试题推荐方法及系统
Safrit et al. Item response theory and the measurement of motor behavior
CN114049240A (zh) 基于学生在线学习数据智能推荐题目及学习路径的方法
Wauters et al. Monitoring learners' proficiency: weight adaptation in the elo rating system
JP2010243662A (ja) リメディアル教育支援システム、リメディアル教育支援方法、およびメディアル教育支援プログラム
CN111080025A (zh) 学习特征数据的处理方法及装置、电子设备
CN111079002A (zh) 一种基于隐式反馈数据的偏好计算方法及数据生成装置
Schorer et al. How Good Are we at Predicting Athletes' Futures?
Pankiewicz et al. On-the-fly Estimation of Task Difficulty for Item-based Adaptive Online Learning Environments
Binh et al. Student ability estimation based on IRT
Ericsson Superior decision making as an integral quality of expert performance: Insights into the mediating mechanisms and their acquisition through deliberate practice
US11887506B2 (en) Using a glicko-based algorithm to measure in-course learning
CN113763767A (zh) 学习试题推送方法、装置、计算机设备和存储介质
JP2005331650A (ja) 学習システム、情報処理装置、情報処理方法およびプログラム
CN116739858B (zh) 基于时间序列分析的在线学习行为监测系统
CN110069704B (zh) 基于分数和任课教师的协同选课推荐方法
Grammatikopoulos et al. Influential factors of an educational programme implementation evaluation: A cross-validation approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220629

Address after: 100085 third floor, No. 9, Shangdi East Road, Haidian District, Beijing

Applicant after: Beijing havo Online Technology Co.,Ltd.

Address before: 100085 No.1, South District, 6th floor, No.9 Shangdi East Road, Haidian District, Beijing

Applicant before: BEIJING DASHENG ONLINE TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant