CN111930901B - 知识点向量获取、推荐题目确定方法及相关装置 - Google Patents

知识点向量获取、推荐题目确定方法及相关装置 Download PDF

Info

Publication number
CN111930901B
CN111930901B CN202011070029.9A CN202011070029A CN111930901B CN 111930901 B CN111930901 B CN 111930901B CN 202011070029 A CN202011070029 A CN 202011070029A CN 111930901 B CN111930901 B CN 111930901B
Authority
CN
China
Prior art keywords
topic
question
wrong
knowledge point
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011070029.9A
Other languages
English (en)
Other versions
CN111930901A (zh
Inventor
朱帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN202011070029.9A priority Critical patent/CN111930901B/zh
Publication of CN111930901A publication Critical patent/CN111930901A/zh
Application granted granted Critical
Publication of CN111930901B publication Critical patent/CN111930901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种知识点向量获取、推荐题目确定方法及相关装置,知识点向量获取方法包括:获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量;对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量。本发明实施例所提供的知识点向量获取、推荐题目确定方法及相关装置,可以保证对仅有较少信息的用户的推荐题目确定的实现基础获取,以提高推荐题目确定的准确性。

Description

知识点向量获取、推荐题目确定方法及相关装置
技术领域
本发明实施例涉及计算机领域,尤其涉及一种知识点向量获取、推荐题目确定方法及相关装置。
背景技术
随着计算机技术和互联网技术的发展,用户能够方便地得到大量的资源,然而,同时也就面临着信息过载的问题,为此,就需要根据用户的情况为其推荐适当的信息。
在教育领域,推荐题目确定是为了提高学生的学习效率而产生的需求,但如果推荐的题目与用户不匹配,可能会造成用户时间的浪费,影响用户的学习效率,因此需要根据用户的学习进行题目的推荐。
然而,要了解用户的学习情况就需要有一定数量的题目作答记录,对于仅有较少作答记录的新用户而言,则没办法获取到用户的学习情况,从而难以实现准确地对新用户的推荐题目确定。
为此,如何保证对仅有较少信息的用户的推荐题目确定的实现基础获取,以提高推荐题目确定的准确性就成为亟需解决的技术问题。
发明内容
本发明实施例提供一种知识点向量获取、推荐题目确定方法及相关装置,保证对仅有较少信息的用户的推荐题目确定的实现基础获取,以提高推荐题目确定的准确性。
为解决上述问题,本发明实施例提供一种知识点向量获取方法,包括获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量;
对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量。
为解决上述问题,本发明实施例提供一种推荐题目确定方法,包括:
获取目标用户的答错题目的错题信息,所述错题信息包括错题知识点;
利用所述错题知识点和提前确定的相似知识点数据,确定与所述错题知识点的相似度满足知识点相似度阈值的相似知识点,其中,所述相似知识点数据包括任意两个知识点之间的相似度,各个所述相似度通过任意两个所述知识点的知识点向量的相似度计算得到,所述知识点向量根据如前述任一项所述的知识点向量获取方法获取;
根据所述相似知识点在推荐题库中确定各个初步推荐题目,所述推荐题库中各个题目的题目信息包括题目知识点;
获取各个所述初步推荐题目与所述答错题目的题目相似度,根据所述题目相似度确定目标推荐题目。
为解决上述问题,本发明实施例提供一种知识点向量获取装置,包括:
错题信息矩阵获取单元,适于获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量;
知识点向量获取单元,适于对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量。
为解决上述问题,本发明实施例提供一种推荐题目确定装置,包括:
错题信息获取单元,适于获取目标用户的答错题目的错题信息,所述错题信息包括错题知识点;
相似知识点确定单元,适于利用所述错题知识点和提前确定的相似知识点数据,确定与所述错题知识点的相似度满足知识点相似度阈值的相似知识点,其中,所述相似知识点数据包括任意两个知识点之间的相似度,各个所述相似度通过任意两个所述知识点的知识点向量的相似度计算得到,所述知识点向量根据如前述任一项所述的知识点向量获取方法获取;
初步推荐题目获取单元,适于根据所述相似知识点在推荐题库中确定各个初步推荐题目,所述推荐题库中各个题目的题目信息包括题目知识点;
目标推荐题目确定单元,适于获取各个所述初步推荐题目与所述答错题目的题目相似度,根据所述题目相似度确定目标推荐题目。
为解决上述问题,本发明实施例提供一种存储介质,所述存储介质存储有适于知识点向量获取的程序,以实现如前述任一项所述的知识点向量获取方法,或者所述存储介质存储有适于推荐题目确定的程序,以实现如前述任一项所述的推荐题目确定方法。
为解决上述问题,本发明实施例提供一种设备,包括至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述程序,以执行如前述任一项所述的知识点向量获取方法或者如前述任一项所述的推荐题目确定方法。
与现有技术相比,本发明的技术方案具有以下优点:
本发明实施例所提供的知识点向量获取、推荐题目确定方法及相关装置,其中,知识点向量获取方法,首先利用已有用户的答错题目的数量信息和知识点信息构建错题信息矩阵,然后通过对错题信息矩阵的分解获取各个知识点向量。这样,通过对错题信息矩阵的分解得到的知识点向量,不同于直接根据知识点构建的向量,不仅包括了知识点的信息,还包括了已有用户的错题信息,因此,通过这种方式得到的知识点向量可以表示在某个知识点上答错的信息,而如果两个用户在同一个知识点上都答错,并且第一个用户在另一个知识点上也答错的话,那么第二个用户在另一个知识点上也有较大可能答错,因此,通过计算通过本发明实施例所提供的知识点向量获取方法得到知识点向量的相似度,就可以知道在一个知识点上答错的情况下,在另一个知识点上也答错的可能性,相似度越大,那么答错的可能性越大,这样,后续通过获取目标用户的答错题目的错题知识点以及基于知识点向量所得到的各个知识点之间的相似度,就可以确定目标用户在答错错题知识点的情况下,答错其他各个知识点的可能性的大小,也就可以根据由本发明实施例所提供的知识点向量获取方法得到的知识点向量的相似度确定目标用户答错可能性较大的知识点,而不仅仅是关联性较大的知识点,进而可以进一步在答错可能性较大的知识点中确定信息较少的用户的推荐题目,从而提高信息较少的用户的学习效率,并且也不需要获取目标用户过多的行为信息,保证冷启动情况下的推荐题目的确定以及所确定的推荐题目的准确性。
本发明实施例所提供的知识点向量获取、推荐题目确定方法及相关装置,其中推荐题目确定方法,首先获取目标用户的答错题目的错题信息,然后根据答错题目的错题知识点,在提前确定的相似知识点数据中,确定满足知识点相似度阈值的相似知识点,且相似知识点数据是通过知识点错题矩阵形成的知识点向量的相似度计算得到的,并进一步根据相似知识点在推荐题库中确定各个初步推荐题目,然后进一步根据各个初步推荐题目与答错题目的题目相似度,确定目标推荐题目。可以看出,本发明实施例所提供的推荐题目确定方法,在确定相似知识点时,所利用的是目标用户的答错题目的错题知识点和包含了知识点答错关联性信息的相似知识点数据,因此,所确定的相似知识点是目标用户在错题知识点答错的情况下,答错可能性很大的知识点,是基于用户答错行为的可能性大小而确定的,而非仅仅是根据知识点之间的关联性,使得所确定的相似知识点包含了用户可能的行为信息,更能贴近用户的实际情况,而不是仅仅根据知识点本身的关联性,从而可以避免仅从知识点的关联性上看相关度很高但用户基本不会犯错的知识点的推荐,使得所确定的相似知识点更能针对用户的行为,保证所确定的推荐题目的准确性,从而提高用户的学习效率;并且,相似知识点的确定仅根据目标用户的答错题目,无需获取目标用户过多的行为信息,也不需要根据目标用于与其他用户之间的行为信息相似度确定最接近的用户,可以实现在目标用户的行为信息较少的情况下,为目标用户确定相似知识点,从而进一步确定目标推荐题目,保证冷启动情况下的推荐题目的确定。
附图说明
图1是本发明实施例所提供的知识点向量获取方法的一流程示意图;
图2为本发明实施例所提供的知识点向量获取方法的通过矩阵分解获取知识点向量步骤的一流程示意图;
图3为本发明实施例所提供的推荐题目确定方法的另一流程示意图;
图4为本发明实施例所提供的推荐题目确定方法的确定各个初步推荐题目步骤的流程示意图;
图5为本发明实施例所提供的知识点向量获取装置的一框图;
图6是本发明实施例所提供的推荐题目确定装置的一框图;
图7是本发明实施例提供的电子设备的一种可选硬件设备架构。
具体实施方式
现有技术中,难以保证对仅有较少信息的用户的推荐题目确定的实现基础获取,以提高推荐题目确定的准确性。
在一种推荐题目确定方法中,为了实现对用户的推荐题目确定,可以直接根据用户的答错题目获取错题的知识点,然后确定相同知识点中的题目为推荐题目,但是,为了保证用户的学习效率,在进行题目推荐时,如果仅仅推荐相同知识点的题目,很有可能难以达到想要的学习效果。
比如,用户答错A知识点的题目,但实际上是由于与A知识点相关的其他知识点没有掌握好造成的,那么重复做A知识点的题目是不能起到很好的作用的,而应该将其他知识点的题目作为推荐的题目,并且对于用户而言,如果仅仅根据知识点之间的实质关联性就确定其他知识点的题目进行推荐,有可能用户已经掌握了关联性最大的知识点的题目,而关联性相对较小的知识点的题目没有掌握,也会造成所推荐的题目不能满足要求。
为了提高推荐题目的准确性,需要确定影响推荐准确性的因素,这一方面需要知识点之间关联性,另一方面还需要结合用户的情况,而不能直接通过知识点的实质内容之间的关联情况确定,而由于所需要推荐题目确定的用户的信息较少,就给用户信息的使用造成了困难。
为了保证对仅有较少信息的用户的推荐题目确定的实现基础获取,以提高推荐题目确定的准确性,本发明实施例提供了一种知识点向量获取方法,包括:
获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量;
对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量。
从而,本发明实施例所提供的知识点向量获取方法,通过对错题信息矩阵的分解得到的知识点向量,不同于直接根据知识点构建的向量,不仅包括了知识点的信息,还包括了已有用户的错题信息,因此,通过这种方式得到的知识点向量可以表示在某个知识点上答错的信息,而如果两个用户在同一个知识点上都答错,并且第一个用户在另一个知识点上也答错的话,那么第二个用户在另一个知识点上也有较大可能答错,因此,通过计算通过本发明实施例所提供的知识点向量获取方法得到知识点向量的相似度,就可以知道在一个知识点上答错的情况下,在另一个知识点上也答错的可能性,相似度越大,那么答错的可能性越大,这样,后续通过获取目标用户的答错题目的错题知识点以及基于知识点向量所得到的各个知识点之间的相似度,就可以确定目标用户在答错错题知识点的情况下,答错其他各个知识点的可能性的大小,也就可以根据由本发明实施例所提供的知识点向量获取方法得到的知识点向量的相似度确定目标用户答错可能性较大的知识点,而不仅仅是关联性较大的知识点,进而可以进一步在答错可能性较大的知识点中确定信息较少的用户的推荐题目,从而提高信息较少的用户的学习效率,并且也不需要获取目标用户过多的行为信息,保证冷启动情况下的推荐题目的确定以及所确定的推荐题目的准确性。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1是本发明实施例所提供的知识点向量确定方法的一流程示意图。
如图中所示,本发明实施例所提供的知识点向量确定方法,包括以下步骤:
步骤S10:获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量。
本发明实施例所提供的知识点向量确定方法,首先获取已有用户的错题信息矩阵,利用已有用户的错题信息矩阵,作为知识点向量获取的基础,使得获取的知识点向量不仅涵盖知识点信息,还涵盖用户信息。
容易理解的是,每个题目都有对应的题目知识点,为此,在可以根据题目知识点对题目进行统计,而为了实现对于题目的推荐,则需要使所统计的题目服务于推荐题目的确定,由于推荐题目是为了提高用户的学习效率,回答错误的题目具有更高的推荐需求,因此,本发明巧妙地利用了已有用户的答错题目,统计得出答错信息矩阵。
当然,错题信息矩阵可以利用已经长期使用某个题库的用户的答错题目信息获取,其中错题信息矩阵的各个元分别为各个已有用户在各个知识点的答错题目数量。
即用户1所在的行对应用户1在各个知识点的错题数量,用户2所在的行对应用户2在各个知识点的错题数量,如果某个用户在某个知识点的错题数量为0,那么对应位置的元的值即为0。
步骤S11:对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量。
错题信息矩阵仅是获取知识点向量的基础,得到错题信息矩阵后,进一步对其进行矩阵分解,获取各个知识点的知识点向量,为后续进行推荐题目的确定做好准备。
具体地,为了保证知识点向量的获取,并保证所获取的知识点向量的准确性,本发明还提供一种知识点向量的获取方法,请参考图2,图2为本发明实施例所提供的知识点向量获取方法的通过矩阵分解获取知识点向量步骤的一流程示意图。
如图中所示,可以通过以下步骤获取知识点向量:
步骤S110:利用矩阵分解模型对所述错题信息矩阵进行矩阵分解,得到各个暂定知识点向量和与其对应的各个暂定用户向量。
矩阵分解模型可以为已有的能够实现矩阵分解的任何一个模型。
通过对错题信息矩阵的矩阵分解,初步得到知识点向量和与其对应的用户向量,当然,由于错题信息矩阵对应多个用户在多个知识点的错题信息,因此所得到多个知识点向量和多个用户向量,并且由于此刻所得到的知识点向量和用户向量不一定能够满足需要,因此,作为暂定知识点向量和暂定用户向量。
步骤S111:根据各个所述暂定知识点向量和各个所述暂定用户向量计算向量损失。
得到各个暂定知识点向量和各个暂定用户向量后,进一步计算向量损失。
为了方便损失向量的获取,本发明实施例可以通过以下损失函数公式计算向量损失:
Figure 71283DEST_PATH_IMAGE001
其中:L--向量损失;
Figure 809432DEST_PATH_IMAGE002
--第S个暂定用户向量;
Figure 454040DEST_PATH_IMAGE003
--第K个暂定知识点向量;
Figure 910429DEST_PATH_IMAGE004
--用户在某个知识点下是否有错题的二值矩阵;
--置信矩阵,通过以下公式获取:
Figure 416628DEST_PATH_IMAGE005
其中:
Figure 9283DEST_PATH_IMAGE006
--可人为调节的增长常数;
Figure 824793DEST_PATH_IMAGE007
--第S个暂定用户在第K个暂定知识点下的答错题目数
通过上述公式,可以得出各个暂定用户向量和各个暂定知识点向量与用户向量的目标向量和知识点向量的目标向量之间差别的大小,即向量损失,从而可以为进一步获取更为准确的用户向量和知识点向量提供调整参考。
步骤S112:判断所述向量损失是否满足损失目标,若否,执行步骤S113,若是,执行步骤S114。
得到向量损失后,进一步与损失目标比较,如果向量损失不能满足损失目标,则需要重新调整矩阵分解模型的参数,并重新获取各个暂定用户向量和各个暂定知识点向量,从而执行步骤S113,如果向量损失满足损失目标,则执行步骤S114。
在一种具体实施方式中,所述损失目标为利用前述损失函数公式计算向量损失时,所述损失目标可以为所述损失函数公式的取值达到最小值,即当损失函数公式的取值达到最小值时,则暂定用户向量和暂定知识点向量的准确性最高。当然,在其他实施方式中,可以通过其他方式实现向量损失的获取。
步骤S113:根据所述向量损失调整所述矩阵分解模型的参数,转向执行步骤S110。
如果向量损失不能满足损失目标,根据向量损失调整矩阵分解模型的参数,再一次利用参数调整后的矩阵分解模型重新获取暂定用户向量和暂定知识点向量,即执行步骤S110。
步骤S114:将各个所述暂定知识点向量作为各个所述知识点向量。
如果向量损失满足损失目标,则将各个暂定知识点向量作为各个知识点向量,实现知识点向量的获取。
可以看出,本发明实施例所提供的知识点向量获取方法,通过对错题信息矩阵的分解得到的知识点向量,不同于直接根据知识点构建的向量,不仅包括了知识点的信息,还包括了已有用户的错题信息,因此,通过这种方式得到的知识点向量可以表示在某个知识点上答错的信息,而如果两个用户在同一个知识点上都答错,并且第一个用户在另一个知识点上也答错的话,那么第二个用户在另一个知识点上也有较大可能答错,因此,通过计算通过本发明实施例所提供的知识点向量获取方法得到知识点向量的相似度,就可以知道在一个知识点上答错的情况下,在另一个知识点上也答错的可能性,相似度越大,那么答错的可能性越大,这样,后续通过获取目标用户的答错题目的错题知识点以及基于知识点向量所得到的各个知识点之间的相似度,就可以确定目标用户在答错错题知识点的情况下,答错其他各个知识点的可能性的大小,也就可以根据由本发明实施例所提供的知识点向量获取方法得到的知识点向量的相似度确定目标用户答错可能性较大的知识点,而不仅仅是关联性较大的知识点,进而可以进一步在答错可能性较大的知识点中确定信息较少的用户的推荐题目,从而提高信息较少的用户的学习效率,并且也不需要获取目标用户过多的行为信息,保证冷启动情况下的推荐题目的确定以及所确定的推荐题目的准确性。
为了提高推荐题目的准确性,本发明实施例还提供一种推荐题目确定方法,请参考图3,图3为本发明实施例所提供的一种推荐题目确定方法的流程示意图。
如图中所示,本发明实施例所提供的推荐题目确定方法包括:
步骤S20:获取目标用户的答错题目的错题信息,所述错题信息包括错题知识点。
为了实现对答题和使用信息较少的用户(即新用户)的推荐题目的确定,首先需要获取用户的答错题目,即目标用户的答错题目。
当然,目标用户可以为信息较多的老用户,即对于老用户也可以采用本发明实施例所提供的推荐题目确定方法实现对于推荐题目的确定。
得到目标用户的答错题目后,根据答错题目,确定答错题目的错题信息,容易理解的是,错题信息可以包括错题知识点,当然还可以包括其他信息,比如文本信息、题型信息、难度等级信息等等。
步骤S21:利用所述错题知识点和提前确定的相似知识点数据,确定与所述错题知识点的相似度满足知识点相似度阈值的相似知识点。
得到错题信息中的错题知识点后,进一步根据错题知识点和已有的相似知识点数据,确定相似知识点。
当然,所述相似知识点数据包括任意两个知识点之间的相似度,各个所述相似度通过任意两个所述知识点的知识点向量的相似度计算得到,所述知识点向量根据如前述的知识点向量获取方法获取。
即根据前述的知识点向量获取方法获取各个知识点的知识点向量后,进一步计算各个知识点向量之间的相似度,并形成知识点向量的相似知识点数据。
根据错题知识点,在相似知识点数据中进行查找,可以得到满足相似知识点阈值的相似知识点。
在一种具体实施方式中,知识点向量之间的相似度可以通过获取向量的余弦相似度获取,余弦相似度的计算方式简单,并可以清楚地表明向量之间的相似程度。
由于利用前述方法获取的知识点向量,不仅包含了知识点的信息,而且还包含了用户的错题信息,因此,基于这样的知识点向量获取的相似度,不仅可以表明知识点之间的关联性,而且还包含了多个用户在同一个知识点的题目答错的情况下,在另一个知识点也答错的可能性,从而当目标用户在错题知识点答错时,利用相似度的比较,可以确定目标用户在那些知识点的题目答错的可能性也会较大,从而将其作为相似知识点。
当然,相似度阈值为确定相似知识点的衡量标准,如果相似度阈值较大,那么表明,只有多个用户在错题知识点的题目答错的情况下,在另外的一个或多个知识点的题目也都答错,且答错的数量也相近的情况下,才会被确定为相似知识点。
可以理解的是,相似度阈值可以根据需要进行调整,以满足推荐题目确定的需要。
步骤S22:根据所述相似知识点在推荐题库中确定各个初步推荐题目,所述推荐题库中各个题目的题目信息包括题目知识点。
得到相似知识点后,进一步根据相似知识点在推荐题库中的确定用于推荐的初步推荐题目。
由于满足相似度阈值的知识点可能为多个,那么各个相似知识点中的题目都有可能进一步根据其他信息确定为推荐题目。
在一种具体实施方式中,为了在各个相似知识点中进一步确定推荐题目,可以进一步确定推荐知识点,为了进一步确定各个相似知识点中的推荐知识点,本发明实施例还提供一种推荐题目确定方法,请参考图4,图4为本发明实施例所提供的推荐题目确定方法的确定各个初步推荐题目步骤的流程示意图。
如图中所示,本发明实施例所提供的推荐题目确定方法的确定各个初步推荐题目的步骤包括:
步骤S220:根据各个所述相似知识点与所述错题知识点的相似度,获取各个所述相似知识点的推荐概率。
为了在各个相似知识点中确定推荐知识点,可以首先获取各个相似知识点的推荐概率,这样可以根据推荐概率确定推荐知识点。
在一种具体实施方式中,所述推荐概率可以通过以下公式获取:
Figure 768478DEST_PATH_IMAGE008
其中:
Figure 875105DEST_PATH_IMAGE009
--第i个相似知识点的推荐概率;
Figure 587846DEST_PATH_IMAGE010
--第i个相似知识点的相似度;
Figure 308678DEST_PATH_IMAGE011
--第j个相似知识点的相似度。
从而,利用各个相似知识点的相似度,就可以很方便地实现对于各个相似知识点的推荐概率的计算,并且所得到的推荐概率更为准确。
步骤S221:按照所述推荐概率随机确定各个所述相似知识点中的知识点为推荐知识点。
得到随机概率后,就可以进一步按照推荐概率随机地确定各个相似知识点中的知识点为推荐知识点,相似知识点中的任何一个知识点都有可能被确定为推荐知识点,并且以一定的概率确定为推荐知识点。
这样,相似知识点中的各个知识点都有可能被确定为推荐知识点,从而各个相似知识点中的题目都可能被确定为推荐题目。
并且在确定相似知识点时,可以通过多次抽样的方式,抽出多个推荐知识点,然后进一步从多个推荐知识点中确定初步推荐题目。
步骤S222:根据所述推荐知识点在推荐题库中题目,得到各个所述初步推荐题目。
确定推荐知识点后,确定推荐知识点在推荐题库中的题目,得到初步推荐题目。
这样,可以根据推荐概率确定相似知识点中的推荐知识点,并把推荐知识点的题目作为初步推荐题目,使得任何一个相似知识点的题目都有可能称为最终推荐的题目,保证推荐题目的多样性。
步骤S23:获取各个所述初步推荐题目与所述答错题目的题目相似度,根据所述题目相似度确定目标推荐题目。
得到各个初步推荐题目后,需要进一步确定目标推荐题目,为此,可以获取各个初步推荐题目与答错题目的题目相似度,进而将题目相似度较高的题目去定位目标推荐题目。
当然,为了确定推荐题目,还可以利用题目的其他信息,比如难度等级,这样,所述错题信息还包括错题难度等级,所述题目信息还包括题目难度等级;
所述获取各个所述初步推荐题目与所述答错题目的题目相似度的步骤可以包括:
根据所述知识点相似度,以及所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
这样,题目相似度的获取同时兼顾知识点相似度以及难度等级相似度,更容易将知识点相似度较大并且难度等级相似度较大的题目确定为目标推荐题目。
当然,在获取推荐知识点的实施例中,如果推荐知识点仅包括一个知识点,则对每个题目而言,知识点相似度的影响相同,主要基于难度等级的不同确定目标推荐题目。
进一步地,在进行题目相似度的计算时,为了提高所确定的推荐题目的准确性,还可以参考题目的题型信息,为此,所述错题信息还包括错题题型,所述题目信息还包括题目题型;
所述根据所述知识点相似度,以及所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度的步骤可以包括:
根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、以及所述错题题型和所述初步推荐题目的题目题型的题型相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
从而,题目相似度的获取同时兼顾知识点相似度、难度等级相似度和题型相似度,更容易将知识点相似度较大、难度等级相似度较大且题型相似度较大的题目确定为目标推荐题目。
当然,在确定推荐题目时,还可以在进行题目推荐时参考更多的信息,比如文本相似性或题目长度等。
另外,由于题目的推荐次数在一定程度上也代表了题目的质量,因此还可以将题目的推荐次数作为题目推荐的参考,以提高所确定的推荐题目的质量,因此,在一种具体实施方式中,所述根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、以及所述错题题型和所述初步推荐题目的题目题型的题型相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度的步骤可以包括:
根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、所述错题题型和所述初步推荐题目的题目题型的题型相似度和所述题目推荐次数获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
然而,一个题目的推荐次数过多又会造成推荐题目的重复,不利于用户学习效率的提高,因此,在一种具体实施方式中,不仅需要考虑题目推荐次数,而且需要避免题目的推荐次数过高,为此,还可以设定题目推荐次数上限,当题目被推荐次数大于等于推荐次数上限时就不考虑其被再多推多少次了,这样可以给其他题目更多推荐机会,并提高用户的学习效率。
为此,在一种具体实施方式中,题目相似度可以通过以下公式获取:
Figure 490391DEST_PATH_IMAGE012
其中:
Figure 587660DEST_PATH_IMAGE013
--初步推荐题目q’与答错题目q的题目相似度;
Figure 420487DEST_PATH_IMAGE014
Figure 46641DEST_PATH_IMAGE015
Figure 715650DEST_PATH_IMAGE016
--知识点相似度、难度等级相似度和题型相似度的权重系数;
Figure 616610DEST_PATH_IMAGE017
--初步推荐题目q’的相似知识点a’与答错题目q的错题知识点a的知识点相似度;
Figure 38364DEST_PATH_IMAGE018
--初步推荐题目q’的题目难度等级d’与答错题目q的错题难度等级d的难度等级相似度;
Figure 366578DEST_PATH_IMAGE019
--初步推荐题目q’的推荐次数;
N--推荐次数上限值。
可以看出,本发明实施例所提供的推荐题目确定方法,在确定相似知识点时,所利用的是目标用户的答错题目的错题知识点和包含了知识点答错关联性信息的相似知识点数据,因此,所确定的相似知识点是目标用户在错题知识点答错的情况下,答错可能性很大的知识点,是基于用户答错行为的可能性大小而确定的,而非仅仅是根据知识点之间的关联性,使得所确定的相似知识点包含了用户可能的行为信息,更能贴近用户的实际情况,而不是仅仅根据知识点本身的关联性,从而可以避免仅从知识点的关联性上看相关度很高但用户基本不会犯错的知识点的推荐,使得所确定的相似知识点更能针对用户的行为,保证所确定的推荐题目的准确性,从而提高用户的学习效率;并且,相似知识点的确定仅根据目标用户的答错题目,无需获取目标用户过多的行为信息,也不需要根据目标用于与其他用户之间的行为信息相似度确定最接近的用户,可以实现在目标用户的行为信息较少的情况下,为目标用户确定相似知识点,从而进一步确定目标推荐题目,保证冷启动情况下的推荐题目的确定。
下面对本发明实施例提供的知识点向量获取装置和推荐题目确定装置进行介绍,下文描述的知识点向量获取装置和推荐题目确定装置可以分别认为是,电子设备(如:PC)为分别实现本发明实施例提供的知识点向量获取方法或者推荐题目确定方法所需设置的功能模块架构。下文描述的知识点向量获取装置和推荐题目确定装置的内容,可分别与上文描述的知识点向量获取方法以及推荐题目确定方法的内容相互对应参照。
图5为本发明实施例所提供的知识点向量获取装置的一框图,该知识点向量获取装置即可应用于客户端,也可应用于服务器端,参考图5,该知识点向量获取装置可以包括:
错题信息矩阵获取单元100,适于获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量;
知识点向量获取单元110,适于对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量。
错题信息矩阵获取单元100首先获取已有用户的错题信息矩阵,利用已有用户的错题信息矩阵,作为知识点向量获取的基础,使得获取的知识点向量不仅涵盖知识点信息,还涵盖用户信息。
容易理解的是,每个题目都有对应的题目知识点,为此,在可以根据题目知识点对题目进行统计,而为了实现对于题目的推荐,则需要使所统计的题目服务于推荐题目的确定,由于推荐题目是为了提高用户的学习效率,回答错误的题目具有更高的推荐需求,因此,本发明巧妙地利用了已有用户的答错题目,统计得出答错信息矩阵。
当然,错题信息矩阵可以利用已经长期使用某个题库的用户的答错题目信息获取,其中错题信息矩阵的各个元分别为各个已有用户在各个知识点的答错题目数量。
如果某个用户在某个知识点的错题数量为0,那么对应位置的元的值即为0。
错题信息矩阵仅是获取知识点向量的基础,得到错题信息矩阵后,知识点向量获取单元110进一步对其进行矩阵分解,获取各个知识点的知识点向量,为后续进行推荐题目的确定做好准备。
具体地,为了保证知识点向量的获取,并保证所获取的知识点向量的准确性,知识点向量获取单元110,适于对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量包括:
利用矩阵分解模型对所述错题信息矩阵进行矩阵分解,得到各个暂定知识点向量和与其对应的各个暂定用户向量;
根据各个所述暂定知识点向量和各个所述暂定用户向量计算向量损失,并根据所述向量损失调整所述矩阵分解模型的参数,直至所述向量损失满足损失目标,将各个所述暂定知识点向量作为各个所述知识点向量。
其中,矩阵分解模型可以为已有的能够实现矩阵分解的任何一个模型。
通过对错题信息矩阵的矩阵分解,初步得到知识点向量和与其对应的用户向量,当然,由于错题信息矩阵对应多个用户在多个知识点的错题信息,因此所得到多个知识点向量和多个用户向量,并且由于此刻所得到的知识点向量和用户向量不一定能够满足需要,因此,作为暂定知识点向量和暂定用户向量。
得到各个暂定知识点向量和各个暂定用户向量后,进一步计算向量损失。
为了方便损失向量的获取,本发明实施例可以通过以下损失函数公式计算向量损失:
Figure 257304DEST_PATH_IMAGE001
其中:L--向量损失;
Figure 961955DEST_PATH_IMAGE020
--第S个暂定用户向量;
Figure 503795DEST_PATH_IMAGE021
--第K个暂定知识点向量;
Figure 2909DEST_PATH_IMAGE022
--用户在某个知识点下是否有错题的二值矩阵;
--置信矩阵,通过以下公式获取:
Figure 380932DEST_PATH_IMAGE005
其中:
Figure 623695DEST_PATH_IMAGE006
--可人为调节的增长常数;
Figure 285620DEST_PATH_IMAGE023
--第S个暂定用户在第K个暂定知识点下的答错题目数
通过上述公式,可以得出各个暂定用户向量和各个暂定知识点向量与用户向量的目标向量和知识点向量的目标向量之间差别的大小,即向量损失,从而可以为进一步获取更为准确的用户向量和知识点向量提供调整参考。
得到向量损失后,进一步与损失目标比较,如果向量损失不能满足损失目标,则需要重新调整矩阵分解模型的参数,并重新获取各个暂定用户向量和各个暂定知识点向量。
在一种具体实施方式中,所述损失目标为利用前述损失函数公式计算向量损失时,所述损失目标可以为所述损失函数公式的取值达到最小值,即当损失函数公式的取值达到最小值时,则暂定用户向量和暂定知识点向量的准确性最高。当然,在其他实施方式中,可以通过其他方式实现向量损失的获取。
如果向量损失不能满足损失目标,根据向量损失调整矩阵分解模型的参数,再一次利用参数调整后的矩阵分解模型重新获取暂定用户向量和暂定知识点向量。
如果向量损失满足损失目标,则将各个暂定知识点向量作为各个知识点向量,实现知识点向量的获取。
这样,本发明实施例所提供的知识点向量获取装置,通过对错题信息矩阵的分解得到的知识点向量,不同于直接根据知识点构建的向量,不仅包括了知识点的信息,还包括了已有用户的错题信息,因此,通过这种方式得到的知识点向量可以表示在某个知识点上答错的信息,而如果两个用户在同一个知识点上都答错,并且第一个用户在另一个知识点上也答错的话,那么第二个用户在另一个知识点上也有较大可能答错,因此,通过计算通过本发明实施例所提供的知识点向量获取方法得到知识点向量的相似度,就可以知道在一个知识点上答错的情况下,在另一个知识点上也答错的可能性,相似度越大,那么答错的可能性越大,这样,后续通过获取目标用户的答错题目的错题知识点以及基于知识点向量所得到的各个知识点之间的相似度,就可以确定目标用户在答错错题知识点的情况下,答错其他各个知识点的可能性的大小,也就可以根据由本发明实施例所提供的知识点向量获取方法得到的知识点向量的相似度确定目标用户答错可能性较大的知识点,而不仅仅是关联性较大的知识点,进而可以进一步在答错可能性较大的知识点中确定信息较少的用户的推荐题目,从而提高信息较少的用户的学习效率,并且也不需要获取目标用户过多的行为信息,保证冷启动情况下的推荐题目的确定以及所确定的推荐题目的准确性。
为解决前述问题,本发明实施例还提供一种推荐题目确定装置,请参考图6,图6是本发明实施例所提供的推荐题目确定装置的一框图,该推荐题目确定装置即可应用于客户端,也可应用于服务器端,参考图6,该推荐题目确定装置可以包括:
错题信息获取单元200,适于获取目标用户的答错题目的错题信息,所述错题信息包括错题知识点;
相似知识点确定单元210,适于利用所述错题知识点和提前确定的相似知识点数据,确定与所述错题知识点的相似度满足知识点相似度阈值的相似知识点,其中,所述相似知识点数据包括任意两个知识点之间的相似度,各个所述相似度通过任意两个所述知识点的知识点向量的相似度计算得到,所述知识点向量根据如前述任一项所述的知识点向量获取方法获取;
初步推荐题目获取单元220,适于根据所述相似知识点在推荐题库中确定各个初步推荐题目,所述推荐题库中各个题目的题目信息包括题目知识点;
目标推荐题目确定单元230,适于获取各个所述初步推荐题目与所述答错题目的题目相似度,根据所述题目相似度确定目标推荐题目。
为了实现对答题和使用信息较少的用户(即新用户)的推荐题目的确定,首先需要错题信息获取单元200获取用户的答错题目,即目标用户的答错题目。
当然,目标用户可以为信息较多的老用户,即对于老用户也可以采用本发明实施例所提供的推荐题目确定装置实现对于推荐题目的确定。
得到目标用户的答错题目后,根据答错题目,确定答错题目的错题信息,容易理解的是,错题信息可以包括错题知识点,当然还可以包括其他信息,比如文本信息、题型信息、难度等级信息等等。
得到错题信息中的错题知识点后,相似知识点确定单元210进一步根据错题知识点和已有的相似知识点数据,确定相似知识点。
当然,所述相似知识点数据包括任意两个知识点之间的相似度,各个所述相似度通过任意两个所述知识点的知识点向量的相似度计算得到,所述知识点向量根据如前述的知识点向量获取方法获取。
即根据前述的知识点向量获取方法获取各个知识点的知识点向量后,进一步计算各个知识点向量之间的相似度,并形成知识点向量的相似知识点数据。
根据错题知识点,在相似知识点数据中进行查找,可以得到满足相似知识点阈值的相似知识点。
在一种具体实施方式中,知识点向量之间的相似度可以通过获取向量的余弦相似度获取,余弦相似度的计算方式简单,并可以清楚地表明向量之间的相似程度。
由于利用前述方法获取的知识点向量,不仅包含了知识点的信息,而且还包含了用户的错题信息,因此,基于这样的知识点向量获取的相似度,不仅可以表明知识点之间的关联性,而且还包含了多个用户在同一个知识点的题目答错的情况下,在另一个知识点也答错的可能性,从而当目标用户在错题知识点答错时,利用相似度的比较,可以确定目标用户在那些知识点的题目答错的可能性也会较大,从而将其作为相似知识点。
当然,相似度阈值为确定相似知识点的衡量标准,如果相似度阈值较大,那么表明,只有多个用户在错题知识点的题目答错的情况下,在另外的一个或多个知识点的题目也都答错,且答错的数量也相近的情况下,才会被确定为相似知识点。
可以理解的是,相似度阈值可以根据需要进行调整,以满足推荐题目确定的需要。
得到相似知识点后,初步推荐题目获取单元220进一步根据相似知识点在推荐题库中的确定用于推荐的初步推荐题目。
由于满足相似度阈值的知识点可能为多个,那么各个相似知识点中的题目都有可能进一步根据其他信息确定为推荐题目。
在一种具体实施方式中,为了在各个相似知识点中进一步确定推荐题目,可以进一步确定推荐知识点,因此,初步推荐题目获取单元220,适于根据所述相似知识点在推荐题库中确定各个初步推荐题目,包括
根据各个所述相似知识点与所述错题知识点的相似度,获取各个所述相似知识点的推荐概率;
按照所述推荐概率随机确定各个所述相似知识点中的知识点为推荐知识点;
根据所述推荐知识点在推荐题库中题目,得到各个所述初步推荐题目。
在一种具体实施方式中,所述推荐概率可以通过以下公式获取:
Figure 955636DEST_PATH_IMAGE024
其中:
Figure 555376DEST_PATH_IMAGE025
--第i个相似知识点的推荐概率;
Figure 336250DEST_PATH_IMAGE026
--第i个相似知识点的相似度;
Figure 852682DEST_PATH_IMAGE011
--第j个相似知识点的相似度。
从而,利用各个相似知识点的相似度,就可以很方便地实现对于各个相似知识点的推荐概率的计算,并且所得到的推荐概率更为准确。
得到随机概率后,就可以进一步按照推荐概率随机地确定各个相似知识点中的知识点为推荐知识点,相似知识点中的任何一个知识点都有可能被确定为推荐知识点,并且以一定的概率确定为推荐知识点。
这样,相似知识点中的各个知识点都有可能被确定为推荐知识点,从而各个相似知识点中的题目都可能被确定为推荐题目。
并且在确定相似知识点时,可以通过多次抽样的方式,抽出多个推荐知识点,然后进一步从多个推荐知识点中确定初步推荐题目。
确定推荐知识点后,确定推荐知识点在推荐题库中的题目,得到初步推荐题目。
这样,可以根据推荐概率确定相似知识点中的推荐知识点,并把推荐知识点的题目作为初步推荐题目,使得任何一个相似知识点的题目都有可能称为最终推荐的题目,保证推荐题目的多样性。
得到各个初步推荐题目后,需要进一步确定目标推荐题目,为此,目标推荐题目确定单元230可以获取各个初步推荐题目与答错题目的题目相似度,进而将题目相似度较高的题目去定位目标推荐题目。
当然,为了确定推荐题目,还可以利用题目的其他信息,比如难度等级,这样,所述错题信息还包括错题难度等级,所述题目信息还包括题目难度等级;
目标推荐题目确定单元230,适于获取各个所述初步推荐题目与所述答错题目的题目相似度可以包括:
根据所述知识点相似度,以及所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
这样,题目相似度的获取同时兼顾知识点相似度以及难度等级相似度,更容易将知识点相似度较大并且难度等级相似度较大的题目确定为目标推荐题目。
当然,在获取推荐知识点的实施例中,如果推荐知识点仅包括一个知识点,则对每个题目而言,知识点相似度的影响相同,主要基于难度等级的不同确定目标推荐题目。
进一步地,在进行题目相似度的计算时,为了提高所确定的推荐题目的准确性,还可以参考题目的题型信息,为此,所述错题信息还包括错题题型,所述题目信息还包括题目题型;
目标推荐题目确定单元230,适于根据所述知识点相似度,以及所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度可以包括:
根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、以及所述错题题型和所述初步推荐题目的题目题型的题型相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
从而,题目相似度的获取同时兼顾知识点相似度、难度等级相似度和题型相似度,更容易将知识点相似度较大、难度等级相似度较大且题型相似度较大的题目确定为目标推荐题目。
当然,在确定推荐题目时,还可以在进行题目推荐时参考更多的信息,比如文本相似性或题目长度等。
另外,由于题目的推荐次数在一定程度上也代表了题目的质量,因此还可以将题目的推荐次数作为题目推荐的参考,以提高所确定的推荐题目的质量,因此,在一种具体实施方式中,目标推荐题目确定单元230,适于根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、以及所述错题题型和所述初步推荐题目的题目题型的题型相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度可以包括:
根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、所述错题题型和所述初步推荐题目的题目题型的题型相似度和所述题目推荐次数获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
然而,一个题目的推荐次数过多又会造成推荐题目的重复,不利于用户学习效率的提高,因此,在一种具体实施方式中,不仅需要考虑题目推荐次数,而且需要避免题目的推荐次数过高,为此,还可以设定题目推荐次数上限,当题目被推荐次数大于等于推荐次数上限时就不考虑其被再多推多少次了,这样可以给其他题目更多推荐机会,并提高用户的学习效率。
为此,在一种具体实施方式中,题目相似度可以通过以下公式获取:
Figure 959178DEST_PATH_IMAGE027
其中:
Figure 311793DEST_PATH_IMAGE028
--初步推荐题目q’与答错题目q的题目相似度;
Figure 896358DEST_PATH_IMAGE029
Figure 267297DEST_PATH_IMAGE030
Figure 13536DEST_PATH_IMAGE031
--知识点相似度、难度等级相似度和题型相似度的权重系数;
Figure 587868DEST_PATH_IMAGE032
--初步推荐题目q’的相似知识点a’与答错题目q的错题知识点a的知识点相似度;
Figure 241703DEST_PATH_IMAGE033
--初步推荐题目q’的题目难度等级d’与答错题目q的错题难度等级d的难度等级相似度;
Figure 201569DEST_PATH_IMAGE034
--初步推荐题目q’的推荐次数;
N--推荐次数上限值。
可以看出,本发明实施例所提供的推荐题目确定装置,在确定相似知识点时,所利用的是目标用户的答错题目的错题知识点和包含了知识点答错关联性信息的相似知识点数据,因此,所确定的相似知识点是目标用户在错题知识点答错的情况下,答错可能性很大的知识点,是基于用户答错行为的可能性大小而确定的,而非仅仅是根据知识点之间的关联性,使得所确定的相似知识点包含了用户可能的行为信息,更能贴近用户的实际情况,而不是仅仅根据知识点本身的关联性,从而可以避免仅从知识点的关联性上看相关度很高但用户基本不会犯错的知识点的推荐,使得所确定的相似知识点更能针对用户的行为,保证所确定的推荐题目的准确性,从而提高用户的学习效率;并且,相似知识点的确定仅根据目标用户的答错题目,无需获取目标用户过多的行为信息,也不需要根据目标用于与其他用户之间的行为信息相似度确定最接近的用户,可以实现在目标用户的行为信息较少的情况下,为目标用户确定相似知识点,从而进一步确定目标推荐题目,保证冷启动情况下的推荐题目的确定。
当然,本发明实施例还提供一种设备,本发明实施例提供的设备可以通过程序形式装载上述所述的程序模块架构,以实现本发明实施例提供的知识点向量获取方法或推荐题目确定方法;该硬件设备可以应用于具体数据处理能力的电子设备,该电子设备可以为:例如终端设备或者服务器设备。
可选的,图7示出了本发明实施例提供的设备一种可选硬件设备架构,可以包括:至少一个存储器3和至少一个处理器1;所述存储器存储有程序,所述处理器调用所述程序,以执行前述的知识点向量获取方法或推荐题目确定方法,另外,至少一个通信接口2和至少一个通信总线4;处理器1和存储器3可以位于同一电子设备,例如处理器1和存储器3可以位于服务器设备或者终端设备;处理器1和存储器3也可以位于不同的电子设备。
作为本发明实施例公开内容的一种可选实现,存储器3可以存储程序,处理器1可调用所述程序,以执行本发明上述实施例提供的知识点向量获取方法或推荐题目确定方法。
本发明实施例中,电子设备可以是能够进行推荐题目确定的平板电脑、笔记本电脑等设备。
在本发明实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;显然,图7所示的处理器1、通信接口2、存储器3和通信总线4的通信连接示意仅是可选的一种方式;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
需要说明的是,上述的设备还可以包括与本发明实施例公开内容可能并不是必需的其他器件(未示出);鉴于这些其他器件对于理解本发明实施例公开内容可能并不是必需,本发明实施例对此不进行逐一介绍。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,当该指令被处理器执行时可以实现如上所述知识点向量获取方法或推荐题目确定方法。
本发明实施例所提供的存储介质所存储的计算机可执行指令,首先利用已有用户的答错题目的数量信息和知识点信息构建错题信息矩阵,然后通过对错题信息矩阵的分解获取各个知识点向量。这样,通过对错题信息矩阵的分解得到的知识点向量,不同于直接根据知识点构建的向量,不仅包括了知识点的信息,还包括了已有用户的错题信息,因此,通过这种方式得到的知识点向量可以表示在某个知识点上答错的信息,而如果两个用户在同一个知识点上都答错,并且第一个用户在另一个知识点上也答错的话,那么第二个用户在另一个知识点上也有较大可能答错,因此,通过计算通过本发明实施例所提供的知识点向量获取方法得到知识点向量的相似度,就可以知道在一个知识点上答错的情况下,在另一个知识点上也答错的可能性,相似度越大,那么答错的可能性越大,这样,后续通过获取目标用户的答错题目的错题知识点以及基于知识点向量所得到的各个知识点之间的相似度,就可以确定目标用户在答错错题知识点的情况下,答错其他各个知识点的可能性的大小,也就可以根据由本发明实施例所提供的知识点向量获取方法得到的知识点向量的相似度确定目标用户答错可能性较大的知识点,而不仅仅是关联性较大的知识点,进而可以进一步在答错可能性较大的知识点中确定信息较少的用户的推荐题目,从而提高信息较少的用户的学习效率,并且也不需要获取目标用户过多的行为信息,保证冷启动情况下的推荐题目的确定以及所确定的推荐题目的准确性。
上述本发明的实施方式是本发明的元件和特征的组合。除非另外提及,否则所述元件或特征可被视为选择性的。各个元件或特征可在不与其它元件或特征组合的情况下实践。另外,本发明的实施方式可通过组合部分元件和/或特征来构造。本发明的实施方式中所描述的操作顺序可重新排列。任一实施方式的一些构造可被包括在另一实施方式中,并且可用另一实施方式的对应构造代替。对于本领域技术人员而言明显的是,所附权利要求中彼此没有明确引用关系的权利要求可组合成本发明的实施方式,或者可在提交本申请之后的修改中作为新的权利要求包括。
本发明的实施方式可通过例如硬件、固件、软件或其组合的各种手段来实现。在硬件配置方式中,根据本发明示例性实施方式的方法可通过一个或更多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器等来实现。
在固件或软件配置方式中,本发明的实施方式可以模块、过程、功能等形式实现。软件代码可存储在存储器单元中并由处理器执行。存储器单元位于处理器的内部或外部,并可经由各种己知手段向处理器发送数据以及从处理器接收数据。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是符合与本文所公开的原理和新颖特点相一致的最宽的范围。
虽然本发明实施例披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种变动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (12)

1.一种推荐题目确定方法,其特征在于,包括:
获取目标用户的答错题目的错题信息,所述错题信息包括错题知识点;
利用所述错题知识点和提前确定的相似知识点数据,确定与所述错题知识点的相似度满足知识点相似度阈值的相似知识点,其中,所述相似知识点数据包括任意两个知识点之间的相似度,各个所述相似度通过任意两个所述知识点的知识点向量的相似度计算得到;
根据所述相似知识点在推荐题库中确定各个初步推荐题目,所述推荐题库中各个题目的题目信息包括题目知识点;
获取各个所述初步推荐题目与所述答错题目的题目相似度,根据所述题目相似度确定目标推荐题目;
所述知识点向量的获取步骤包括:
获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量;
对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量;
所述根据所述相似知识点在推荐题库中确定各个初步推荐题目的步骤包括:
根据各个所述相似知识点与所述错题知识点的相似度,获取各个所述相似知识点的推荐概率;
按照所述推荐概率随机确定各个所述相似知识点中的知识点为推荐知识点;
根据所述推荐知识点在推荐题库中题目,得到各个所述初步推荐题目。
2.如权利要求1所述的推荐题目确定方法,其特征在于,所述推荐概率通过以下公式获取:
Figure 115933DEST_PATH_IMAGE001
其中:
Figure 399146DEST_PATH_IMAGE002
--第i个相似知识点的推荐概率;
Figure 956030DEST_PATH_IMAGE003
--第i个相似知识点的相似度;
Figure 957484DEST_PATH_IMAGE004
--第j个相似知识点的相似度。
3.如权利要求1所述的推荐题目确定方法,其特征在于,所述对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量的步骤包括:
利用矩阵分解模型对所述错题信息矩阵进行矩阵分解,得到各个暂定知识点向量和与其对应的各个暂定用户向量;
根据各个所述暂定知识点向量和各个所述暂定用户向量计算向量损失,并根据所述向量损失调整所述矩阵分解模型的参数,直至所述向量损失满足损失目标,将各个所述暂定知识点向量作为各个所述知识点向量。
4.如权利要求3所述的推荐题目确定方法,其特征在于,所述向量损失通过以下损失函数公式获取:
Figure 375958DEST_PATH_IMAGE005
其中:L--向量损失;
Figure 513678DEST_PATH_IMAGE006
--第S个暂定用户向量;
Figure 975884DEST_PATH_IMAGE007
--第K个暂定知识点向量;
Figure 464634DEST_PATH_IMAGE008
--用户在某个知识点下是否有错题的二值矩阵;
Figure 936066DEST_PATH_IMAGE009
--置信矩阵,通过以下公式获取:
Figure 443140DEST_PATH_IMAGE010
其中:
Figure 341826DEST_PATH_IMAGE011
--可人为调节的增长常数 ;
Figure 317872DEST_PATH_IMAGE012
--第S个暂定用户在第K个暂定知识点下的答错题目数。
5.如权利要求4所述的推荐题目确定方法,其特征在于,所述损失目标为所述损失函数公式的取值达到最小值。
6.如权利要求1-5任一项所述的推荐题目确定方法,其特征在于,所述错题信息还包括错题难度等级,所述题目信息还包括题目难度等级;
所述获取各个所述初步推荐题目与所述答错题目的题目相似度的步骤包括:
根据所述知识点相似度,以及所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
7.如权利要求6所述的推荐题目确定方法,其特征在于,所述错题信息还包括错题题型,所述题目信息还包括题目题型;
所述根据所述知识点相似度,以及所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度的步骤包括:
根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、以及所述错题题型和所述初步推荐题目的题目题型的题型相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
8.如权利要求7所述的推荐题目确定方法,其特征在于,所述题目信息还包括所述题目推荐次数;
所述根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、以及所述错题题型和所述初步推荐题目的题目题型的题型相似度获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度的步骤包括:
根据所述知识点相似度、所述错题难度等级和所述初步推荐题目的题目难度等级的难度等级相似度、所述错题题型和所述初步推荐题目的题目题型的题型相似度和所述题目推荐次数获取所述推荐题目集合中的各个初步推荐题目与所述答错题目的题目相似度。
9.如权利要求8所述的推荐题目确定方法,其特征在于,所述题目相似度通过以下公式获取:
Figure 61837DEST_PATH_IMAGE013
其中:
Figure 439729DEST_PATH_IMAGE014
--初步推荐题目q’与答错题目q的题目相似度;
Figure 994469DEST_PATH_IMAGE015
Figure 457812DEST_PATH_IMAGE016
Figure 271047DEST_PATH_IMAGE017
--知识点相似度、难度等级相似度和题型相似度的权重系数;
Figure 237866DEST_PATH_IMAGE018
--初步推荐题目q’的相似知识点a’与答错题目q的错题知识点a的知识点相似度;
Figure 478354DEST_PATH_IMAGE019
--初步推荐题目q’的题目难度等级d’与答错题目q的错题难度等级d的难度等级相似度;
Figure 163414DEST_PATH_IMAGE020
--初步推荐题目q’的推荐次数;
N--推荐次数上限值。
10.一种推荐题目确定装置,其特征在于,包括:
错题信息获取单元,适于获取目标用户的答错题目的错题信息,所述错题信息包括错题知识点;
相似知识点确定单元,适于利用所述错题知识点和提前确定的相似知识点数据,确定与所述错题知识点的相似度满足知识点相似度阈值的相似知识点,其中,所述相似知识点数据包括任意两个知识点之间的相似度,各个所述相似度通过任意两个所述知识点的知识点向量的相似度计算得到;
初步推荐题目获取单元,适于根据所述相似知识点在推荐题库中确定各个初步推荐题目,所述推荐题库中各个题目的题目信息包括题目知识点,包括:
利用矩阵分解模型对所述错题信息矩阵进行矩阵分解,得到各个暂定知识点向量和与其对应的各个暂定用户向量;
根据各个所述暂定知识点向量和各个所述暂定用户向量计算向量损失,并根据所述向量损失调整所述矩阵分解模型的参数,直至所述向量损失满足损失目标,将各个所述暂定知识点向量作为各个所述知识点向量;
目标推荐题目确定单元,适于获取各个所述初步推荐题目与所述答错题目的题目相似度,根据所述题目相似度确定目标推荐题目;
所述知识点向量的获取步骤包括:
获取已有用户的错题信息矩阵,所述错题信息矩阵的各个元分别为各个所述已有用户在各个知识点的答错题目数量;
对所述错题信息矩阵进行矩阵分解获取各个知识点的知识点向量。
11.一种存储介质,其特征在于,所述存储介质存储有适于推荐题目确定的程序,以实现如权利要求1-9任一项所述的推荐题目确定方法。
12.一种电子设备,其特征在于,包括至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述程序,以执行如权利要求1-9任一项所述的推荐题目确定方法。
CN202011070029.9A 2020-10-09 2020-10-09 知识点向量获取、推荐题目确定方法及相关装置 Active CN111930901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011070029.9A CN111930901B (zh) 2020-10-09 2020-10-09 知识点向量获取、推荐题目确定方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011070029.9A CN111930901B (zh) 2020-10-09 2020-10-09 知识点向量获取、推荐题目确定方法及相关装置

Publications (2)

Publication Number Publication Date
CN111930901A CN111930901A (zh) 2020-11-13
CN111930901B true CN111930901B (zh) 2021-01-08

Family

ID=73334937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011070029.9A Active CN111930901B (zh) 2020-10-09 2020-10-09 知识点向量获取、推荐题目确定方法及相关装置

Country Status (1)

Country Link
CN (1) CN111930901B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948426A (zh) * 2021-04-15 2021-06-11 杭州大拿科技股份有限公司 相似题的确认和显示方法、装置、电子设备及存储介质
CN114282531B (zh) * 2021-08-24 2024-06-14 腾讯科技(深圳)有限公司 一种题目检测方法、装置、电子设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101285217B1 (ko) * 2011-10-06 2013-07-11 주식회사 퀀트랩 큐벡터를 이용한 문항출제 시스템 및 방법
US20150206442A1 (en) * 2014-01-18 2015-07-23 Invent.ly LLC Student-specific adaptive personalized book creation
KR102233255B1 (ko) * 2018-04-11 2021-03-29 한국전자통신연구원 인지 진단 모델의 신뢰도를 이용한 학습자 진단 장치 및 방법
CN110309201A (zh) * 2019-06-28 2019-10-08 广州云蝶科技有限公司 作业定制方法及系统
CN110428010B (zh) * 2019-08-05 2022-09-06 中国科学技术大学 知识追踪方法

Also Published As

Publication number Publication date
CN111930901A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
JP6634515B2 (ja) 自動質問応答システムにおける質問クラスタリング処理方法及び装置
CN106874441B (zh) 智能问答方法和装置
US10147037B1 (en) Method and system for determining a level of popularity of submission content, prior to publicizing the submission content with a question and answer support system
US20190042982A1 (en) Automatic Multi-Threshold Feature Filtering Method and Apparatus
CN111930901B (zh) 知识点向量获取、推荐题目确定方法及相关装置
CN110135681B (zh) 风险用户识别方法、装置、可读存储介质及终端设备
CN113157863A (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN111177349B (zh) 问答匹配方法、装置、设备及存储介质
CN109753561B (zh) 一种自动回复的生成方法及装置
CN109978139B (zh) 图片自动生成描述的方法、系统、电子装置及存储介质
CN112686051A (zh) 语义识别模型训练方法、识别方法、电子设备、存储介质
CN109992659B (zh) 用于文本排序的方法和装置
CN110209768B (zh) 自动问答的问题处理方法和装置
CN111506596A (zh) 信息检索方法、装置、计算机设备和存储介质
CN110502623A (zh) 智能问答方法、电子装置、计算机设备及可读存储介质
CN117273173A (zh) 基于大语言模型的实体推荐方法、装置、设备及存储介质
CN117573985A (zh) 一种应用于智能化在线教育系统的信息推送方法及系统
CN110717008B (zh) 基于语意识别的搜索结果排序方法及相关装置
CN110413750A (zh) 根据用户问句召回标准问句的方法和装置
CN116431912A (zh) 用户画像推送方法及装置
CN114238611B (zh) 用于输出信息的方法、装置、设备以及存储介质
CN114610796A (zh) 文本相似度确定方法、装置、存储介质以及电子设备
CN111708862A (zh) 文本匹配方法、装置及电子设备
CN111382246A (zh) 文本的匹配方法、匹配装置及终端
CN113724040B (zh) 课程推荐方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant