CN105023214A - 一种题目知识点智能推荐方法 - Google Patents

一种题目知识点智能推荐方法 Download PDF

Info

Publication number
CN105023214A
CN105023214A CN201510424923.4A CN201510424923A CN105023214A CN 105023214 A CN105023214 A CN 105023214A CN 201510424923 A CN201510424923 A CN 201510424923A CN 105023214 A CN105023214 A CN 105023214A
Authority
CN
China
Prior art keywords
knowledge point
question text
word segmentation
question
chinese word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510424923.4A
Other languages
English (en)
Other versions
CN105023214B (zh
Inventor
陈明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Blue Warship Information Technology Nanjing Co Ltd
Original Assignee
Blue Warship Information Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Blue Warship Information Technology Nanjing Co Ltd filed Critical Blue Warship Information Technology Nanjing Co Ltd
Priority to CN201510424923.4A priority Critical patent/CN105023214B/zh
Publication of CN105023214A publication Critical patent/CN105023214A/zh
Application granted granted Critical
Publication of CN105023214B publication Critical patent/CN105023214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种题目知识点智能推荐方法,引入知识点与其隐性话题之间的对应关系,构建知识点网络图,更好的理解了在线教育系统中的教育资源以及终端用户,能够更加准确地为终端用户提供问题文本。

Description

一种题目知识点智能推荐方法
技术领域
本发明涉及一种题目知识点智能推荐方法,属于智能知识点推荐应用技术领域。
背景技术
在当今物联网潮流的推动下,在线教育系统得到了迅猛发展,并为广大受教育者提供了丰富的教育资源。为了提供更好的服务,在线教育系统需要更好的理解其中的教育资源以及终端用户。其中,知识点是在教育活动中传递给学生的最小单元,比如定理,概念,定义,结论,等等。传统意义上,知识点是以树状数据结构组织起来的,比如上层知识点是较为普遍笼统的知识点,而下层则较为细节具体,以此形成由上至下逐渐细化的递进数据结构;并且这种树状数据结构中,一个上层知识点可以拥有多个子知识点,且位于同一层的知识点之间则相互独立。但是,这种树状数据结构过于简化了知识点之间的结构,举例来说,有些知识点是另一知识点的前置知识点,但于此同时,它们也可能存在位于同一层次的情况,诸如“平面几何”到“立体几何”;或者,一些知识点可能有多个父知识点,诸如“平面解析几何”有两个父知识点:“二次方程”和“平面几何”。因此,知识点的多层结构更类似于多联通网状结构,而不是单向树状结构。因此,在目前的在线教育系统中,教育资源往往并没有系统化的结构,具体来说,许多问题没有显性的知识点标签,如果缺乏此项信息,教育者将难以有效率的给学生分配正确的问题。为了准确并有效的将教育资源提供给学生,在线教育的推荐系统必须高度自动化和个性化。现有技术通常采用协同滤波(collaborative filtering,CF)的方法,协同滤波(collaborative filtering,CF)是目前用于推荐系统最常见也较为有效的方法,但在在线教育的应用场景下,协同滤波却受限与其几项特殊的性质,一般来说,协同滤波通过寻找相似的用户或相似的物件,来预测用户对物件的评价打分,但是将该方法应用到在线教育系统当中,总是推荐相似的物件并不能满足用户的需求,比如,推荐一个学生已经知道的问题没有意义的;类似的,如果学生一直在同一类的问题上出错,继续推荐此类问题也是帮助不大的。
发明内容
本发明所要解决的技术问题是提供一种题目知识点智能推荐方法,基于知识点与其隐性话题之间的对应关系,建立知识点网络图,并以此依据知识点序列,能够准确实现问题文本的推荐。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种题目知识点智能推荐方法,包括如下步骤:
步骤001.针对数据库中的各个问题文本分别进行中文分词操作,分别获得各个问题文本所对应的各个中文分词,并进入步骤002;
步骤002.根据预设无意义常见词库,分别针对各个问题文本所对应的中文分词进行过滤,分别删除各个问题文本所对应中文分词中的无意义词,分别更新获得各个问题文本所对应的中文分词,进入步骤003;
步骤003.根据预设加权统计算法,获得各个问题文本所对应各个中文分词的加权统计值,然后根据各个问题文本所对应的各个分词,以及各个中文分词所对应的加权统计值,针对预设主题模型进行训练,获得训练后的预设主题模型,并进入步骤004;
步骤004.采用训练后的预设主题模,将预设数目的隐性话题分配至各个问题文本,分别获得各个问题文本所对应的隐性话题,并进入步骤005;
步骤005.分别获得各个问题文本所对应的知识点,并根据各个问题文本所对应的隐性话题,获得各个知识点与各个隐性话题之间的对应关系,并进入步骤006;
步骤006.根据各个知识点与各个隐性话题之间的对应关系,判断各个知识点彼此之间的预设对应数据关系,并据此构建知识点网络图,并进入步骤007;
步骤007.根据知识点网络图,获得对应于其中各个知识点的知识点序列,并进入步骤008;
步骤008.根据知识点序列顺序,实现针对数据库中各个问题文本的依序进行推荐。
作为本发明的一种优选技术方案:所述预设主题模型为潜在狄利克雷分配模型。
作为本发明的一种优选技术方案:所述步骤003中,在获得各个问题文本所对应各个中文分词的加权统计值之后,将各个问题文本所对应各个中文分词的加权统计值构成Bag-Of-Words模型表征数据集,然后根据Bag-Of-Words模型表征数据集,针对潜在狄利克雷分配模型进行训练,获得训练后的潜在狄利克雷分配模型。
作为本发明的一种优选技术方案:所述加权统计算法为TF-IDF算法,所述加权统计值为TF-IDF值。
作为本发明的一种优选技术方案:所述步骤006中,所述判断各个知识点彼此之间的预设对应数据关系具体为:判断各个知识点彼此之间的父子关系。
作为本发明的一种优选技术方案:所述步骤007中,针对知识点网络图中的各个知识点,根据知识点网络图,采用人工设置的方式,设计获得知识点序列。
作为本发明的一种优选技术方案:所述步骤007中,针对知识点网络图中的各个知识点,根据知识点网络图,采用统计的方式,设计获得知识点序列。
本发明所述一种题目知识点智能推荐方法采用以上技术方案与现有技术相比,具有以下技术效果:本发明设计的一种题目知识点智能推荐方法,引入知识点与其隐性话题之间的对应关系,构建知识点网络图,更好的理解了在线教育系统中的教育资源以及终端用户,能够更加准确地为终端用户提供问题文本。
附图说明
图1是本发明设计一种题目知识点智能推荐方法的流程示意图;
图2是应用本发明设计题目知识点智能推荐方法实施例中的知识点与隐性话题对应关系的建立示意图;
图3是应用本发明设计题目知识点智能推荐方法实施例中的知识点网络图;
图4是基于本发明设计题目知识点智能推荐方法的知识点序列实施例一;
图5是基于本发明设计题目知识点智能推荐方法的知识点序列实施例二。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。
如图1所示,本发明所设计题目知识点智能推荐方法在实际应用过程当中,具体包括如下步骤:
步骤001.针对数据库中的各个问题文本分别进行中文分词操作,分别获得各个问题文本所对应的各个中文分词,并进入步骤002;
步骤002.根据预设无意义常见词库,分别针对各个问题文本所对应的中文分词进行过滤,分别删除各个问题文本所对应中文分词中的无意义词(stop-words),分别更新获得各个问题文本所对应的中文分词,进入步骤003;
步骤003.根据预设TF-IDF算法,获得各个问题文本所对应各个中文分词的TF-IDF值,并将各个问题文本所对应各个中文分词的TF-IDF值构成Bag-Of-Words模型表征数据集,然后根据Bag-Of-Words模型表征数据集,针对潜在狄利克雷分配模型(Latent Dirichletallocation,LDA)进行训练,获得训练后的潜在狄利克雷分配模型,并进入步骤004;其中,LDA模型摘自:http://zh.wikipedia.org/wiki/隐含狄利克雷分布。
步骤004.如图2所示,采用训练后的潜在狄利克雷分配模型(Latent Dirichlet allocation,LDA),将预设的1000个隐性话题分配至各个问题文本,分别获得各个问题文本所对应的隐性话题,并进入步骤005;
步骤005.分别获得各个问题文本所对应的知识点,并根据各个问题文本所对应的隐性话题,获得各个知识点与各个隐性话题之间的对应关系,并进入步骤006;
步骤006.根据各个知识点与各个隐性话题之间的对应关系,判断各个知识点彼此之间的父子关系,诸如:知识点A的隐性话题为{a,b,c,d},知识点B的隐性话题为{c,d},那么知识点A相较与知识点B具有更广更多的话题,基于此观察,我们可合理的假设知识点A是知识点B的父知识点;并据此,采用上述方法构建知识点网络图,并进入步骤007;
步骤007.根据知识点网络图,采用人工设置或者统计的方式,获得对应于其中各个知识点的知识点序列,并进入步骤008;
步骤008.根据知识点序列顺序,实现针对数据库中各个问题文本的依序进行推荐,其中,在线教育推荐系统可以首先推荐某学生在知识点序列中最早的未掌握的知识点,或者,如果所有知识点都已经掌握,推荐下一个未掌握知识点。
基于上述具体实施过程,如图4所示,一个学生如果不理解“二次方程”和“平面几何”,他也难以掌握“平面解析几何”。所以,如果推荐系统发现学生在“二次方程”和“平面解析几何”中都得分不高,那么,我们应该推荐前者而不是后者;只有此学生掌握了前者,我们才可以进一步推荐后者。与此同时,如果一个学生的纪录显示他已经掌握了到当前所有的知识点,那么推荐系统应当提供学生知识点序列之后的下一个知识点。如图5所示,如果学生掌握了到“平面解析几何”为止所有的知识点,我们应该接下来推荐“立体解析几何”。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (7)

1.一种题目知识点智能推荐方法,其特征在于,包括如下步骤:
步骤001.针对数据库中的各个问题文本分别进行中文分词操作,分别获得各个问题文本所对应的各个中文分词,并进入步骤002;
步骤002.根据预设无意义常见词库,分别针对各个问题文本所对应的中文分词进行过滤,分别删除各个问题文本所对应中文分词中的无意义词,分别更新获得各个问题文本所对应的中文分词,进入步骤003;
步骤003.根据预设加权统计算法,获得各个问题文本所对应各个中文分词的加权统计值,然后根据各个问题文本所对应的各个分词,以及各个中文分词所对应的加权统计值,针对预设主题模型进行训练,获得训练后的预设主题模型,并进入步骤004;
步骤004.采用训练后的预设主题模型,将预设数目的隐性话题分配至各个问题文本,分别获得各个问题文本所对应的隐性话题,并进入步骤005;
步骤005.分别获得各个问题文本所对应的知识点,并根据各个问题文本所对应的隐性话题,获得各个知识点与各个隐性话题之间的对应关系,并进入步骤006;
步骤006.根据各个知识点与各个隐性话题之间的对应关系,判断各个知识点彼此之间的预设对应数据关系,并据此构建知识点网络图,并进入步骤007;
步骤007.根据知识点网络图,获得对应于其中各个知识点的知识点序列,并进入步骤008;
步骤008.根据知识点序列顺序,实现针对数据库中各个问题文本的依序进行推荐。
2.根据权利要求1所述一种题目知识点智能推荐方法,其特征在于:所述预设主题模型为潜在狄利克雷分配模型。
3.根据权利要求1所述一种题目知识点智能推荐方法,其特征在于:所述步骤003中,在获得各个问题文本所对应各个中文分词的加权统计值之后,将各个问题文本所对应各个中文分词的加权统计值构成Bag-Of-Words模型表征数据集,然后根据Bag-Of-Words模型表征数据集,针对潜在狄利克雷分配模型进行训练,获得训练后的潜在狄利克雷分配模型。
4.根据权利要求1所述一种题目知识点智能推荐方法,其特征在于:所述加权统计算法为TF-IDF算法,所述加权统计值为TF-IDF值。
5.根据权利要求1所述一种题目知识点智能推荐方法,其特征在于:所述步骤006中,所述判断各个知识点彼此之间的预设对应数据关系具体为:判断各个知识点彼此之间的父子关系。
6.根据权利要求1所述一种题目知识点智能推荐方法,其特征在于:所述步骤007中,针对知识点网络图中的各个知识点,根据知识点网络图,采用人工设置的方式,设计获得知识点序列。
7.根据权利要求1所述一种题目知识点智能推荐方法,其特征在于:所述步骤007中,针对知识点网络图中的各个知识点,根据知识点网络图,采用统计的方式,设计获得知识点序列。
CN201510424923.4A 2015-07-17 2015-07-17 一种题目知识点智能推荐方法 Active CN105023214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510424923.4A CN105023214B (zh) 2015-07-17 2015-07-17 一种题目知识点智能推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510424923.4A CN105023214B (zh) 2015-07-17 2015-07-17 一种题目知识点智能推荐方法

Publications (2)

Publication Number Publication Date
CN105023214A true CN105023214A (zh) 2015-11-04
CN105023214B CN105023214B (zh) 2019-03-26

Family

ID=54413162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510424923.4A Active CN105023214B (zh) 2015-07-17 2015-07-17 一种题目知识点智能推荐方法

Country Status (1)

Country Link
CN (1) CN105023214B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570109A (zh) * 2016-11-01 2017-04-19 深圳市前海点通数据有限公司 一种通过文本分析自动生成题库知识点的方法
CN108241621A (zh) * 2016-12-23 2018-07-03 北京国双科技有限公司 法律知识的检索方法及装置
CN108984658A (zh) * 2018-06-28 2018-12-11 阿里巴巴集团控股有限公司 一种智能问答数据处理方法及装置
CN110704510A (zh) * 2019-10-12 2020-01-17 中森云链(成都)科技有限责任公司 一种结合用户画像的题目推荐方法及系统
CN110968669A (zh) * 2019-11-30 2020-04-07 南京森林警察学院 一种智能视频分析警务试题归类推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060053142A1 (en) * 2002-11-13 2006-03-09 Danny Sebbane Method and system for using query information to enhance catergorization and navigation within the whole knowledge base
CN103365867A (zh) * 2012-03-29 2013-10-23 腾讯科技(深圳)有限公司 一种对用户评价进行情感分析的方法和装置
CN103577579A (zh) * 2013-11-08 2014-02-12 南方电网科学研究院有限责任公司 基于用户潜在需求的资源推荐方法及系统
US20150066711A1 (en) * 2012-04-11 2015-03-05 National University Of Singapore Methods, apparatuses and computer-readable mediums for organizing data relating to a product

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060053142A1 (en) * 2002-11-13 2006-03-09 Danny Sebbane Method and system for using query information to enhance catergorization and navigation within the whole knowledge base
CN103365867A (zh) * 2012-03-29 2013-10-23 腾讯科技(深圳)有限公司 一种对用户评价进行情感分析的方法和装置
US20150066711A1 (en) * 2012-04-11 2015-03-05 National University Of Singapore Methods, apparatuses and computer-readable mediums for organizing data relating to a product
CN103577579A (zh) * 2013-11-08 2014-02-12 南方电网科学研究院有限责任公司 基于用户潜在需求的资源推荐方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570109A (zh) * 2016-11-01 2017-04-19 深圳市前海点通数据有限公司 一种通过文本分析自动生成题库知识点的方法
CN106570109B (zh) * 2016-11-01 2020-07-24 深圳市点通数据有限公司 一种通过文本分析自动生成题库知识点的方法
CN108241621A (zh) * 2016-12-23 2018-07-03 北京国双科技有限公司 法律知识的检索方法及装置
CN108241621B (zh) * 2016-12-23 2019-12-10 北京国双科技有限公司 法律知识的检索方法及装置
CN108984658A (zh) * 2018-06-28 2018-12-11 阿里巴巴集团控股有限公司 一种智能问答数据处理方法及装置
CN110704510A (zh) * 2019-10-12 2020-01-17 中森云链(成都)科技有限责任公司 一种结合用户画像的题目推荐方法及系统
CN110968669A (zh) * 2019-11-30 2020-04-07 南京森林警察学院 一种智能视频分析警务试题归类推荐方法

Also Published As

Publication number Publication date
CN105023214B (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
KR102206256B1 (ko) 온라인 강의 시스템에서 강사를 추천하는 방법
CN105023214A (zh) 一种题目知识点智能推荐方法
CN106777127B (zh) 基于知识图谱的个性化学习过程的自动生成方法及系统
CN110363305A (zh) 联邦学习方法、系统、终端设备及存储介质
CN108959331B (zh) 运用设备学习框架的方法、装置及计算机程序
CN105183848A (zh) 基于人工智能的人机聊天方法和装置
CN106572001B (zh) 一种智能客服的对话方法及系统
CN105205043A (zh) 一种新闻读者情绪的分类方法与系统
CN109218390A (zh) 用户筛选方法及装置
CN111626616A (zh) 一种众包任务推荐方法
CN106777359B (zh) 一种基于受限玻尔兹曼机的文本业务推荐方法
CN106802951A (zh) 一种用于智能对话的话题抽取方法及系统
CN110472880A (zh) 评价合作问题解决能力的方法、装置及存储介质
CN110366735A (zh) 分析数据的方法、设备及计算机程序
CN110222254A (zh) 课程推荐方法、装置、设备及计算机可读存储介质
CN107729921B (zh) 一种机器主动学习方法及学习系统
CN110458600A (zh) 画像模型训练方法、装置、计算机设备及存储介质
US11551187B2 (en) Machine-learning creation of job posting content
CN111340380A (zh) 客户资源分配方法、装置以及存储介质
CN104951434A (zh) 品牌情绪的确定方法和装置
Sutrisna et al. The application of grounded theory methodology in built environment research
CN106250378A (zh) 公共标识分类方法及装置
CN106250407A (zh) 一种社交通信方法和装置
Li et al. Determinants Affecting Learner's Behaviour in Music Education Applying Information Technology.
CN115170364A (zh) 一种学生书籍的阅读方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant