CN107766484B - 一种学习目标导向的知识链推荐方法 - Google Patents

一种学习目标导向的知识链推荐方法 Download PDF

Info

Publication number
CN107766484B
CN107766484B CN201710957280.9A CN201710957280A CN107766484B CN 107766484 B CN107766484 B CN 107766484B CN 201710957280 A CN201710957280 A CN 201710957280A CN 107766484 B CN107766484 B CN 107766484B
Authority
CN
China
Prior art keywords
interest
user
page
behavior
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710957280.9A
Other languages
English (en)
Other versions
CN107766484A (zh
Inventor
陈波
于泠
于浩佳
刘蓉
朱汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Normal University
CERNET Corp
Original Assignee
Nanjing Normal University
CERNET Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Normal University, CERNET Corp filed Critical Nanjing Normal University
Priority to CN201710957280.9A priority Critical patent/CN107766484B/zh
Publication of CN107766484A publication Critical patent/CN107766484A/zh
Application granted granted Critical
Publication of CN107766484B publication Critical patent/CN107766484B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种学习目标导向的知识链推荐方法,通过收集用户行为的历史信息,分析用户的兴趣偏好,构建出用户的兴趣模型;根据确定的学习目标,对用户兴趣模型中各个兴趣概念值与其对应的学习目标差异值作积,并按乘积值的大小排序,形成初步的推荐兴趣概念集;向用户推荐以初步推荐兴趣概念集中的知识点为链端、知识点的所有上位知识为节点的知识链。通过对用户兴趣建模,获取用户的兴趣信息,融合确定的学习目标,合理引导推荐内容的组织,从而推荐给用户由感兴趣的知识点生成的知识链,以帮助用户更好地理解该知识点的相关内容,提高用户的学习效果。

Description

一种学习目标导向的知识链推荐方法
技术领域
本发明属于知识推荐领域,特别涉及了一种学习目标导向的知识链推荐方法。
背景技术
随着移动互联网、社交网络等高新网络技术的快速发展,全球范围内的信息分享与交流变得越加频繁,信息的传播速度、数据规模已经达到空前水平。海量的信息资源,会给用户造成信息过载的困扰,使得用户不得不从大量冗余的或者无关紧要的信息中,挑选出自己感兴趣的资讯内容。
为了解决信息洪流给用户带来的不便,知识推荐服务应运而生。知识推荐服务常常应用于图书馆、农业等领域,其主要通过收集用户行为等历史信息,分析用户的兴趣偏好,构建出用户的兴趣模型,以此向用户提供与用户兴趣一致或者与兴趣相近的知识内容,最终满足用户的兴趣需要。例如,通过收集鼠标点击、网页阅读时间等用户浏览行为,计算出各个网页主题概念的兴趣度权值,从而构建出用户的兴趣模型,最终向用户提供符合兴趣的内容信息。虽然现有的个性化知识推荐服务较好地考虑了用户兴趣需求,避免了用户从数据海洋中搜集知识的困扰,但在知识学习的个性化推荐中,用户兴趣建模方法、知识推荐机制等依然存在一些值得改进的地方。
发明内容
为了解决上述背景技术提出的技术问题,本发明旨在提供一种学习目标导向的知识链推荐方法,克服现有技术的不足,提高用户的学习效果。
为了实现上述技术目的,本发明的技术方案为:
一种学习目标导向的知识链推荐方法,包括以下步骤:
(1)通过收集用户行为的历史信息,分析用户的兴趣偏好,构建出用户的兴趣模型;
(2)根据确定的学习目标,对用户兴趣模型中各个兴趣概念值与其对应的学习目标差异值作积,并按乘积值的大小排序,形成初步的推荐兴趣概念集;
(3)向用户推荐以初步推荐兴趣概念集中的知识点为链端、知识点的所有上位知识为节点的知识链;知识链的生成是一个迭代过程,迭代获取知识点的上位概念,直到知识体系的根节点为止。
进一步地,在步骤(1)中,所述用户的兴趣模型包括用户兴趣模型表示模块、用户兴趣数据采集模块和用户兴趣更新模块;
在用户兴趣模型表示模块中,将面向用户需求的安全本体作为用户兴趣的表示形式,即将面向用户需求的安全本体充当用户的兴趣点,并利用本体中各概念间语义关系,维持兴趣点的关联,从而增强兴趣模型的表现能力;添加用户的学习目标,引导推荐给用户的知识类型,使得推荐给用户的知识是其急切需要的;
在用户兴趣数据采集模块中,在确定好用户兴趣行为指标、选择能够反应这些指标的移动终端行为之后,量化这些指标并计算用户对于某一概念的感兴趣程度;
在用户兴趣更新模块中,采用一种混合策略更新用户兴趣,一方面利用激活扩散算法,实现用户兴趣模型的及时更新,另一方面利用基于遗忘规律的兴趣衰减算法,实现用户兴趣模型中的兴趣概念值的衰减,从及时跟踪并反映用户兴趣模型的变化。
进一步地,在用户兴趣数据采集模块中,通过移动终端的监听技术,收集并量化用户在一次学习过程中,浏览知识页面所产生的行为信息,包括浏览速度、页面访问次数、屏幕点击次数、收藏行为、复制行为、分享行为、评论行为和点赞行为的信息,得到兴趣特征行为指标,包括驻留度、关注度和认同度,对这些指标的量化值进行加权和计算,得到当次用户对于所关注的兴趣点的兴趣值,并收集此次学习过程的退出时间存入到用户兴趣模型中;
进一步地,所述驻留度对应的特征行为是浏览速度;驻留度表示用户在页面上的停留程度,在同一页面内容的前提下,用户驻留时间越长,表明其对该页面的兴趣度越高,某页面的驻留度由用户在该页面上的浏览速度决定,浏览速度是页面正文字节大小与页面阅读时间间隔的比值;
设用户进入页面p,阅读的起始时间点为ScanBeginTime,阅读结束的时间点为ScanEndTime,页面正文的字节记为ContentSize,浏览开始、结束的时间间隔为ScanTime,表示用户在页面p的停留时间:
ScanTime=ScanEndTime-ScanBeginTime
在面对同一页面时,兴趣程度不同的用户,其浏览速度存在很大差别,引入浏览速度ScanSpeed,表示单位时间内用户浏览的页面字节数:
Figure BDA0001434243850000031
设置时间阈值MAXScanTime和MinScanTime,当浏览时间ScanTime超过MAXScanTime,将时间阈值MAXScanTime赋给ScanTime,当浏览时间ScanTime不超过MinScanTime,浏览速度赋值为0,当介于MAXScanTime和MinScanTime之间,则保留当前的浏览时间ScanTime,得浏览速度ScanSpeed的计算公式:
Figure BDA0001434243850000032
利用浏览速度的倒数形式来描述其与用户兴趣度的反比关系,并用数据归一化形式降低兴趣度值,将其落在[0,1]范围内,减少兴趣度的数值范围,构造出有关浏览速度ScanSpeed的兴趣函数InterestScanSpeed
Figure BDA0001434243850000041
上式中的MaxScanSpeed、MinScanSpeed是用户浏览历史记录中浏览速度最大值和最小值。
进一步地,关注度对应的特征行为是页面访问次数和屏幕点击次数,关注度表示用户对于页面的关注程度,由页面访问次数和屏幕点击次数决定,用户频繁多次的访问或者点击某一页面,表示此页面是潜在的兴趣页面;
设访问页面p的次数变量为VisitCount,某一时间段内频繁访问页面p的次数和为VisitCountSum,得到页面访问次数的线性增加公式:
VisitCountSum=VisitCount+1
对页面访问次数进行归一化,使计算出来的兴趣度落在[0,1]范围内,得到关于VisitCountSum的兴趣度计算公式:
Figure BDA0001434243850000042
上式中的VisitMaxNumber是访问次数的阈值;
设用户访问页面p期间,触摸移动显示屏的次数变量为TouchCount,屏幕点击次数和为TouchCountSum:
TouchCountSum=TouchCount+1
对屏幕点击次数进行归一化,使计算出来的兴趣度落在[0,1]范围内,得到关于TouchCountSum的兴趣度计算公式:
Figure BDA0001434243850000051
上式中的TouchMaxNumber是设定的点击次数的阈值。
进一步地,认同度对应的特征行为是收藏行为、复制行为、分享行为、评论行为和点赞行为,认同度表示用户对于页面的认同程度;
构造二值函数InterestCollect来量化收藏行为,若网页存在收藏行为,则其值设置为1,否则,设置为0:
Figure BDA0001434243850000052
构造二值函数InterestCopy来量化复制行为,若网页存在复制行为,则其值设置为1,否则,设置为0:
Figure BDA0001434243850000053
构造二值函数InterestShare来量化分享行为,若网页存在分享行为时,则其值设置为1,否则,设置为0:
Figure BDA0001434243850000054
构造二值函数InterestComment来量化评论行为,若网页存在评论行为,则其值设置为1,否则,设置为0。
Figure BDA0001434243850000055
构造二值函数InterestFlag来量化点赞行为,若网页存在点赞行为,则其值设置为1,否则,设置为0:
Figure BDA0001434243850000056
进一步地,定义页面p的兴趣度得分函数InterestValue(p),它是通过驻留度InterestReside、关注度InterestFocus和认同度InterestIdentity三者的加权和值求得:
InterestValue(p)=α*InterestReside+β*InterestFocus+η*InterestIdentity
InterestReside=InterestScanSpeed
InterestFocus=InterestVisitCountSum+InterestTouchCountSum
InterestIdentity=InterestCollect+InterestCopy+InterestShare+InterestComment+InterestFlag
α+β+η=1
其中,α、β、η分别为驻留度、关注度、认同度的权重调节因子。
进一步地,用户兴趣模型表示模块确定的用户兴趣的表示形式:
ULCM=(User,Learning_Goal,CI,LoginIn formation)
其中,User为用户信息,Learning_Goal为用户学习目标,CI为用户兴趣集,LoginIn formation为用户学习时间信息;
User是对用户基本属性的概括,需要用户在注册时填写,包括用户名、性别、学历和职业,其中用户名是用户在模型中的唯一标识,用于区别系统中其他用户;
Learning_Goal={<Category1,Difference1>,…,<Categoryi,Differencei>},表示用户当前的学习目标键值对,即用户通过相关学习之后想要达到的最佳状态,Categoryi为用户学习目标的所属知识类别,Differencei是用户鉴于现阶段自身的客观因素,对Categoryi类别知识所掌握的程度与用户期盼所能达到的最佳掌握状态的差值,其值范围为[0,1];其中,知识所掌握的程度由知识评估得到,即用户在该主题类型下的评估得分与该试题类型总分的比值,用户期盼所能达到的最佳掌握状态为单位1;所述知识评估是利用测验评估法,获取用户的学习目标值;
CI={<C1,InterestValue1>,…,<Ci,InterestValuei>},表示安全本体中用户感兴趣的概念以及该概念的兴趣度的键值对,兴趣度值越大,表示用户对该概念越感兴趣;Ci表示面向用户需求的信息安全本体中的概念,InterestValuei表示Ci所对应的兴趣度值;
LoginInformation={CreateTime,LastLogoutTime,LoginCount},记录了用户进入系统学习的时间信息,CreateTime表示用户第一次接受信息安全意识教育生成兴趣模型的时间,LastLogoutTime表示的是最近一次访问的退出时间,LoginCount表示参与信息安全意识教育的次数,是用户每次学习过程的标记,与其他时间段学习过程相互区分,以便分析用户的历史记录。
进一步地,步骤(3)的具体步骤如下:
(a)计算兴趣概念值与其对应的学习目标差异值的乘积:遍历CI中的每一个概念Ci,判断其属于Learning_Goal中Categoryj后,求两者的乘积值Pvaluei=InterestValuei*Differencej,并存入到ProductCI中,其格式为<Ci,Pvaluei>;
(b)获取用户最感兴趣的Top-N兴趣概念集:遍历结束之后,将集合ProductCI中按Pvalue值进行降序排序,并根据系统的预定要求,截取用户最感兴趣的Top-N兴趣概念,即MaxValue_N(ProductCI),得到初步推荐兴趣概念集PreCI={<C1,Pvalue1>,…,<CN,PvalueN>};
(c)知识链生成:从初步推荐兴趣概念集PreCI中,迭代获取各知识点在安全本体中的上位节点,直至上位节点是安全本体中的根节点为止,并将其添加到该概念的知识链中,并存入InterestListTemp,直到遍历完PreCI的兴趣概念集;
(d)消除InterestListTemp存在的子链:遍历InterestListTemp集合中的变量,标记为key1,并在其内部嵌套一层对于InterestListTemp的遍历,标记其变量为key2;若满足key1≠key2且key1不是key2的子集,则将key1存入到知识链集合InterestList中,若存在key1≠key2且key1是key2的子集,则舍弃,不存入到InterestList中,最终生成知识链集合InterestList。
采用上述技术方案带来的有益效果:
(1)本发明充分考虑到各个用户的学习目标。实际生活中,鉴于自身教育背景、从事行业等客观因素的影响,不同用户对系统所提供的各知识掌握的程度不尽相同,这导致不同用户之间所要达到的目标也千差万别。若系统不能将用户学习目标的知识需求考虑在内,可能会导致如下现象:提供给用户的知识内容是用户所感兴趣的,但并不是用户最急切需要的。推荐系统如果在向用户推荐知识时,能兼顾用户的学习目标,有意识的提高与用户学习目标相一致的知识点的兴趣权重,从而合理安排推荐的知识列表。
(2)本发明突破以往个性化知识推荐机制向用户推荐的是单一的知识点内容的传统,改向用户推荐以知识点为终端的知识链,而知识链的其余节点均是由该知识点的所有上位知识组成,从而提高用户知识学习效果,更好地满足用户的学习需要。
(3)本发明研究了适应移动终端的用户兴趣行为指标。通常,用户的个体行为与其自身的兴趣存在着很大的关系,用户对网页的兴趣度与其在网页上的操作行为密切相关。用户日常的行为表面下,隐藏着个人的兴趣信息,例如其访问一个站点或者某一个页面,通常是带有某种偏好。本发明针对用户越来越倾向于选择在智能手机等移动终端上进行网络社交、教育学习等大趋势下,将用户移动终端兴趣行为引入到知识学习环节中,来挖掘用户潜在的学习需求,从而方便后期挖掘用户的兴趣。
附图说明
图1是本发明总体流程图;
图2是本发明具体实施示意图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
一种学习目标导向的知识链推荐方法,如图1所示,包括以下步骤。
步骤1:通过收集用户行为等历史信息,分析用户的兴趣偏好,构建出用户的兴趣模型,主要包括用户兴趣模型表示模块、用户兴趣数据采集模块和用户兴趣更新模块。
步骤2:根据确定的学习目标,将用户兴趣模型中各个兴趣概念值,与其对应的学习目标差异值作积,并按乘积值排序并取其Top-N概念,形成初步的推荐兴趣概念集。
步骤3:向用户推荐以初步推荐兴趣概念集中的知识点为链端,知识点的所有上位知识为节点的知识链。这里的知识链的生成是一个迭代过程,迭代获取知识点的上位概念,直到知识体系的根节点为止。
本发明能够通过对用户兴趣建模,获取用户的兴趣信息,并以此为基准,融合确定的学习目标,合理引导推荐内容的组织,从而推荐给用户所感兴趣的,由某个知识点生成的知识链,以帮助用户更好地理解该知识点的相关内容,提高用户的学习效果。
在用户兴趣模型表示模块中,将面向用户需求的安全本体作为用户兴趣的表示形式。该模块将本体概念充当用户的兴趣点,并利用本体中各概念间语义关系,维持兴趣点的关联,从而增强兴趣模型的表现能力。此外,在用户兴趣模型中添加用户的学习目标,从而引导推荐给用户的知识类型,使得推荐给用户的知识是其急切需要的。
在用户兴趣数据采集模块中,在确定好用户兴趣行为指标,精心选择可以反应上述指标的移动终端行为之后,量化这些指标并计算用户对于某一概念感兴趣程度。
在用户兴趣更新模块中,采取一种混合策略的用户兴趣更新方法,一方面利用激活扩散算法,实现用户兴趣模型的及时更新,另一方面利用基于遗忘规律的兴趣衰减算法,实现用户兴趣模型中的兴趣概念值的衰减,从而能够及时跟踪并反映用户兴趣模型的变化。
本发明的具体过程如图2所示。
用户通过注册机制填写个人基本信息,并通过预先设置的评估环节得到个人的学习目标。
用户兴趣的表现形式为:
ULCM=(User,Learning_Goal,CI,LoginIn formation)
该模型确立了以用户信息、用户学习目标、用户兴趣集、用户学习时间信息的兴趣模型表示形式。其中,
User是对用户基本属性的概括,一般需要用户在注册时填写,包括用户名、性别、学历、职业等基本个人信息,其中用户名是用户在模型中的唯一标识,用于区别系统中其他用户。此外,学历主要包括博士、硕士、本科、其他;职业主要包括政府机关、国企、事业单位、私企、其他等。
Learning_Goal={<Category1,Difference1>,…,<Categoryi,Differencei>},表示的是用户当前的学习目标键值对,即用户通过相关学习之后想要达到的最佳状态。其中,Categoryi为用户学习目标的所属知识(兴趣)类别,Differencei是用户鉴于现阶段自身的客观因素,对Categoryi类别知识所掌握的程度与用户期盼所能达到的最佳掌握状态的差值,其值范围为[0,1](差值越大,表示用户对该知识类别掌握程度与最佳状态的差距越大)。其中,知识所掌握的程度主要由知识评估得到,即用户在该主题类型下的评估得分与该试题类型总分的比值,用户期盼所能达到的最佳掌握状态为单位1。所述的知识评估,主要利用测验评估法,获取用户的学习目标值。测试题以判断题、单选题、多选题形式组成,试题主题主要依据知识主题设置,其中各主题设置的题目数N,各题分值为M(N、M根据具体情况设置)。
CI表示的是安全本体中用户感兴趣的概念以及该概念的兴趣度的键值对(<C1,InterestValue1>,…,<Ci,InterestValuei>),兴趣度值越大,表示用户对该概念越感兴趣。其中Ci表示的是本体(它是所构建的面向用户需求的信息安全本体,维护着兴趣模型中各个概念的语义关系)中的概念,InterestValuei表示Ci所对应的兴趣度值。
LoginInformation={CreateTime,LastLogoutTime,LoginCount},记录了用户进入系统学习的时间信息,CreateTime表示用户第一次接受信息安全意识教育生成兴趣模型的时间,LastLogoutTime表示的是最近一次访问的退出时间,LoginCount表示参与信息安全意识教育的次数,是用户每次学习过程的标记,与其他时间段学习过程相互区分,便于分析用户的历史记录。
用户兴趣数据采集,包括:
通过移动终端的监听技术,收集并量化用户在一次学习过程中,浏览知识页面所产生的行为:浏览速度、页面访问次数、屏幕点击次数、收藏行为、复制行为、分享行为、评论行为、点赞行为的信息,得到兴趣特征行为指标:驻留度、关注度、认同度,对这三个指标的量化值进行加权和计算得到当次用户对于所关注的兴趣点的兴趣值,并收集此次学习过程的退出时间存入到用户兴趣模型中。
其中,第一个特征行为驻留度,表示用户在页面上的停留程度。在同一页面内容的前提下,用户驻留时间越长,表明其对该页面的兴趣度越高。某页面的驻留度主要由用户在该页面上的浏览速度决定。浏览速度,也就是利用页面正文字节大小与页面阅读时间间隔(页面阅读开始与结束的时间差)的比值。
假设用户进入页面p,阅读的起始时间为点为ScanBeginTime,阅读结束的时间点为ScanEndTime,页面正文的字节记为ContentSize。浏览开始、结束的时间间隔为ScanTime,表示用户在页面的停留时间:
ScanTime=ScanEndTime-ScanBeginTime
在面对同一页面时,兴趣程度不同的用户,其浏览速度存在很大的差别。引入浏览速度ScanSpeed的概念,其表示单位时间内用户浏览的页面字节数。
Figure BDA0001434243850000111
设置时间阈值MAXScanTime和MinScanTime,来解决浏览时间异常的情形,即当浏览时间ScanTime超过MAXScanTime,就将时间阈值MAXScanTime赋给ScanTime,当浏览时间ScanTime不超过MinScanTime,浏览速度直接赋值为0,介于两者中间的浏览时间,则保留当前的浏览时间ScanTime,用于浏览速度的计算。结合浏览时间ScanTime的三种情况,可得浏览速度ScanSpeed的计算公式:
Figure BDA0001434243850000121
利用浏览速度的倒数形式来描述其与用户兴趣度的反比关系,并用数据归一化形式来降低兴趣度值,将其落在[0,1]间,减少兴趣度的数值范围,构造出有关浏览速度ScanSpeed的兴趣函数:
Figure BDA0001434243850000122
上式中的MaxScanSpeed、MinScanSpeed是用户浏览历史记录中浏览速度最大值和最小值。
第二个特征行为关注度,表示用户对于页面的关注程度,其主要由页面访问次数和屏幕点击次数决定。通常情形,用户频繁多次的访问或者点击某一页面,可以证明用户对本页面比较关注,也就意味着此页面是潜在的兴趣页面。
页面访问次数计算方法。现实生活中,我们在阅读书籍的时候,也会因为对某一部分的内容特别感兴趣,而频繁的浏览回顾。假设点击页面p的次数变量标记为VisitCount,某一时间段内频繁访问页面p的次数和为VisitCountSum,那么可以得到页面访问次数的线性增加公式:
VisitCountSum=VisitCount+1
这里,我们为了方便计算兴趣度,对页面访问次数进行归一化,使计算出来的兴趣度落在[0,1]范围内,得到该行为指标的兴趣度计算公式:
Figure BDA0001434243850000131
上式中的VisitMaxNumber是页面点击次数的阈值。当页面点击次数大于VisitMaxNumber时,表明用户在页面p上长时间的进行操作,隐含着用户对页面p兴趣度很高。VisitMaxNumber的具体值通过实验给出一个最佳值,一般取10。
屏幕点击次数计算方法。用户频繁点击某一页面,表明用户对该页面的兴趣度较高。假设用户访问页面p期间,触摸移动显示屏的次数变量标记为TouchCount,用户每次触碰页面,变量TouchCount就会自增,那么可以得到屏幕点击次数TouchCountSum:
TouchCountSum=TouchCount+1
这里,我们为了方便计算,对屏幕点击次数进行归一化,使计算出来的兴趣度落在[0,1]范围内,其兴趣度计算公式为:
Figure BDA0001434243850000132
上式中的TouchMaxNumber是屏幕点击次数的阈值。当TouchCountSum不大于TouchMaxNumber,我们取屏幕次数与最大触屏数的比值,来表示用户兴趣度,而当屏幕点击次数大于TouchMaxNumber时,表明用户在页面p上长时间的进行操作,隐含着用户对页面p兴趣度很高。TouchMaxNumber的具体值通过实验给出一个最佳值,一般取10。
第三个特征行为认同度,表示用户对于页面的认同程度。认同度侧重的是用户对于感兴趣页面积极主动表现,主要包括收藏、复制、分享、评论、点赞五个方面。
收藏行为统计方法。构造二值函数InterestCollect,若网页存在收藏行为,则其值设置为1,否则,值为0:
Figure BDA0001434243850000141
复制行为统计方法。构造二值函数InterestCopy,若网页存在复制行为,则这项值设置为1,否则,设置为0:
Figure BDA0001434243850000142
分享行为统计方法。构造二值函数InterestShare来量化分享行为,如果网页存在分享行为时,则这项值设置为1,否则,设置为0:
Figure BDA0001434243850000143
评论行为统计方法。构造二值函数InterestComment来量化评论行为若是网页存在该行为,则这项值设置为1,否则,为0:
Figure BDA0001434243850000144
点赞行为统计方法。构造二值函数InterestFlag来表示是否发生“点赞”行为,若是网页存在该行为,则这项值设置为1,否则,为0:
Figure BDA0001434243850000145
在对以上用户潜在兴趣行为指标的分析及量化的基础上,文中引入页面兴趣度得分函数,其定义如下:
页面p兴趣度得分InterestValue(p),是通过用户行为指标中的驻留度InterestReside、关注度InterestFocus、认同度InterestIdentity三者的加权和值。公式如下:
InterestValue(p)=α*InterestReside+β*InterestFocus+η*InterestIdentity
InterestReside=InterestScanSpeed
InterestFocus=InterestVisitCountSum+InterestTouchCountSum
InterestIdentity=InterestCollect+InterestCopy+InterestShare+InterestComment+InterestFlag
α+β+η=1
其中,α、β、η的权值表示的是驻留度、关注度、认同度的重要性的调节因子。一般认为认同度相比其他两类表现兴趣更为直接,重要性较高,而驻留度与关注度同等重要,可取α值为0.3,β值为0.3,η值为0.4。
本发明研究了适应移动终端的用户兴趣行为指标。通常,用户的个体行为与其自身的兴趣存在着很大的关系,用户对网页的兴趣度与其在网页上的操作行为密切相关。用户日常的行为表面下,隐藏着个人的兴趣信息,例如其访问一个站点或者某一个页面,通常是带有某种偏好。本发明针对用户越来越倾向于选择在智能手机等移动终端上进行网络社交、教育学习等大趋势下,将用户移动终端兴趣行为引入到知识学习环节中,来挖掘用户潜在的学习需求,从而方便后期挖掘用户的兴趣。
生成知识链的步骤如下:
(a)计算兴趣概念值与其对应的学习目标差异值的乘积:遍历CI中的每一个概念Ci,判断其属于Learning_Goal中Categoryj后,求两者的乘积值Pvaluei=InterestValuei*Differencej,并存入到ProductCI中,其格式为<Ci,Pvaluei>;
(b)获取用户最感兴趣的Top-N兴趣概念集:遍历结束之后,将集合ProductCI中按Pvalue值进行降序排序,并根据系统的预定要求,截取用户最感兴趣的Top-N兴趣概念,即MaxValue_N(ProductCI),得到初步推荐兴趣概念集PreCI={<C1,Pvalue1>,…,<CN,PvalueN>};
(c)知识链生成:从初步推荐兴趣概念集PreCI中,迭代获取各知识点在安全本体中的上位节点,直至上位节点是安全本体中的根节点为止,并将其添加到该概念的知识链中,并存入InterestListTemp,直到遍历完PreCI的兴趣概念集;
(d)消除InterestListTemp存在的子链:遍历InterestListTemp集合中的变量,标记为key1,并在其内部嵌套一层对于InterestListTemp的遍历,标记其变量为key2;若满足key1≠key2且key1不是key2的子集,则将key1存入到知识链集合InterestList中,若存在key1≠key2且key1是key2的子集,则舍弃,不存入到InterestList中,最终生成知识链集合InterestList。
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (8)

1.一种学习目标导向的知识链推荐方法,其特征在于,包括以下步骤:
(1)通过收集用户行为的历史信息,分析用户的兴趣偏好,构建出用户的兴趣模型;
所述用户的兴趣模型包括用户兴趣模型表示模块、用户兴趣数据采集模块和用户兴趣更新模块;
在所述用户兴趣模型表示模块中,将面向用户需求的安全本体充当用户的兴趣点,并利用本体中各概念间语义关系,维持兴趣点的关联,从而增强用户的兴趣模型的表现能力;添加用户的学习目标,引导推荐给用户的知识类型;
在所述用户兴趣数据采集模块中,在确定好用户兴趣行为指标、选择能够反应所述用户兴趣行为指标的移动终端行为之后,量化所述用户兴趣行为指标并计算用户对于某一兴趣概念的感兴趣程度,即兴趣度;
在所述用户兴趣更新模块中,采用一种混合策略更新用户的兴趣模型,一方面利用激活扩散算法,实现用户的兴趣模型的及时更新,另一方面利用基于遗忘规律的兴趣衰减算法,实现用户的兴趣模型中的兴趣概念值的衰减,从而及时跟踪并反映用户的兴趣模型的变化;
(2)用户的兴趣模型中包含了多个兴趣概念值,根据确定的学习目标,将各个兴趣概念值与对应的学习目标差异值作积,获取用户最感兴趣的Top-N兴趣概念集,形成初步的推荐兴趣概念集,所述兴趣概念值为安全本体中用户感兴趣的概念以及该概念的兴趣度的键值对;
(3)向用户推荐以所述初步的推荐兴趣概念集中的兴趣概念为链端、该兴趣概念的所有上位兴趣概念为节点的知识链的集合;所述知识链的生成过程如下:从初步的推荐兴趣概念集中,迭代获取各兴趣概念在安全本体中的上位节点,直至上位节点是安全本体中的根节点为止,并将其添加到该兴趣概念的知识链中,直到遍历完所述初步的推荐兴趣概念集中的兴趣概念。
2.根据权利要求1所述学习目标导向的知识链推荐方法,其特征在于:在所述用户兴趣数据采集模块中,通过移动终端的监听技术,收集并量化用户在一次学习过程中,浏览知识页面所产生的行为信息,包括浏览速度、页面访问次数、屏幕点击次数、收藏行为、复制行为、分享行为、评论行为和点赞行为的信息,确定用户兴趣行为指标,包括驻留度、关注度和认同度,对这些用户兴趣行为指标的量化值进行加权和计算,得到当次用户对于所关注的兴趣点的兴趣值,并收集此次学习过程的退出时间存入到用户的兴趣模型中。
3.根据权利要求2所述学习目标导向的知识链推荐方法,其特征在于:所述驻留度对应的移动终端行为是浏览速度;驻留度表示用户在页面上的停留程度,在同一页面内容的前提下,用户驻留时间越长,表明其对该页面的兴趣度越高,某页面的驻留度由用户在该页面上的浏览速度决定,浏览速度是页面正文字节大小与页面阅读时间间隔的比值;
设用户进入页面p,阅读的起始时间点为ScanBeginTime,阅读的结束时间点为ScanEndTime,页面正文的字节记为ContentSize,浏览开始至浏览结束的时间间隔为ScanTime,表示用户在页面p的浏览时间:
ScanTime=ScanEndTime-ScanBeginTime
在面对同一页面时,兴趣度不同的用户,其浏览速度存在很大差别,引入浏览速度ScanSpeed,表示单位时间内用户浏览的页面字节数:
Figure FDA0002589917790000021
设置时间阈值MAXScanTime和MinScanTime,当浏览时间ScanTime超过MAXScanTime,将时间阈值MAXScanTime赋给ScanTime,当浏览时间ScanTime不超过MinScanTime,浏览速度赋值为0,当介于MAXScanTime和MinScanTime之间,则保留当前的浏览时间ScanTime,得浏览速度ScanSpeed的计算公式:
Figure FDA0002589917790000022
利用浏览速度的倒数形式来描述其与用户兴趣度的反比关系,并用数据归一化形式降低兴趣度值,将其落在[0,1]范围内,减少兴趣度的数值范围,构造出有关浏览速度ScanSpeed的兴趣函数InterestScanSpeed
Figure FDA0002589917790000023
上式中的MaxScanSpeed、MinScanSpeed是用户浏览历史记录中浏览速度最大值和最小值。
4.根据权利要求3所述学习目标导向的知识链推荐方法,其特征在于:关注度对应的移动终端行为是页面访问次数和屏幕点击次数,关注度表示用户对于页面的关注程度,由页面访问次数和屏幕点击次数决定,用户频繁多次的访问或者点击某一页面,表示此页面是潜在的兴趣页面;
设访问页面p的次数变量为VisitCount,某一时间段内频繁访问页面p的次数和为VisitCountSum,得到页面访问次数的线性增加公式:
VisitCountSum=VisitCount+1
对页面访问次数进行归一化,使计算出来的兴趣度落在[0,1]范围内,得到关于VisitCountSum的兴趣度计算公式:
Figure FDA0002589917790000031
上式中的VisitMaxNumber是访问次数的阈值;
设用户访问页面p期间,触摸移动显示屏的次数变量为TouchCount,屏幕点击次数和为TouchCountSum:
TouchCountSum=TouchCount+1
对屏幕点击次数进行归一化,使计算出来的兴趣度落在[0,1]范围内,得到关于TouchCountSum的兴趣度计算公式:
Figure FDA0002589917790000032
上式中的TouchMaxNumber是设定的点击次数的阈值。
5.根据权利要求4所述学习目标导向的知识链推荐方法,其特征在于:认同度对应的移动终端行为是收藏行为、复制行为、分享行为、评论行为和点赞行为,认同度表示用户对于页面的认同程度;
构造二值函数InterestCollect来量化收藏行为,若网页存在收藏行为,则其值设置为1,否则,设置为0:
Figure FDA0002589917790000033
构造二值函数InterestCopy来量化复制行为,若网页存在复制行为,则其值设置为1,否则,设置为0:
Figure FDA0002589917790000034
构造二值函数InterestShare来量化分享行为,若网页存在分享行为时,则其值设置为1,否则,设置为0:
Figure FDA0002589917790000035
构造二值函数InterestComment来量化评论行为,若网页存在评论行为,则其值设置为1,否则,设置为0:
Figure FDA0002589917790000041
构造二值函数InterestFlag来量化点赞行为,若网页存在点赞行为,则其值设置为1,否则,设置为0:
Figure FDA0002589917790000042
6.根据权利要求5所述学习目标导向的知识链推荐方法,其特征在于:定义页面p的兴趣度得分函数InterestValue(p),它是通过驻留度InterestReside、关注度InterestFocus和认同度InterestIdentity三者的加权和值求得:
InterestValue(p)=α*InterestReside+β*InterestFocus+η*InterestIdentity
InterestReside=InterestScanSpeed
InterestFocus=InterestVisitCountSum+InterestTouchCountSum
InterestIdentity=InterestCollect+InterestCopy+InterestShare+InterestComment+InterestFlag
α+β+η=1
其中,α、β、η分别为驻留度、关注度、认同度的权重调节因子。
7.根据权利要求1所述学习目标导向的知识链推荐方法,其特征在于:所述用户兴趣模型表示模块确定的用户兴趣的表示形式:
ULCM=(User,Learning_Goal,CI,LoginIn formation)
其中,User为用户信息,Learning_Goal为用户的学习目标,CI为用户兴趣集,LoginInformation为用户学习时间信息;
User是对用户基本属性的概括,需要用户在注册时填写,包括用户名、性别、学历和职业,其中用户名是用户在用户的兴趣模型中的唯一标识,用于区别系统中其他用户;
Learning_Goal={<Category1,Difference1>,…,<Categoryi,Differencei>},其中<Categoryi,Differencei>表
示用户当前的学习目标键值对,即用户通过相关学习之后想要达到的最佳状态,Categoryi为用户的学习目标所属知识类别,Differencei是用户鉴于现阶段自身的客观因素,对Categoryi类别知识所掌握的程度与用户期盼所能达到的最佳掌握状态的差值,其值范围为[0,1];其中,知识所掌握的程度由知识评估得到,即用户在该主题类型下的评估得分与该试题类型总分的比值,用户期盼所能达到的最佳掌握状态为单位1;所述知识评估是利用测验评估法,获取用户的学习目标值;
CI={<C1,InterestValue1>,…,<Ci,InterestValuei>},其中<Ci,InterestValuei>表示安全本体中用户感兴趣的概念以及该概念的兴趣度的键值对,兴趣度越大,表示用户对该概念越感兴趣;Ci表示面向用户需求的信息安全本体中的概念,InterestValuei表示Ci所对应的兴趣度;
LoginInformation={CreateTime,LastLogoutTime,LoginCount},记录了用户进入系统学习的时间信息,CreateTime表示用户第一次接受信息安全意识教育生成用户的兴趣模型的时间,LastLogoutTime表示的是最近一次访问的退出时间,LoginCount表示参与信息安全意识教育的次数,是用户每次学习过程的标记,与其他时间段学习过程相互区分,以便分析用户的历史记录。
8.根据权利要求7所述学习目标导向的知识链推荐方法,其特征在于:步骤(2)和(3)的具体步骤如下:
(a)计算兴趣概念值与其对应的学习目标差异值的乘积:遍历CI中的每一个概念Ci,判断其属于Learning_Goal中Categoryj后,求两者的乘积值Pvaluei=InterestValuei*Differencej,并存入到ProductCI中,其格式为<Ci,Pvaluei>;
(b)获取用户最感兴趣的Top-N兴趣概念集:遍历结束之后,将集合ProductCI中按Pvalue值进行降序排序,并根据系统的预定要求,截取用户最感兴趣的Top-N概念,即MaxValue_N(ProductCI),得到初步的推荐兴趣概念集PreCI={<C1,Pvalue1>,…,<CN,PvalueN>};
(c)知识链生成:从初步的推荐兴趣概念集PreCI中,迭代获取各知识点在安全本体中的上位节点,直至上位节点是安全本体中的根节点为止,并将其添加到该兴趣概念的知识链中,并存入InterestListTemp,直到遍历完PreCI中的兴趣概念;
(d)消除InterestListTemp存在的子链:遍历InterestListTemp集合中的变量,标记为key1,并在其内部嵌套一层对于InterestListTemp的遍历,标记其变量为key2;若满足key1≠key2且key1不是key2的子集,则将key1存入到知识链的集合InterestList中,若存在key1≠key2且key1是key2的子集,则舍弃,不存入到InterestList中,最终生成知识链的集合InterestList。
CN201710957280.9A 2017-10-16 2017-10-16 一种学习目标导向的知识链推荐方法 Expired - Fee Related CN107766484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710957280.9A CN107766484B (zh) 2017-10-16 2017-10-16 一种学习目标导向的知识链推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710957280.9A CN107766484B (zh) 2017-10-16 2017-10-16 一种学习目标导向的知识链推荐方法

Publications (2)

Publication Number Publication Date
CN107766484A CN107766484A (zh) 2018-03-06
CN107766484B true CN107766484B (zh) 2020-09-29

Family

ID=61268708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710957280.9A Expired - Fee Related CN107766484B (zh) 2017-10-16 2017-10-16 一种学习目标导向的知识链推荐方法

Country Status (1)

Country Link
CN (1) CN107766484B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564495A (zh) * 2018-03-08 2018-09-21 深圳市鹰硕技术有限公司 网络教学关注度评估方法以及装置
CN108629362B (zh) * 2018-05-30 2019-11-01 华南师范大学 一种面向移动环境的学习行为习惯发现量化系统及方法
CN108984756B (zh) * 2018-07-18 2022-03-08 网易传媒科技(北京)有限公司 信息处理方法、介质、装置和计算设备
EP3620936A1 (en) 2018-09-07 2020-03-11 Delta Electronics, Inc. System and method for recommending multimedia data
CN109582857A (zh) * 2018-10-15 2019-04-05 深圳壹账通智能科技有限公司 基于大数据信息推送方法、装置、计算机设备及存储介质
CN110956530A (zh) * 2019-11-26 2020-04-03 上海风秩科技有限公司 推荐方法、装置、电子设备及计算机可读存储介质
CN112052389A (zh) * 2020-08-27 2020-12-08 安徽聚戎科技信息咨询有限公司 一种基于区域链的知识推荐方法
CN112102676B (zh) * 2020-09-29 2022-09-09 深圳市元征科技股份有限公司 一种培训内容生成方法及装置
CN112287218B (zh) * 2020-10-26 2022-11-01 安徽工业大学 一种基于知识图谱的非煤矿山文献关联推荐方法
CN112328645B (zh) * 2020-11-26 2021-07-20 上海松鼠课堂人工智能科技有限公司 基于知识图谱的用户兴趣爱好确定方法及系统
CN114792110B (zh) * 2021-01-25 2024-02-13 南京意博软件科技有限公司 兴趣点数据的生成方法及装置
CN116304315B (zh) * 2023-02-27 2024-02-06 广州兴趣岛信息科技有限公司 一种网上教学用内容智能推荐系统
CN116894134B (zh) * 2023-09-11 2023-12-12 湖南创研科技股份有限公司 一种基于用户行为的大数据分析方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655856A (zh) * 2009-09-15 2010-02-24 西安交通大学 一种获取用户特定知识元兴趣度的方法
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN102737120A (zh) * 2012-06-01 2012-10-17 西安交通大学 一种个性化网络学习资源推荐方法
CN103150667A (zh) * 2013-03-14 2013-06-12 北京大学 一种基于本体结构的个性化推荐方法
CN106960025A (zh) * 2017-03-19 2017-07-18 北京工业大学 一种基于领域知识图谱的个性化文献推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN101655856A (zh) * 2009-09-15 2010-02-24 西安交通大学 一种获取用户特定知识元兴趣度的方法
CN102737120A (zh) * 2012-06-01 2012-10-17 西安交通大学 一种个性化网络学习资源推荐方法
CN103150667A (zh) * 2013-03-14 2013-06-12 北京大学 一种基于本体结构的个性化推荐方法
CN106960025A (zh) * 2017-03-19 2017-07-18 北京工业大学 一种基于领域知识图谱的个性化文献推荐方法

Also Published As

Publication number Publication date
CN107766484A (zh) 2018-03-06

Similar Documents

Publication Publication Date Title
CN107766484B (zh) 一种学习目标导向的知识链推荐方法
Medvedev et al. The anatomy of Reddit: An overview of academic research
Zhang et al. Citation content analysis (CCA): A framework for syntactic and semantic analysis of citation content
Joo et al. Analysis of content topics, user engagement and library factors in public library social media based on text mining
Fogués et al. BFF: A tool for eliciting tie strength and user communities in social networking services
Cleger-Tamayo et al. Top-N news recommendations in digital newspapers
Beel Towards effective research-paper recommender systems and user modeling based on mind maps
Chung et al. Business stakeholder analyzer: An experiment of classifying stakeholders on the Web
Khater et al. Personalized recommendation for online social networks information: Personal preferences and location-based community trends
Pontis et al. Academics' responses to encountered information: Context matters
Musto et al. Myrror: a platform for holistic user modeling: Merging data from social networks, smartphones and wearable devices
Han How do you perceive this author? Understanding and modeling authors’ communication quality in social media
Zarrinkalam et al. User interest prediction over future unobserved topics on social networks
Oh Social q&a
Saxena et al. Users roles identification on online crowdsourced q&a platforms and encyclopedias: a survey
Maidel et al. Ontological content‐based filtering for personalised newspapers: A method and its evaluation
Wang et al. Temporal topic-based multi-dimensional social influence evaluation in online social networks
Kaveri et al. A framework for recommending health-related topics based on topic modeling in conversational data (Twitter)
Furini et al. A predictive method to improve the effectiveness of twitter communication in a cultural heritage scenario
Shi et al. Which questions are valuable in online Q&A communities? A question’s position in a knowledge network matters
Gayakwad et al. Content Modelling for unbiased information analysis
Li et al. Probabilistic local expert retrieval
Bogers Recommender systems for social bookmarking
Xu et al. Investigating users’ tagging behavior in online academic community based on growth model: Difference between active and inactive users
Raban et al. Statistical inference from power law distributed web‐based social interactions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180731

Address after: 210024 Ninghai Road, Gulou District, Nanjing, Jiangsu 122

Applicant after: NANJING NORMAL University

Applicant after: CERNET Co.,Ltd.

Address before: 210024 Ninghai Road, Gulou District, Nanjing, Jiangsu 122

Applicant before: Nanjing Normal University

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200929