CN107391582A - 基于上下文本体树计算用户偏好相似度的信息推荐方法 - Google Patents

基于上下文本体树计算用户偏好相似度的信息推荐方法 Download PDF

Info

Publication number
CN107391582A
CN107391582A CN201710477707.5A CN201710477707A CN107391582A CN 107391582 A CN107391582 A CN 107391582A CN 201710477707 A CN201710477707 A CN 201710477707A CN 107391582 A CN107391582 A CN 107391582A
Authority
CN
China
Prior art keywords
mrow
msub
context
msup
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710477707.5A
Other languages
English (en)
Other versions
CN107391582B (zh
Inventor
肖亮
郭飞鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN201710477707.5A priority Critical patent/CN107391582B/zh
Publication of CN107391582A publication Critical patent/CN107391582A/zh
Application granted granted Critical
Publication of CN107391582B publication Critical patent/CN107391582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

基于上下文本体树计算用户偏好相似度的信息推荐方法。该方法分析各种上下文类型及其具体实例对用户偏好的差异化影响,设计一种基于上下文的用户偏好提取方法;然后,利用本体对上下文进行语义表达,并构建基于本体树表达的上下文相似度计算方法,提升协同过滤推荐中寻找相似用户集的精确性;在上述用户偏好提取的基础上,将提取出的上下文引入到协同过滤推荐过程,计算上下文用户偏好之间的相似度,并设计一种基于用户上下文偏好分析的协同过滤推荐方法,解决了已有推荐方法的稀疏性、冷启动等问题。

Description

基于上下文本体树计算用户偏好相似度的信息推荐方法
技术领域
本发明涉及智慧商务中个性化推荐领域,具体涉及基于上下文本体树计算用户偏好相似度的信息推荐方法。特别是适用于智慧商场网上交易中用户商品评分数据稀疏,且受到复杂上下文影响的群体用户的商品推荐。通过融入上下文偏好信息的推荐技术可以准确高效地提供既符合用户内外上下文,又满足用户偏好的个性化服务。
技术背景
移动通信网络、智能信息处理等技术的发展满足了用户对互联网商品或者服务的多样化需求,使得用户可以通过移动智能终端及时获取偏好信息。然而,“爆炸”式商务大数据却使用户“迷失”在“信息洪流”中。同时,随着个性化推荐系统的不断发展以及在智慧商业领域的广泛应用,智能推荐技术应运而生,并能解决“信息泛滥”带来的系列问题,从而为用户提供了高质量的个性化服务。但是,现有信息推荐过程的技术中缺乏对上下文、用户认知和偏好间关联性进行挖掘与相关作用机制分析,而且基本都只考虑单一上下文类型,未能很好地考虑不同上下文类型对用户需求的分布式和差异化影响,导致存在推荐精确度低或者推荐覆盖率低等问题,在实际应用中很难泛化。因此,需要探索高效的个性化推荐技术来解决上述问题,实现自适应的“上下文”式个性化推荐服务的目标。
目前大多数推荐方法是指根据已有的用户—物品交互历史,利用众人或众物品的集合智慧进行推荐,因其有效性而在推荐系统中被广泛的应用。但随着用户和项目数的不断增大,以及智慧商务环境的复杂、动态特征,需要对复杂高维上下文进行定义与表达、对融入上下文的推荐方法进行改进,且引入上下文给推荐数据集带来了更加严重的数据稀疏性、冷启动等问题。因此,从用户上下文强度和偏好评分中学习主题,可以更好地匹配用户的偏好行为,且对上下文的深入挖掘可以有效地缓解协同过滤数据稀疏性问题;同时在进行个性化推荐时将用户偏好影响因素和上下文信息关联起来统一考虑,更能反映现实场景,贴合用户的真实行为,缓解协同过滤方法的冷启动问题,提高推荐的质量。
发明内容
为了克服目前已有方法在个性化推荐过程中用户评分技术过于片面,很少分析不同类型上下文中用户偏好差异的原因,且存在多维上下文语义表达不足、稀疏性、冷启动等问题,本发明提供一种综合上下文和评分信息的基于上下文本体树计算用户偏好相似度的信息推荐方法。
本发明解决其技术问题所采用的技术方案是:
基于上下文本体树计算用户偏好相似度的信息推荐方法,包括以下步骤:
步骤1,基于上下文的用户偏好提取;
输入:网络用户ui,商品sj,上下文集合Ck
输出:基于上下文的用户偏好
步骤11:计算某单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据,其中dij为含有上下文的用户历史行为上下文的数目。
步骤12:计算某种上下文类型Ccontext的影响程度εijk,用于度量上下文对用户行为Q的差异化认知,N为用户行为记录数。
步骤13:计算单维度上下文用户偏好。以单维度用户历史行为上下文为数据源,通过K-Means算法计算单维度上下文用户偏好其取值区间为[a,b]。
步骤14:在某一上下文类型Ck影响下用户ui对商品sj的偏好的影响程度作用下,基于某一类上下文影响下的用户偏好来计算ui在组合上下文实例影响下对sj的偏好。
步骤2,为了提升协同过滤推荐中寻找相似用户集的精确性,本发明将用户相似度计算转变为上下文相似度计算。同时,采用本体树数据结构进行多种上下文概念之间关系的计算,并根据此将上下文相似用户进行聚类。基于本体表达的上下文相似度计算方法具体构建过程如下:
输入:上下文本体树CT1和CT2
输出:用户上下文相似度CTSim(G,G′);
步骤21:初始化CTSim(G,G′)=0;
假设当前上下文本体树CT1中某一个非叶子结点G,G={G1,G2,…GN}代表G的N个子节点,先前上下文本体树CT2中某一个非叶子结点G′,G′={G1′,G2′…GN′}代表G′的N个子节点,计算G与G′的相似度如下:
其中,∑wi=1,wi为第i个子结点的权重;
步骤22:判断CT1中的上下文概念Gi是否存在,如果存在则跳转到步骤3,否则结束;
步骤23:判断CT2中是否存在与Gi对应的Gi′,如果存在则跳转到步骤4,否则跳回步骤2;
步骤24:利用公式CTSim(G,G′)+=wi×Sim(G,G′)递归计算两棵上下文本体树中非叶子结点的全部Gi与Gi′的相似度,获取综合相似度。
采用基于Levenstein编辑距离的字符串相似度计算公式计算上下文概念Gi与Gi′之间的相似度;
其中,ed(Gi,Gi')为Gi与Gi′之间的Levenstein编辑距离;
通过在推荐过程前用上下文过滤能够提高每类中“用户—上下文”关联关系,从而提升推荐性能。利用上下文信息对“用户—项目”评分进行聚类,目的是将具有相似上下文的“用户—项目”聚在一类,以达到降低数据噪音的目的。
步骤3,基于用户上下文偏好分析的协同过滤推荐方法具体构造过程如下:
输入:上下文集合C、网络用户u、服务推荐集合Service(R)S,“用户—项目”评分矩阵,“项目—上下文”关联矩阵。
输出:TOP-N个推荐服务及评分。
步骤31:根据基于上下文的用户偏好提取方法提取用户上下文行为和用户评分数据集,并得到用户u的所有偏好数据构造“上下文——项目”矩阵。
步骤32:调用上下文相似度计算方法计算(C)ij中上下文之间的相似度。
步骤33:构建新的“用户—上下文——项目”三维矩阵,提出一个改进的基于上下文相似度的用户相似度计算方法:
其中表示用户ui对全部相关上下文(即通过项目关联起来的上下文,而非全部上下文)的平均偏好。基于相似度sim(ui,uj)context-pearson可以为用户ui选择k个最近邻。
步骤34:寻找上下文ci影响下的目标用户ui的最近邻集合。由于用户偏好与上下文密切相关,因此,本发明首先根据步骤2获取上下文ci和cj之间的相似度。然后,分别寻找在上下文ci和cj影响下ui各自的最近邻居集。最后,将上下文cj下的最近邻居用户合并到上下文ci下的最近邻居集合中。
用Nj={Nj,c1,Nj,c2,…,Nj,ck},1≤j≤Num(U)表示该最近邻居集合;其中c1,c2,…,ck为k个上下文,Num(U)为用户总数,表示用户j在第ci个上下文影响下的相似用户集合;
步骤35:利用步骤4获取的k个最近邻居的用户偏好,通过以下公式为预测潜在用户评分
与本发明基于上下文本体树计算用户偏好相似度的信息推荐方法相关的定义如下:
定义1用户u及用户集U={u1,u2,…,uN}。指的是互联网中具有唯一ID用户及用户群体,每个用户向量包含年龄、性别等基础信息,且可以通过移动智能终端和互联网进行网络活动。
定义2用户上下文UserContext=(UPC,UEC,UDC),上下文UPC表示为用户基础信息:UPC=(Backgroud,Relation);Backgroud表示用户年龄、性别等,Relation表示用户交互关系、亲密关系等;上下文UEC表示为用户的设备信息:UEC=(Hardware,Software);表示硬件设备、软件产品、宽带(Wide-band)等;上下文UDC表示用户环境信息:UDC=(DayTime,Location);DayTime表示用户所处的时间(上午、下午、晚上等),Location表示地理位置(Location)。上下文因素集定义为:C=C1,C2,…Ck,…CL
定义3用户历史行为上下文信息集,定义为
表示在上下文信息下用户历史行为信息集合,其中为多维度用户上下文实例,其屮为单个或者多个非负实数表示的行为变量。
定义4上下文实例:定义上下文Ck的实例用如下表示,ckj为Ck的第j个上下文取值,Ck上下文实例个数最多是lk个。
Ck={ckj|k∈[1,l],j∈[1,lk]} (10)
定义5上下文关联度。为准确反映上下文Ccontext(这里Ccontext即为)对客户偏好Q的贡献率,对上下文关联度进行定义:
上下文关联度表示上下文与行为之间的相关程度。如果Ccontext的存在并没有影响Q,则该值等于1;如果Ccontext的存在对Q有诱导作用,则该值大于1,而且相关程度越高,该值越大。p(Q|Ccontext)表示客户在Ccontext上下文作用下产生偏好Q的概率,N表示上下文类型的数量。
定义6上下文本体模型:分析各个上下文及实例,可以发现各个上下文之间具有树形关系(包括上下级父子关系、同级兄弟关系等)。数值化表达如下式表示:
CS=C1×C2×…×Ck×…×CL (12)
CS中的上下文实例通过Ck的笛卡尔积来表示,而Ck定义和具体实例由定义4得出。
定义7用户偏好集UI,设代表某一实数,值决定偏好的高低,偏好集定义如下:
表示为不同上下文影响下的用户对推荐商品的偏好集合,用户组合上下文实例用表示。
本发明的技术构思为:传统推荐方法未能很好地考虑不同上下文类型对用户需求的差异化影响,以及上下文化推荐服务自适应性差等不足,本发明提出了基于上下文本体树计算用户偏好相似度的信息推荐方法。该方法分析各种上下文类型及其具体实例对用户偏好的差异化影响,设计一种基于上下文的用户偏好提取方法;然后,利用本体对上下文进行语义表达,并构建基于本体树表达的上下文相似度计算方法,提升协同过滤推荐中寻找相似用户集的精确性;在上述用户偏好提取的基础上,将提取出的上下文引入到协同过滤推荐过程,计算上下文用户偏好之间的相似度,并设计一种基于用户上下文偏好分析的协同过滤推荐方法,解决了已有推荐方法的稀疏性、冷启动等问题。
本发明的有益效果在于:有效提升在复杂上下文中的个性化推荐质量,并且一定程度上解决了常见推荐系统中的稀疏性、冷启动问题,实现了融入上下文语义知识的偏好提取与高质量的推荐内容,在智慧商业、智能推荐领域具有良好的实际应用价值。
附图说明
图1是本发明方法的流程图。
图2是本发明方法中部分上下文要素维度及其各子类要素构成的层次关系图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,基于上下文本体树计算用户偏好相似度的信息推荐方法,包括以下步骤:
步骤1,基于上下文的用户偏好提取;
输入:网络用户ui,商品sj,上下文集合Ck
输出:基于上下文的用户偏好
步骤11:计算某单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据,其中dij为含有上下文的用户历史行为上下文的数目。如用户出于某种目的在某个时刻购买的商品信息(Product)、购买时间(BTime)、购买的意图(Intention)等组成的行为向量UHBC={Product,BTime,Intention},为多维度上下文组合。
步骤12:计算某种上下文类型Ccontext的影响程度εijk,用于度量上下文对用户行为Q的差异化认知,N为用户行为记录数。
步骤13:计算单维度上下文用户偏好。以单维度用户历史行为上下文为数据源,通过K-Means算法计算单维度上下文用户偏好其取值区间为[a,b]。
步骤14:在某一上下文类型Ck影响下用户ui对商品sj的偏好的影响程度作用下,基于某一类上下文影响下的用户偏好来计算ui在组合上下文实例影响下对sj的偏好。
步骤2,基于本体表达的上下文相似度计算;上下文相似度算法利用上下文本体模型的树形结构从子节点到父节点再到根节点进行递归相似度运算,循环计算每层节点之间的概念属性相似度,最后对先前上下文层次模型与当前上下文层次模型的综合相似度进行对比。
输入:上下文本体树CT1和CT2
输出:用户上下文相似度CTSim(G,G′);
步骤21:初始化CTSim(G,G′)=0;
假设当前上下文本体树CT1中某一个非叶子结点G,G={G1,G2,…GN}代表G的N个子节点,先前上下文本体树CT2中某一个非叶子结点G′,G′={G1′,G2′…GN′}代表G′的N个子节点,计算G与G′的相似度如下:
其中,∑wi=1,wi为第i个子结点的权重。
步骤22:判断CT1中的上下文概念Gi是否存在,如果存在则跳转到步骤3,否则结束;
步骤23:判断CT2中是否存在与Gi对应的Gi′,如果存在则跳转到步骤4,否则跳回步骤2;
步骤24:利用公式CTSim(G,G′)+=wi×Sim(G,G′)递归计算两棵上下文本体树中非叶子结点的全部Gi与Gi′的相似度,获取综合相似度。
本发明采用基于Levenstein编辑距离的字符串相似度计算公式计算上下文概念Gi与Gi'之间的相似度。
其中,ed(Gi,Gi')为Gi与Gi'之间的Levenstein编辑距离。
通过在推荐过程前用上下文过滤能够提高每类中“用户—上下文”关联关系,从而提升推荐性能。利用上下文信息对“用户—项目”评分进行聚类,目的是将具有相似上下文的“用户—项目”聚在一类,以达到降低数据噪音的目的。
将上下文信息采用本体概念树的形式来描述,对上下文进行形式化定义与知识表达,在此基础上,构建基于本体的用户上下文层次结构模型。个性化推荐过程中影响用户网络行为的某一上下文因素集合Ck={基础,天气,位置,时间},假设基础,天气,时间,位置4个上下文每个因素具体实例个人均为3,且C1={男,晴天,家里,晚上}和C2={女,下雨,单位,上午}被视为两组不同的上下文信息,由此可得出该上下文模型含有81组不同的上下文信息。
步骤3,基于用户上下文偏好分析的协同过滤;
输入:上下文集合C、网络用户u、服务推荐集合Service(R)S,“用户—项目”评分矩阵,“项目—上下文”关联矩阵。
输出:TOP-N个推荐服务及评分。
步骤31:根据基于上下文的用户偏好提取方法提取用户上下文行为和用户评分数据集,并得到用户u的所有偏好数据构造“上下文——项目”矩阵。
步骤32:调用上下文相似度计算方法计算(C)ij中上下文之间的相似度。
步骤33:构建新的“用户—上下文——项目”三维矩阵,提出一个改进的基于上下文相似度的用户相似度计算方法:
其中表示用户ui对全部相关上下文(即通过项目关联起来的上下文,而非全部上下文)的平均偏好。基于相似度sim(ui,uj)context-pearson可以为用户ui选择k个最近邻。
步骤34:寻找上下文ci影响下的目标用户ui的最近邻集合。由于用户偏好与上下文密切相关,因此,本发明首先根据步骤2获取上下文ci和cj之间的相似度。然后,分别寻找在上下文ci和cj影响下ui各自的最近邻居集。最后,将上下文cj下的最近邻居用户合并到上下文ci下的最近邻居集合中。
用Nj={Nj,c1,Nj,c2,…,Nj,ck},1≤j≤Num(U)表示该最近邻居集合;其中c1,c2,…,ck为k个上下文,Num(U)为用户总数,表示用户j在第ci个上下文影响下的相似用户集合;
步骤35:利用步骤4获取的k个最近邻居的用户偏好,通过以下公式4-8为预测潜在用户评分

Claims (1)

1.基于上下文本体树计算用户偏好相似度的信息推荐方法,包括以下步骤:
步骤1,基于上下文的用户偏好提取;
输入:网络用户ui,商品sj,上下文集合Ck
输出:基于上下文的用户偏好
步骤11:计算单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据,其中dij为含有上下文的用户历史行为上下文的数目;用户出于某种目的在某个时刻购买的商品信息(Product)、购买时间(BTime)、购买的意图(Intention)组成的行为向量UHBC={Product,BTime,Intention},为多维度上下文组合;
<mrow> <msub> <mi>uhbc</mi> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>r</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </munderover> <msub> <mi>uhbc</mi> <mrow> <mi>i</mi> <mi>j</mi> <mover> <mi>r</mi> <mo>&amp;OverBar;</mo> </mover> </mrow> </msub> <mo>|</mo> <msub> <mi>C</mi> <mover> <mi>r</mi> <mo>&amp;OverBar;</mo> </mover> </msub> <mo>=</mo> <msub> <mi>c</mi> <mn>1</mn> </msub> <mo>...</mo> <msub> <mi>c</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mi>c</mi> <msub> <mi>k</mi> <mi>q</mi> </msub> </msub> <msub> <mi>c</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>...</mo> <msub> <mi>c</mi> <mi>N</mi> </msub> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
步骤12:计算某种上下文类型Ccontext的影响程度εijk,用于度量上下文对用户行为Q的差异化认知,N为用户行为记录数;
<mrow> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <munder> <mo>&amp;DoubleRightArrow;</mo> <mi>N</mi> </munder> <mi>Q</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <msub> <mi>C</mi> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <mover> <msub> <mi>C</mi> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <msqrt> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <mover> <mi>C</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <mover> <mi>C</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> <mi>N</mi> </mfrac> </msqrt> </mfrac> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
步骤13:计算单维度上下文用户偏好;以单维度用户历史行为上下文为数据源,通过K-Means算法计算单维度上下文用户偏好其取值区间为[a,b];
<mrow> <msub> <mrow> <mo>(</mo> <msub> <mi>ui</mi> <mi>c</mi> </msub> <mo>)</mo> </mrow> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>=</mo> <msub> <mi>f</mi> <mrow> <mi>K</mi> <mi>M</mi> <mi>e</mi> <mi>a</mi> <mi>n</mi> <mi>s</mi> </mrow> </msub> <mrow> <mo>(</mo> <munder> <munder> <munder> <mrow> <msub> <mi>uhbc</mi> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> </mrow> <mrow> <mn>1</mn> <mo>&amp;le;</mo> <mi>j</mi> <mo>&amp;le;</mo> <mi>M</mi> </mrow> </munder> <mrow> <mn>1</mn> <mo>&amp;le;</mo> <mi>k</mi> <mo>&amp;le;</mo> <msup> <mi>N</mi> <mo>&amp;prime;</mo> </msup> </mrow> </munder> <mrow> <mn>1</mn> <mo>&amp;le;</mo> <mi>q</mi> <mo>&amp;le;</mo> <msub> <mi>Z</mi> <mi>k</mi> </msub> </mrow> </munder> <mo>)</mo> </mrow> <mo>|</mo> <msub> <mi>uhbc</mi> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
步骤14:在某一上下文类型Ck影响下用户ui对商品sj的偏好的影响程度作用下,基于某一类上下文影响下的用户偏好来计算ui在组合上下文实例影响下对sj的偏好;
<mrow> <msub> <mrow> <mo>(</mo> <msub> <mi>UI</mi> <mi>C</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> <mover> <msup> <mi>t</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;OverBar;</mo> </mover> </mrow> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <msup> <mi>N</mi> <mo>&amp;prime;</mo> </msup> </munderover> <mrow> <mo>(</mo> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>i</mi> <mi>j</mi> <mi>k</mi> </mrow> </msub> <mo>&amp;times;</mo> <msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>ui</mi> <mi>c</mi> </msub> </mrow> <mo>)</mo> </mrow> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>)</mo> </mrow> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
步骤2,基于本体表达的上下文相似度计算;上下文相似度算法利用上下文本体模型的树形结构从子节点到父节点再到根节点进行递归相似度运算,循环计算每层节点之间的概念属性相似度,最后对先前上下文层次模型与当前上下文层次模型的综合相似度进行对比;
输入:上下文本体树CT1和CT2
输出:用户上下文相似度CTSim(G,G′);
步骤21:初始化CTSim(G,G′)=0;
假设当前上下文本体树CT1中某一个非叶子结点G,G={G1,G2,…GN}代表G的N个子节点,先前上下文本体树CT2中某一个非叶子结点G′,G′={G′1,G′2…G′N}代表G′的N个子节点,计算G与G′的相似度如下:
<mrow> <mi>C</mi> <mi>T</mi> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>G</mi> <mo>,</mo> <msup> <mi>G</mi> <mo>&amp;prime;</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </msubsup> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>&amp;times;</mo> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>G</mi> <mo>,</mo> <msup> <mi>G</mi> <mo>&amp;prime;</mo> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
其中,∑wi=1,wi为第i个子结点的权重;
步骤22:判断CT1中的上下文概念Gi是否存在,如果存在则跳转到步骤3,否则结束;
步骤23:判断CT2中是否存在与Gi对应的Gi′,如果存在则跳转到步骤4,否则跳回步骤2;
步骤24:利用公式CTSim(G,G′)+=wi×Sim(G,G′)递归计算两棵上下文本体树中非叶子结点的全部Gi与Gi′的相似度,获取综合相似度;
采用基于Levenstein编辑距离的字符串相似度计算公式计算上下文概念Gi与Gi′之间的相似度;
<mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>G</mi> <mo>,</mo> <msup> <mi>G</mi> <mo>&amp;prime;</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mo>(</mo> <mn>0</mn> <mo>,</mo> <mfrac> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mo>|</mo> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>|</mo> <mo>,</mo> <mo>|</mo> <msup> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> </msup> <mo>|</mo> <mo>-</mo> <mi>e</mi> <mi>d</mi> <mo>(</mo> <mrow> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> <msup> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> </msup> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mo>|</mo> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>|</mo> <mo>,</mo> <mo>|</mo> <msup> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> </msup> <mo>|</mo> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>
其中,ed(Gi,Gi')为Gi与Gi′之间的Levenstein编辑距离;
通过在推荐过程前用上下文过滤能够提高每类中“用户—上下文”关联关系,从而提升推荐性能;利用上下文信息对“用户—项目”评分进行聚类,目的是将具有相似上下文的“用户—项目”聚在一类,以达到降低数据噪音的目的;
将上下文信息采用本体概念树的形式来描述,对上下文进行形式化定义与知识表达,在此基础上,构建基于本体的用户上下文层次结构模型;个性化推荐过程中影响用户网络行为的某一上下文因素集合Ck={基础,天气,位置,时间},假设基础,天气,时间,位置4个上下文每个因素具体实例个人均为3,且C1={男,晴天,家里,晚上}和C2={女,下雨,单位,上午}被视为两组不同的上下文信息,由此可得出该上下文模型含有81组不同的上下文信息;
步骤3,基于用户上下文偏好分析的协同过滤推荐;
输入:上下文集合C、网络用户u、服务推荐集合Service(R)S,“用户—项目”评分矩阵,“项目—上下文”关联矩阵;
输出:TOP-N个推荐服务及评分;
步骤31:根据基于上下文的用户偏好提取方法提取用户上下文行为和用户评分数据集,并得到用户u的所有偏好数据构造“上下文——项目”矩阵;
步骤32:调用上下文相似度计算方法计算(C)ij中上下文之间的相似度;
步骤33:构建新的“用户—上下文——项目”三维矩阵,提出一个改进的基于上下文相似度的用户相似度计算方法:
<mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>p</mi> <mi>e</mi> <mi>a</mi> <mi>r</mi> <mi>s</mi> <mi>o</mi> <mi>n</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;Element;</mo> <msup> <mi>S</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </msubsup> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>j</mi> </msub> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </msubsup> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <msqrt> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;Element;</mo> <msup> <mi>S</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <msup> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>r</mi> <mo>&amp;OverBar;</mo> </mover> <msub> <mi>u</mi> <mi>i</mi> </msub> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <msub> <mi>&amp;Sigma;</mi> <mrow> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;Element;</mo> <msup> <mi>S</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <msup> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>r</mi> <mo>&amp;OverBar;</mo> </mover> <msub> <mi>u</mi> <mi>j</mi> </msub> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>
其中表示用户ui对全部相关上下文(即通过项目关联起来的上下文,而非全部上下文)的平均偏好;基于相似度sim(ui,uj)context-pearson可以为用户ui选择k个最近邻;
步骤34:寻找上下文ci影响下的目标用户ui的最近邻集合;由于用户偏好与上下文密切相关,因此,本发明首先根据步骤2获取上下文ci和cj之间的相似度;然后,分别寻找在上下文ci和cj影响下ui各自的最近邻居集;最后,将上下文cj下的最近邻居用户合并到上下文ci下的最近邻居集合中;
用Nj={Nj,c1,Nj,c2,…,Nj,ck},1≤j≤Num(U)表示该最近邻居集合;其中c1,c2,…,ck为k个上下文,Num(U)为用户总数,表示用户j在第ci个上下文影响下的相似用户集合;
步骤35:利用步骤4获取的k个最近邻居的用户偏好,通过以下公式4-8为预测潜在用户评分
<mrow> <msubsup> <mi>r</mi> <mrow> <mi>u</mi> <mo>,</mo> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>C</mi> <mi>F</mi> </mrow> </msubsup> <mo>=</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </msubsup> <mo>&amp;OverBar;</mo> </mover> <mo>+</mo> <mfrac> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>&amp;Element;</mo> <mi>U</mi> </mrow> </msub> <mi>s</mi> <mi>i</mi> <mi>m</mi> <msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>p</mi> <mi>e</mi> <mi>a</mi> <mi>r</mi> <mi>s</mi> <mi>o</mi> <mi>n</mi> </mrow> </msub> <mo>&amp;times;</mo> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>j</mi> </msub> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </msubsup> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>&amp;Element;</mo> <mi>U</mi> </mrow> </msub> <mo>|</mo> <mi>s</mi> <mi>i</mi> <mi>m</mi> <msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>p</mi> <mi>e</mi> <mi>a</mi> <mi>r</mi> <mi>s</mi> <mi>o</mi> <mi>n</mi> </mrow> </msub> <mo>|</mo> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> <mo>.</mo> </mrow> 3
CN201710477707.5A 2017-06-21 2017-06-21 基于上下文本体树计算用户偏好相似度的信息推荐方法 Active CN107391582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710477707.5A CN107391582B (zh) 2017-06-21 2017-06-21 基于上下文本体树计算用户偏好相似度的信息推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710477707.5A CN107391582B (zh) 2017-06-21 2017-06-21 基于上下文本体树计算用户偏好相似度的信息推荐方法

Publications (2)

Publication Number Publication Date
CN107391582A true CN107391582A (zh) 2017-11-24
CN107391582B CN107391582B (zh) 2019-07-16

Family

ID=60332503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710477707.5A Active CN107391582B (zh) 2017-06-21 2017-06-21 基于上下文本体树计算用户偏好相似度的信息推荐方法

Country Status (1)

Country Link
CN (1) CN107391582B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107742248A (zh) * 2017-11-29 2018-02-27 贵州省气象信息中心 一种商品推荐方法及系统
CN108647227A (zh) * 2018-03-26 2018-10-12 北京奇艺世纪科技有限公司 一种推荐方法及装置
CN110704741A (zh) * 2019-09-30 2020-01-17 杭州电子科技大学 基于时空点过程的兴趣点预测方法
CN111222054A (zh) * 2020-01-03 2020-06-02 中国计量大学 一种基于上下文邻居关系建模的会话社交推荐方法
CN111931069A (zh) * 2020-09-25 2020-11-13 浙江口碑网络技术有限公司 用户兴趣确定方法、装置及计算机设备
CN112184303A (zh) * 2020-09-25 2021-01-05 中国建设银行股份有限公司 基于聚类算法的目标信息推送方法、装置及存储介质
CN113449210A (zh) * 2021-07-01 2021-09-28 深圳市数字尾巴科技有限公司 基于时空特征的个性化推荐方法、装置、电子设备及存储介质
CN113868545A (zh) * 2021-11-30 2021-12-31 武汉卓尔数字传媒科技有限公司 一种项目推荐方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100720762B1 (ko) * 2007-01-30 2007-05-23 (주) 프람트 사용자의 상황 정보를 이용한 유사도 계산 및 콘텐츠의검색 방법
CN102208086A (zh) * 2010-03-31 2011-10-05 北京邮电大学 面向领域的个性化智能推荐系统及实现方法
CN105718471A (zh) * 2014-12-03 2016-06-29 中国科学院声学研究所 用户偏好建模方法、系统及用户偏好评估方法、系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100720762B1 (ko) * 2007-01-30 2007-05-23 (주) 프람트 사용자의 상황 정보를 이용한 유사도 계산 및 콘텐츠의검색 방법
CN102208086A (zh) * 2010-03-31 2011-10-05 北京邮电大学 面向领域的个性化智能推荐系统及实现方法
CN105718471A (zh) * 2014-12-03 2016-06-29 中国科学院声学研究所 用户偏好建模方法、系统及用户偏好评估方法、系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李武智等: "基于服务上下文的Web服务发现机制", 《计算机工程与设计》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107742248A (zh) * 2017-11-29 2018-02-27 贵州省气象信息中心 一种商品推荐方法及系统
CN108647227A (zh) * 2018-03-26 2018-10-12 北京奇艺世纪科技有限公司 一种推荐方法及装置
CN110704741A (zh) * 2019-09-30 2020-01-17 杭州电子科技大学 基于时空点过程的兴趣点预测方法
CN110704741B (zh) * 2019-09-30 2021-10-15 杭州电子科技大学 基于时空点过程的兴趣点预测方法
CN111222054A (zh) * 2020-01-03 2020-06-02 中国计量大学 一种基于上下文邻居关系建模的会话社交推荐方法
CN111931069A (zh) * 2020-09-25 2020-11-13 浙江口碑网络技术有限公司 用户兴趣确定方法、装置及计算机设备
CN112184303A (zh) * 2020-09-25 2021-01-05 中国建设银行股份有限公司 基于聚类算法的目标信息推送方法、装置及存储介质
CN113449210A (zh) * 2021-07-01 2021-09-28 深圳市数字尾巴科技有限公司 基于时空特征的个性化推荐方法、装置、电子设备及存储介质
CN113449210B (zh) * 2021-07-01 2023-01-31 深圳市数字尾巴科技有限公司 基于时空特征的个性化推荐方法、装置、电子设备及存储介质
CN113868545A (zh) * 2021-11-30 2021-12-31 武汉卓尔数字传媒科技有限公司 一种项目推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN107391582B (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN107391582B (zh) 基于上下文本体树计算用户偏好相似度的信息推荐方法
CN111177575B (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN103714139B (zh) 一种移动海量客户群识别的并行数据挖掘方法
CN111428147A (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN105320719B (zh) 一种基于项目标签和图形关系的众筹网站项目推荐方法
Farajian et al. Mining the banking customer behavior using clustering and association rules methods
CN109034960B (zh) 一种基于用户节点嵌入的多属性推断的方法
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN104166668A (zh) 基于folfm模型的新闻推荐系统及方法
CN110110225B (zh) 基于用户行为数据分析的在线教育推荐模型及构建方法
CN111723292B (zh) 基于图神经网络的推荐方法、系统、电子设备及存储介质
CN108665323A (zh) 一种用于理财产品推荐系统的集成方法
CN104462383A (zh) 一种基于用户多种行为反馈的电影推荐方法
CN108615177B (zh) 基于加权提取兴趣度的电子终端个性化推荐方法
CN107633444A (zh) 基于信息熵与模糊c均值聚类的推荐系统噪声过滤方法
CN106528812B (zh) 一种基于usdr模型的云推荐方法
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN107545471A (zh) 一种基于高斯混合的大数据智能推荐方法
CN112700274A (zh) 一种基于用户偏好的广告点击率预估方法
CN109284443A (zh) 一种基于爬虫技术的旅游推荐方法及系统
CN115099450A (zh) 基于融合模型的家庭碳排放监测核算平台
CN114840745A (zh) 一种基于图表征学习和深度语义匹配模型的个性化推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant