CN107391582A

CN107391582A - 基于上下文本体树计算用户偏好相似度的信息推荐方法

Info

Publication number: CN107391582A
Application number: CN201710477707.5A
Authority: CN
Inventors: 肖亮; 郭飞鹏
Original assignee: Zhejiang Gongshang University
Current assignee: Zhejiang Gongshang University
Priority date: 2017-06-21
Filing date: 2017-06-21
Publication date: 2017-11-24
Anticipated expiration: 2037-06-21
Also published as: CN107391582B

Abstract

基于上下文本体树计算用户偏好相似度的信息推荐方法。该方法分析各种上下文类型及其具体实例对用户偏好的差异化影响，设计一种基于上下文的用户偏好提取方法；然后，利用本体对上下文进行语义表达，并构建基于本体树表达的上下文相似度计算方法，提升协同过滤推荐中寻找相似用户集的精确性；在上述用户偏好提取的基础上，将提取出的上下文引入到协同过滤推荐过程，计算上下文用户偏好之间的相似度，并设计一种基于用户上下文偏好分析的协同过滤推荐方法，解决了已有推荐方法的稀疏性、冷启动等问题。

Description

基于上下文本体树计算用户偏好相似度的信息推荐方法

技术领域

本发明涉及智慧商务中个性化推荐领域，具体涉及基于上下文本体树计算用户偏好相似度的信息推荐方法。特别是适用于智慧商场网上交易中用户商品评分数据稀疏，且受到复杂上下文影响的群体用户的商品推荐。通过融入上下文偏好信息的推荐技术可以准确高效地提供既符合用户内外上下文，又满足用户偏好的个性化服务。

技术背景

移动通信网络、智能信息处理等技术的发展满足了用户对互联网商品或者服务的多样化需求，使得用户可以通过移动智能终端及时获取偏好信息。然而，“爆炸”式商务大数据却使用户“迷失”在“信息洪流”中。同时，随着个性化推荐系统的不断发展以及在智慧商业领域的广泛应用，智能推荐技术应运而生，并能解决“信息泛滥”带来的系列问题，从而为用户提供了高质量的个性化服务。但是，现有信息推荐过程的技术中缺乏对上下文、用户认知和偏好间关联性进行挖掘与相关作用机制分析，而且基本都只考虑单一上下文类型，未能很好地考虑不同上下文类型对用户需求的分布式和差异化影响，导致存在推荐精确度低或者推荐覆盖率低等问题，在实际应用中很难泛化。因此，需要探索高效的个性化推荐技术来解决上述问题，实现自适应的“上下文”式个性化推荐服务的目标。

目前大多数推荐方法是指根据已有的用户—物品交互历史，利用众人或众物品的集合智慧进行推荐，因其有效性而在推荐系统中被广泛的应用。但随着用户和项目数的不断增大，以及智慧商务环境的复杂、动态特征，需要对复杂高维上下文进行定义与表达、对融入上下文的推荐方法进行改进，且引入上下文给推荐数据集带来了更加严重的数据稀疏性、冷启动等问题。因此，从用户上下文强度和偏好评分中学习主题，可以更好地匹配用户的偏好行为，且对上下文的深入挖掘可以有效地缓解协同过滤数据稀疏性问题；同时在进行个性化推荐时将用户偏好影响因素和上下文信息关联起来统一考虑，更能反映现实场景，贴合用户的真实行为，缓解协同过滤方法的冷启动问题，提高推荐的质量。

发明内容

为了克服目前已有方法在个性化推荐过程中用户评分技术过于片面，很少分析不同类型上下文中用户偏好差异的原因，且存在多维上下文语义表达不足、稀疏性、冷启动等问题，本发明提供一种综合上下文和评分信息的基于上下文本体树计算用户偏好相似度的信息推荐方法。

本发明解决其技术问题所采用的技术方案是：

基于上下文本体树计算用户偏好相似度的信息推荐方法，包括以下步骤：

步骤1，基于上下文的用户偏好提取；

输入：网络用户u_i，商品s_j，上下文集合C_k

输出：基于上下文的用户偏好

步骤11：计算某单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据，其中d_ij为含有上下文的用户历史行为上下文的数目。

步骤12：计算某种上下文类型C_context的影响程度ε_ijk，用于度量上下文对用户行为Q的差异化认知，N为用户行为记录数。

步骤13：计算单维度上下文用户偏好。以单维度用户历史行为上下文为数据源，通过K-Means算法计算单维度上下文用户偏好其取值区间为[a,b]。

步骤14：在某一上下文类型C_k影响下用户u_i对商品s_j的偏好的影响程度作用下，基于某一类上下文影响下的用户偏好来计算u_i在组合上下文实例影响下对s_j的偏好。

步骤2，为了提升协同过滤推荐中寻找相似用户集的精确性，本发明将用户相似度计算转变为上下文相似度计算。同时，采用本体树数据结构进行多种上下文概念之间关系的计算，并根据此将上下文相似用户进行聚类。基于本体表达的上下文相似度计算方法具体构建过程如下：

输入：上下文本体树CT₁和CT₂；

输出：用户上下文相似度CTSim(G,G′)；

步骤21：初始化CTSim(G,G′)＝0；

假设当前上下文本体树CT₁中某一个非叶子结点G，G＝{G₁,G₂,…G_N}代表G的N个子节点，先前上下文本体树CT₂中某一个非叶子结点G′，G′＝{G₁′,G₂′…G_N′}代表G′的N个子节点，计算G与G′的相似度如下：

其中，∑w_i＝1，w_i为第i个子结点的权重；

步骤22：判断CT₁中的上下文概念G_i是否存在，如果存在则跳转到步骤3，否则结束；

步骤23：判断CT₂中是否存在与G_i对应的G_i′，如果存在则跳转到步骤4，否则跳回步骤2；

步骤24：利用公式CTSim(G,G′)+＝w_i×Sim(G,G′)递归计算两棵上下文本体树中非叶子结点的全部G_i与G_i′的相似度，获取综合相似度。

采用基于Levenstein编辑距离的字符串相似度计算公式计算上下文概念G_i与G_i′之间的相似度；

其中，ed(G_i,G_i')为G_i与G_i′之间的Levenstein编辑距离；

通过在推荐过程前用上下文过滤能够提高每类中“用户—上下文”关联关系，从而提升推荐性能。利用上下文信息对“用户—项目”评分进行聚类，目的是将具有相似上下文的“用户—项目”聚在一类，以达到降低数据噪音的目的。

步骤3，基于用户上下文偏好分析的协同过滤推荐方法具体构造过程如下：

输入：上下文集合C、网络用户u、服务推荐集合Service(R)S，“用户—项目”评分矩阵，“项目—上下文”关联矩阵。

输出：TOP-N个推荐服务及评分。

步骤31：根据基于上下文的用户偏好提取方法提取用户上下文行为和用户评分数据集，并得到用户u的所有偏好数据构造“上下文——项目”矩阵。

步骤32：调用上下文相似度计算方法计算(C)_ij中上下文之间的相似度。

步骤33：构建新的“用户—上下文——项目”三维矩阵，提出一个改进的基于上下文相似度的用户相似度计算方法：

其中表示用户u_i对全部相关上下文(即通过项目关联起来的上下文，而非全部上下文)的平均偏好。基于相似度sim(u_i,u_j)_{context-pearson}可以为用户u_i选择k个最近邻。

步骤34：寻找上下文c_i影响下的目标用户u_i的最近邻集合。由于用户偏好与上下文密切相关，因此，本发明首先根据步骤2获取上下文c_i和c_j之间的相似度。然后，分别寻找在上下文c_i和c_j影响下u_i各自的最近邻居集。最后，将上下文c_j下的最近邻居用户合并到上下文c_i下的最近邻居集合中。

用N_j＝{N_j,c₁,N_j,c₂,…,N_j,c_k},1≤j≤Num(U)表示该最近邻居集合；其中c₁,c₂,…,c_k为k个上下文，Num(U)为用户总数，表示用户j在第c_i个上下文影响下的相似用户集合；

步骤35：利用步骤4获取的k个最近邻居的用户偏好，通过以下公式为预测潜在用户评分

与本发明基于上下文本体树计算用户偏好相似度的信息推荐方法相关的定义如下：

定义1用户u及用户集U＝{u₁,u₂,…,u_N}。指的是互联网中具有唯一ID用户及用户群体，每个用户向量包含年龄、性别等基础信息，且可以通过移动智能终端和互联网进行网络活动。

定义2用户上下文UserContext＝(UPC,UEC,UDC)，上下文UPC表示为用户基础信息：UPC＝(Backgroud,Relation)；Backgroud表示用户年龄、性别等，Relation表示用户交互关系、亲密关系等；上下文UEC表示为用户的设备信息：UEC＝(Hardware,Software)；表示硬件设备、软件产品、宽带(Wide-band)等；上下文UDC表示用户环境信息：UDC＝(DayTime,Location)；DayTime表示用户所处的时间(上午、下午、晚上等)，Location表示地理位置(Location)。上下文因素集定义为：C＝C₁,C₂,…C_k,…C_L。

定义3用户历史行为上下文信息集，定义为

表示在上下文信息下用户历史行为信息集合，其中为多维度用户上下文实例，其屮为单个或者多个非负实数表示的行为变量。

定义4上下文实例：定义上下文C_k的实例用如下表示，c_kj为C_k的第j个上下文取值，C_k上下文实例个数最多是l_k个。

C_k＝{c_kj|k∈[1,l],j∈[1,l_k]} (10)

定义5上下文关联度。为准确反映上下文C_context(这里C_context即为即)对客户偏好Q的贡献率，对上下文关联度进行定义：

上下文关联度表示上下文与行为之间的相关程度。如果C_context的存在并没有影响Q，则该值等于1；如果C_context的存在对Q有诱导作用，则该值大于1，而且相关程度越高，该值越大。p(Q|C_context)表示客户在C_context上下文作用下产生偏好Q的概率,N表示上下文类型的数量。

定义6上下文本体模型：分析各个上下文及实例，可以发现各个上下文之间具有树形关系(包括上下级父子关系、同级兄弟关系等)。数值化表达如下式表示：

C^S＝C₁×C₂×…×C_k×…×C_L (12)

C^S中的上下文实例通过C_k的笛卡尔积来表示，而C_k定义和具体实例由定义4得出。

定义7用户偏好集UI，设代表某一实数，值决定偏好的高低，偏好集定义如下：

表示为不同上下文影响下的用户对推荐商品的偏好集合，用户组合上下文实例用表示。

本发明的技术构思为：传统推荐方法未能很好地考虑不同上下文类型对用户需求的差异化影响，以及上下文化推荐服务自适应性差等不足，本发明提出了基于上下文本体树计算用户偏好相似度的信息推荐方法。该方法分析各种上下文类型及其具体实例对用户偏好的差异化影响，设计一种基于上下文的用户偏好提取方法；然后，利用本体对上下文进行语义表达，并构建基于本体树表达的上下文相似度计算方法，提升协同过滤推荐中寻找相似用户集的精确性；在上述用户偏好提取的基础上，将提取出的上下文引入到协同过滤推荐过程，计算上下文用户偏好之间的相似度，并设计一种基于用户上下文偏好分析的协同过滤推荐方法，解决了已有推荐方法的稀疏性、冷启动等问题。

本发明的有益效果在于：有效提升在复杂上下文中的个性化推荐质量，并且一定程度上解决了常见推荐系统中的稀疏性、冷启动问题，实现了融入上下文语义知识的偏好提取与高质量的推荐内容，在智慧商业、智能推荐领域具有良好的实际应用价值。

附图说明

图1是本发明方法的流程图。

图2是本发明方法中部分上下文要素维度及其各子类要素构成的层次关系图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1，基于上下文本体树计算用户偏好相似度的信息推荐方法，包括以下步骤：

步骤1，基于上下文的用户偏好提取；

输入：网络用户u_i，商品s_j，上下文集合C_k；

输出：基于上下文的用户偏好

步骤11：计算某单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据，其中d_ij为含有上下文的用户历史行为上下文的数目。如用户出于某种目的在某个时刻购买的商品信息(Product)、购买时间(BTime)、购买的意图(Intention)等组成的行为向量UHBC＝{Product,BTime,Intention}，为多维度上下文组合。

步骤2，基于本体表达的上下文相似度计算；上下文相似度算法利用上下文本体模型的树形结构从子节点到父节点再到根节点进行递归相似度运算，循环计算每层节点之间的概念属性相似度，最后对先前上下文层次模型与当前上下文层次模型的综合相似度进行对比。

输入：上下文本体树CT₁和CT₂；

输出：用户上下文相似度CTSim(G,G′)；

步骤21：初始化CTSim(G,G′)＝0；

其中，∑w_i＝1，w_i为第i个子结点的权重。

本发明采用基于Levenstein编辑距离的字符串相似度计算公式计算上下文概念G_i与G_i'之间的相似度。

其中，ed(G_i,G_i')为G_i与G_i'之间的Levenstein编辑距离。

将上下文信息采用本体概念树的形式来描述，对上下文进行形式化定义与知识表达，在此基础上，构建基于本体的用户上下文层次结构模型。个性化推荐过程中影响用户网络行为的某一上下文因素集合C_k＝{基础，天气，位置，时间}，假设基础，天气，时间，位置4个上下文每个因素具体实例个人均为3，且C¹＝{男，晴天，家里，晚上}和C²＝{女，下雨，单位，上午}被视为两组不同的上下文信息，由此可得出该上下文模型含有81组不同的上下文信息。

步骤3，基于用户上下文偏好分析的协同过滤；

输出：TOP-N个推荐服务及评分。

步骤35：利用步骤4获取的k个最近邻居的用户偏好，通过以下公式4-8为预测潜在用户评分

Claims

1.基于上下文本体树计算用户偏好相似度的信息推荐方法，包括以下步骤：

步骤1，基于上下文的用户偏好提取；

输入：网络用户u_i，商品s_j，上下文集合C_k；

输出：基于上下文的用户偏好

步骤11：计算单维度上下文中一个上下文实例的平均值作为单一用户历史行为上下文数据，其中d_ij为含有上下文的用户历史行为上下文的数目；用户出于某种目的在某个时刻购买的商品信息(Product)、购买时间(BTime)、购买的意图(Intention)组成的行为向量UHBC＝{Product,BTime,Intention}，为多维度上下文组合；

<mrow> <msub> <mi>uhbc</mi> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>r</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </munderover> <msub> <mi>uhbc</mi> <mrow> <mi>i</mi> <mi>j</mi> <mover> <mi>r</mi> <mo>&OverBar;</mo> </mover> </mrow> </msub> <mo>|</mo> <msub> <mi>C</mi> <mover> <mi>r</mi> <mo>&OverBar;</mo> </mover> </msub> <mo>=</mo> <msub> <mi>c</mi> <mn>1</mn> </msub> <mo>...</mo> <msub> <mi>c</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mi>c</mi> <msub> <mi>k</mi> <mi>q</mi> </msub> </msub> <msub> <mi>c</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>...</mo> <msub> <mi>c</mi> <mi>N</mi> </msub> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

步骤12：计算某种上下文类型C_context的影响程度ε_ijk，用于度量上下文对用户行为Q的差异化认知，N为用户行为记录数；

<mrow> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <munder> <mo>&DoubleRightArrow;</mo> <mi>N</mi> </munder> <mi>Q</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <msub> <mi>C</mi> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <mover> <msub> <mi>C</mi> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <msqrt> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <mover> <mi>C</mi> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>&lsqb;</mo> <mn>1</mn> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>Q</mi> <mo>|</mo> <mover> <mi>C</mi> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mi>N</mi> </mfrac> </msqrt> </mfrac> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

步骤13：计算单维度上下文用户偏好；以单维度用户历史行为上下文为数据源，通过K-Means算法计算单维度上下文用户偏好其取值区间为[a,b]；

<mrow> <msub> <mrow> <mo>(</mo> <msub> <mi>ui</mi> <mi>c</mi> </msub> <mo>)</mo> </mrow> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>=</mo> <msub> <mi>f</mi> <mrow> <mi>K</mi> <mi>M</mi> <mi>e</mi> <mi>a</mi> <mi>n</mi> <mi>s</mi> </mrow> </msub> <mrow> <mo>(</mo> <munder> <munder> <munder> <mrow> <msub> <mi>uhbc</mi> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> </mrow> <mrow> <mn>1</mn> <mo>&le;</mo> <mi>j</mi> <mo>&le;</mo> <mi>M</mi> </mrow> </munder> <mrow> <mn>1</mn> <mo>&le;</mo> <mi>k</mi> <mo>&le;</mo> <msup> <mi>N</mi> <mo>&prime;</mo> </msup> </mrow> </munder> <mrow> <mn>1</mn> <mo>&le;</mo> <mi>q</mi> <mo>&le;</mo> <msub> <mi>Z</mi> <mi>k</mi> </msub> </mrow> </munder> <mo>)</mo> </mrow> <mo>|</mo> <msub> <mi>uhbc</mi> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>&NotEqual;</mo> <mn>0</mn> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

步骤14：在某一上下文类型C_k影响下用户u_i对商品s_j的偏好的影响程度作用下，基于某一类上下文影响下的用户偏好来计算u_i在组合上下文实例影响下对s_j的偏好；

<mrow> <msub> <mrow> <mo>(</mo> <msub> <mi>UI</mi> <mi>C</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> <mover> <msup> <mi>t</mi> <mo>&prime;</mo> </msup> <mo>&OverBar;</mo> </mover> </mrow> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <msup> <mi>N</mi> <mo>&prime;</mo> </msup> </munderover> <mrow> <mo>(</mo> <msub> <mi>&epsiv;</mi> <mrow> <mi>i</mi> <mi>j</mi> <mi>k</mi> </mrow> </msub> <mo>&times;</mo> <msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>ui</mi> <mi>c</mi> </msub> </mrow> <mo>)</mo> </mrow> <mrow> <msub> <mi>ijk</mi> <mi>q</mi> </msub> </mrow> </msub> <mo>)</mo> </mrow> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

步骤2，基于本体表达的上下文相似度计算；上下文相似度算法利用上下文本体模型的树形结构从子节点到父节点再到根节点进行递归相似度运算，循环计算每层节点之间的概念属性相似度，最后对先前上下文层次模型与当前上下文层次模型的综合相似度进行对比；

输入：上下文本体树CT₁和CT₂；

输出：用户上下文相似度CTSim(G,G′)；

步骤21：初始化CTSim(G,G′)＝0；

假设当前上下文本体树CT₁中某一个非叶子结点G，G＝{G₁,G₂,…G_N}代表G的N个子节点，先前上下文本体树CT₂中某一个非叶子结点G′，G′＝{G′₁,G′₂…G′_N}代表G′的N个子节点，计算G与G′的相似度如下：

<mrow> <mi>C</mi> <mi>T</mi> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>G</mi> <mo>,</mo> <msup> <mi>G</mi> <mo>&prime;</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </msubsup> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>&times;</mo> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>G</mi> <mo>,</mo> <msup> <mi>G</mi> <mo>&prime;</mo> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

其中，∑w_i＝1，w_i为第i个子结点的权重；

步骤24：利用公式CTSim(G,G′)+＝w_i×Sim(G,G′)递归计算两棵上下文本体树中非叶子结点的全部G_i与G_i′的相似度，获取综合相似度；

<mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>G</mi> <mo>,</mo> <msup> <mi>G</mi> <mo>&prime;</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mo>(</mo> <mn>0</mn> <mo>,</mo> <mfrac> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mo>|</mo> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>|</mo> <mo>,</mo> <mo>|</mo> <msup> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> </msup> <mo>|</mo> <mo>-</mo> <mi>e</mi> <mi>d</mi> <mo>(</mo> <mrow> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> <msup> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> </msup> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mo>|</mo> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>|</mo> <mo>,</mo> <mo>|</mo> <msup> <msub> <mi>G</mi> <mi>i</mi> </msub> <mo>,</mo> </msup> <mo>|</mo> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>

其中，ed(G_i,G_i')为G_i与G_i′之间的Levenstein编辑距离；

通过在推荐过程前用上下文过滤能够提高每类中“用户—上下文”关联关系，从而提升推荐性能；利用上下文信息对“用户—项目”评分进行聚类，目的是将具有相似上下文的“用户—项目”聚在一类，以达到降低数据噪音的目的；

将上下文信息采用本体概念树的形式来描述，对上下文进行形式化定义与知识表达，在此基础上，构建基于本体的用户上下文层次结构模型；个性化推荐过程中影响用户网络行为的某一上下文因素集合C_k＝{基础，天气，位置，时间}，假设基础，天气，时间，位置4个上下文每个因素具体实例个人均为3，且C¹＝{男，晴天，家里，晚上}和C²＝{女，下雨，单位，上午}被视为两组不同的上下文信息，由此可得出该上下文模型含有81组不同的上下文信息；

步骤3，基于用户上下文偏好分析的协同过滤推荐；

输入：上下文集合C、网络用户u、服务推荐集合Service(R)S，“用户—项目”评分矩阵，“项目—上下文”关联矩阵；

输出：TOP-N个推荐服务及评分；

步骤31：根据基于上下文的用户偏好提取方法提取用户上下文行为和用户评分数据集，并得到用户u的所有偏好数据构造“上下文——项目”矩阵；

步骤32：调用上下文相似度计算方法计算(C)_ij中上下文之间的相似度；

<mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>p</mi> <mi>e</mi> <mi>a</mi> <mi>r</mi> <mi>s</mi> <mi>o</mi> <mi>n</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>&Sigma;</mi> <mrow> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> <mo>&Element;</mo> <msup> <mi>S</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </msubsup> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>j</mi> </msub> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </msubsup> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <msqrt> <mrow> <msub> <mi>&Sigma;</mi> <mrow> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> <mo>&Element;</mo> <msup> <mi>S</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <msup> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>r</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>u</mi> <mi>i</mi> </msub> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <msub> <mi>&Sigma;</mi> <mrow> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> <mo>&Element;</mo> <msup> <mi>S</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <msup> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>r</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>u</mi> <mi>j</mi> </msub> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

其中表示用户u_i对全部相关上下文(即通过项目关联起来的上下文，而非全部上下文)的平均偏好；基于相似度sim(u_i,u_j)_{context-pearson}可以为用户u_i选择k个最近邻；

步骤34：寻找上下文c_i影响下的目标用户u_i的最近邻集合；由于用户偏好与上下文密切相关，因此，本发明首先根据步骤2获取上下文c_i和c_j之间的相似度；然后，分别寻找在上下文c_i和c_j影响下u_i各自的最近邻居集；最后，将上下文c_j下的最近邻居用户合并到上下文c_i下的最近邻居集合中；

<mrow> <msubsup> <mi>r</mi> <mrow> <mi>u</mi> <mo>,</mo> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>C</mi> <mi>F</mi> </mrow> </msubsup> <mo>=</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </msubsup> <mo>&OverBar;</mo> </mover> <mo>+</mo> <mfrac> <mrow> <msub> <mi>&Sigma;</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <mi>U</mi> </mrow> </msub> <mi>s</mi> <mi>i</mi> <mi>m</mi> <msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>p</mi> <mi>e</mi> <mi>a</mi> <mi>r</mi> <mi>s</mi> <mi>o</mi> <mi>n</mi> </mrow> </msub> <mo>&times;</mo> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>,</mo> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <msubsup> <mi>r</mi> <msub> <mi>u</mi> <mi>j</mi> </msub> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </msubsup> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>&Sigma;</mi> <mrow> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <mi>U</mi> </mrow> </msub> <mo>|</mo> <mi>s</mi> <mi>i</mi> <mi>m</mi> <msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> <mo>-</mo> <mi>p</mi> <mi>e</mi> <mi>a</mi> <mi>r</mi> <mi>s</mi> <mi>o</mi> <mi>n</mi> </mrow> </msub> <mo>|</mo> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> <mo>.</mo> </mrow> 3