CN109299368B - 一种用于环境信息资源ai智能个性化推荐的方法及系统 - Google Patents

一种用于环境信息资源ai智能个性化推荐的方法及系统 Download PDF

Info

Publication number
CN109299368B
CN109299368B CN201811148742.3A CN201811148742A CN109299368B CN 109299368 B CN109299368 B CN 109299368B CN 201811148742 A CN201811148742 A CN 201811148742A CN 109299368 B CN109299368 B CN 109299368B
Authority
CN
China
Prior art keywords
user
similarity
information
node tree
login
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811148742.3A
Other languages
English (en)
Other versions
CN109299368A (zh
Inventor
蒋益民
张冬华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua Solution Information Technology Co ltd
Original Assignee
Tsinghua Solution Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua Solution Information Technology Co ltd filed Critical Tsinghua Solution Information Technology Co ltd
Priority to CN201811148742.3A priority Critical patent/CN109299368B/zh
Publication of CN109299368A publication Critical patent/CN109299368A/zh
Application granted granted Critical
Publication of CN109299368B publication Critical patent/CN109299368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用于环境信息资源AI智能个性化推荐的方法及系统,该方法包括:根据用户历史日志数据构建用户关系节点树;获取登录用户的用户信息;根据用户登录数据获取用户在所述用户关系节点树中的位置;根据所述位置查询需要推荐给所述登录用户的个性化环境资源信息;向所述登录用户显示所述用户个性化环境资源信息;接收用户对所述用户个性化环境资源信息的反馈信息;根据所述反馈信息定期更新所述用户关系节点树。通过本发明的方案,提高了环境信息资源数据推荐的效率和准确性。

Description

一种用于环境信息资源AI智能个性化推荐的方法及系统
技术领域
本发明属于互联网技术领域,具体地涉及一种用于环境信息资源AI智能个性化推荐的方法及系统。
背景技术
随着互联网高速发展,人们在充分享受了网上冲浪带来的开放、交互等便利的同时,也面临越来越严重的从海量信息中查找和使用所需要信息的问题,即所谓的信息过载问题。推荐技术或推荐引擎就是专门针对信息过载问题的技术解决方案,能够帮助人们在更短时间内定位到他们想要的内容,并有效发掘长尾,成为了继搜索引擎之后的重要信息工具。近年来通过与快速发展的大数据、人工智能(深度学习)等新技术的结合,取得了很大的提升,逐渐演变为一个重要和独立研究领域,过去十多年中大量全球顶尖技术专家和工程师投身于推荐技术的研究与应用中,不少优秀的新方法被提出。
推荐系统通过分析用户的历史行为数据,分析发现用户的兴趣爱好,来为用户推荐其感兴趣的物品或是资源。目前已经在电子商务、电影推荐及广告投放等领域得到实际应用。
在涌现出的各种各样的推荐算法中,主要有基于内容的推荐算法、协同过滤推荐算法。其中协同过滤算法是个性化推荐系统中最常用的算法之一。
基于内容的推荐算法主要通过分析用户和项目(资源)的内容信息(如用户的人口统计信息,资源的描述信息等),构建出一系列用户和资源的特征,最终通过匹配用户和资源的相似度来做出推荐。这种方式的性能很低,因为依赖于对资源属性和用户属性的准确描述,需要大量的收集属性信息。
协同过滤算法分为基于用户的协同过滤算法和基于项目(资源)的协同过滤算法。基于用户的协同过滤算法给用户推荐和他兴趣相似的其他用户喜欢的资源,基于资源的协同过滤算法给用户推荐和他之前喜欢的资源相似的资源。基于用户的协同过滤算法只需根据用户以往对资源的评分信息就可以计算用户之间的相似度,然后就可以把与目标用户(被推荐用户)相似度高的那些用户喜欢的资源推荐给目标用户。同理,基于资源的协同过滤算法可以根据资源被喜欢的用户计算资源之间的相似度,然后进行推荐。
协同过滤算法只依赖用户的历史评分信息,不需要用户、资源的属性,很好地弥补了基于内容推荐算法的不足。凭借着自身简单高效的特点,在很多领域都被广泛应用。但是这种方法本身也存在着冷启动、数据稀疏等问题。
当前推荐系统的主流的有基于协同过滤的推荐、基于内容的推荐,以及结合多种推荐方法形成的混合推荐。现有主流的推荐技术应用在融合媒体环境中存在如下问题:
当前应用较多的协同过滤推荐方法,简单来说就是利用某兴趣相投、拥有共同经验的群体的喜好来推荐用户感兴趣的信息,因此需要根据用户回应并记录下来以达到过滤的目的进而帮助别人筛选信息。但是在融合媒体环境中很少有用户会给自己浏览的内容进行打分,这就造成了协同过滤方法在媒体领域存在推荐的数据稀疏、个性化不足、冷启动等问题。
基于内容的推荐方法,是发现物品和内容的相关性,然后基于用户以前的喜好记录来推荐给用户相似的物品或内容,在个性化方面是强项,但在满足长尾方面的有所不足,难以实现媒体内容推送的新奇性、新鲜性等特点。而且这种方法使用人口统计学特征和用户行为特征生成用户偏好模型,再与被推荐物的特征进行比对不但容易侵犯用户的隐私,而且两种特征的选择、提取和匹配是难点。
现有的多种推荐方法形成的混合推荐,只是多种方式的简单组合,各种方法在特征定义等方面采取了各自的标准、没有形成统一,并没有从根本上解决单一推荐方法的缺点,也没有很好形成混合推荐的效率优势。
现有的推荐方法针对用户属性、以及用户之间的关系来推荐信息的方法较少。然而用户之间的关系对于信息推荐具有很大的参考意义。本发明通过研究用户关系以及既往的历史日志数据,建议一种用户关系节点树,并将其用于数据推荐中,提高了数据的推荐效率和准确度。
发明内容
为解决上述技术问题,本发明公开了一种用于环境信息资源的AI智能个性化推荐方法,包括:
根据用户行为相似度数据构建用户关系节点树;
获取登录用户的用户信息;
根据用户登录数据获取用户在所述用户关系节点树中的位置;
根据所述位置查询需要推荐给所述登录用户的个性化环境信息;
向所述登录用户显示所述用户个性化环境信息。
根据本发明的方法,优选的,
根据用户历史日志数据计算用户行为相似度和用户偏好相似度;
根据所述用户行为相似度和用户偏好相似度计算用户相似度;
根据所述用户相似度构建用户关系节点树。
根据本发明的方法,优选的,
根据所述用户历史日志数据计算用户行为相似度,具体为:
Figure BDA0001817424330000031
其中ru,j代表用户u对物品j的评分,rv,j代表用户v对物品j的评分,mean(ru)表示用户u的评分均值,mean(rv)表示用户v的评分均值,sim(u,v)标识用户u和用户v之间的用户行为相似度。
根据本发明的方法,优选的,
分别计算第一用户属性相似度:
Figure BDA0001817424330000041
其中,用户第一基本属性向量x=(x1,x2,……,xn),y=(y1,y2,……,yn)
第二用户属性相似度:
Figure BDA0001817424330000042
x1=(x11,x12,....x1n)和x2=(x21,x22,......,x2n)
利用word2vec网络模型计算用户关键字相似度Skw
对上述第一用户属性相似度、第二用户属性相似度和用户关键字相似度Skw赋予不同权重w1,w2,w3;
并通过以下公式确定用户偏好相似度:
Spre=w1T+w2d12+w3Skw
根据本发明的方法,优选的,
根据用户在用户关系节点树中的位置将与该用户节点深度差在某个阈值之内的所有节点用户最近浏览的环境信息推荐给该用户。
根据本发明的方法,优选的,
如果向用户推荐的环境信息资源部分或全部符合用户要求,则用户对符合用户要求的环境信息资源进行标记后进行存储;
如果如果向用户推荐的环境信息资源全部均不符合用户要求,则用户通过搜索引擎搜索环境信息资源,并将检索得到的符合要求的的环境信息资源进行存储。
为解决上述技术问题,本发明公开了一种基于环境信息资源的AI智能个性化推荐系统,包括:
用户关系节点树构建模块,根据用户相似度数据构建用户关系节点树;
用户信息获取模块,获取登录用户的用户信息;
用户位置确定模块,根据用户登录数据获取用户在所述用户关系节点树中的位置;
信息查询推荐模块,根据所述位置查询需要推荐给所述登录用户的个性化环境信息资源;
信息显示模块,向所述登录用户显示所述用户个性化环境信息。
根据本发明的系统,优选的,
所述用户关系节点树构建模块用于:
根据用户历史日志数据计算用户行为相似度和用户偏好相似度;
根据所述用户行为相似度和用户偏好相似度计算用户相似度;
根据所述用户相似度构建用户关系节点树。
根据本发明的系统,优选的,
用户位置存储模块,用于存储各个用户在用户关系节点树中的节点位置。
根据本发明的系统,优选的,
环境信息资源推荐存储模块,用于针对每个用户存储一段时间内符合用户要求的环境信息资源。
通过本发明的方案,取得了以下技术效果:
由于之前较为准确的计算了用户之间有明确的相似度,保证了用户相似度的准确和全面,并且融入用户行为对相似度动态更新,提高了推荐的准确性,同时推荐结果更契合用户的兴趣(动态)。
从共享角度看,可以从纵向上对业务数据、知识领域、舆情进行共享联通,用户之间可以实现数据共享。
从业务角度看,可以在横向范围内,即不同的部门间进行业务数据、知识等的共享,A部门某用户关注的资源,可以推送给其他部门负责相关业务的相似度高的用户,实现资源在部门间的共享。
附图说明
图1为本发明的二叉树示意图;
图2为本发明的环境信息数据智能推荐方法流程示意图;
图3为本发明的环境信息数据智能推荐系统组成示意图。
具体实施方式
本发明的AI智能个性化推荐方法包括以下步骤:
S1,根据用户的历史日志数据,构建对用户关系节点树。
现有的基于内容的推荐方法基本都使用用户行为特征作为用户偏好模型,再与被推荐物的特征进行比对。但造成的问题一是容易侵犯用户的隐私,二是两种特征的选择、提取和匹配是难点。基于协同过滤的推荐不论是user-based(基于用户的)还是item-based(基于物品的),都是要找到user-user间的相似性或item-item间的相似性,通过生成user-item倒排表,可以用基于关联规则的常规方法进行推荐、也可以采用矩阵分解等方法得到因子分解模型、隐语义模型等进行推荐。
在本实例中,基于内容与协同过滤相结合的个性化推荐方法,主要分为了离线训练和在线推荐两个环节。
离线训练
离线训练的主要目的是使用既往的用户浏览的环境信息资源,并生成用户相似度,包括:
S11:按照预定义的时间段,从环境信息资源服务器中获取一定时间内用户浏览过的环境信息资源日志数据,包括:点击、收藏、转发、喜欢或不喜欢等的统计数据,得到各用户之间的相似度数据。
所述用户之间的相似度数据取决于至少两个相似度:用户行为相似度和用户偏好相似度,可选的还可以包括用户交互相似度。
用户行为相似度:
根据所述用户历史日志数据计算用户行为相似度,具体为:
Figure BDA0001817424330000071
其中ru,j代表用户u对物品j的评分,rv,j代表用户v对物品j的评分,mean(ru)表示用户u的评分均值,mean(rv)表示用户v的评分均值,sim(u,v)标识用户u和用户v之间的用户行为相似度。
用户偏好相似度:
用户偏好相似度由三个相似度计算得到:
用户属性相似度:
Figure BDA0001817424330000072
其中,用户属性向量x=(x1,x2,……,xn),y=(y1,y2,……,yn)。
所述用户属性包括用户的一些基本属性信息。
用户位置属性相似度:
Figure BDA0001817424330000081
x1=(x11,x12,....x1n)和x2=(x21,x22,,x2n)
所述用户属性向量x1,x2表示与用户位置相关的属性信息,比如所在位置的经纬度,或者建立的三维坐标中的坐标位置等等。
利用word2vec网络模型计算用户关键字相似度Skw
word2vec是Google开源的一款用于词向量计算的工具。word2vec不仅可以在百万数量级的词典和上亿的数据集上进行高效地训练,还可以得到训练结果——词向量(wordembedding),可以很好地度量词与词之间的相似性。其实word2vec算法的背后是一个浅层神经网络,而且还是一个计算word vector的开源工具。当我们在说word2vec算法或模型的时候,其实指的是其背后用于计算word2 vector的CBoW模型和Skip-gram模型。实际应用可以直接调用gensim模型里的word2vec函数。
对上述用户属性相似度、用户位置相似度和用户关键字相似度Skw赋予不同权重wpre1,wpre2,wpre3
并通过以下公式确定用户偏好相似度:
Spre=wpre1T+wpre2d12+wpre3Skw
因此用户u与用户v之间的相似度S=Max(Sim(u,v),Spre)。
此外,可选的还可以考虑用户交互相似度。
用户之间的交互程度包括:用户之间的转发比例,来自资源来源用户的资源的点击、收藏、喜欢的比例,以及不喜欢的比例,都能反映用户之间的交互程度,不喜欢要降低用户之间的交互程度,其他则增加交互程度。
取用户转发信息表最近两个月数据,并且用最近两个月的日志、用户收藏信息表、用户喜欢信息表、用户不喜欢信息表的数据分别与推荐结果历史表最近两个月数据关联,统计某用户假设是用户1与其他用户的转发率(与单个用户的转发次数/总转发次数),统计用户1与资源来源用户的资源点击率、喜欢率、收藏率、不喜欢率(点击数量/推荐数量,其他比率计算类似),分别为转发率、资源点击率、喜欢率、收藏率、不喜欢率设置权重,计算用户1对同一个用户假设是用户2的转发率,资源点击率、喜欢率、收藏率、不喜欢率,计算加权和,即为用户1与用户2的交互程度,后面用这个交互程度更新用户1与用户2的相似度。具体计算公式如下:
转发率:用户A与转发用户B的看过资源的频率=A转发B浏览过的浏览次数/A总转发次数transmitrate
喜欢率likerate:用户A对资源来源用户B推荐资源的喜欢频率=点击数量/推荐总数;
收藏率collectionrate:用户A对资源来源用户B推荐资源的收藏频率=收藏数量/推荐总数。
用户交互相似度Suser=(wit1*transmitrate+wit2*likeratewi3*collectionrate)/(wit1+wit2+wit3)
目前wit2,wit1,wit1表示转发率、喜欢率和收藏率的权重,可根据需要进行调整,比如均将其设置为1。
如考虑了用户交互相似度,则用户u与用户v之间的相似度S=W1Sim(u,v)+W2Spre+W3Suser+。
所述W1,W2,W3表示不同相似度的权重。
S12:对用户之间的相似度数据进行排序,提取相似度最高的多个用户相似度数据,即TOP-N个用户相似度数据,所述N值可根据需要进行调整。
S13:根据所述TOP-N个用户相似度数据,确定用户关系节点树的根节点;
确定根节点的具体规则为:在TOP-N个用户相似度数据中出现次数最多的用户作为根节点。
S14:遍历确定各子节点。
具体过程是:将与所述根节点相似度在第一阈值范围内(比如相似度大于0.8)的多个用户作为根节点的子节点,即二级子节点;然后将与各二级子节点相似度在第二阈值范围内的多个用户作为所述二级子节点的子节点,即三级子节点;以此重复,直至确定所有用户在所述用户关系节点树中的位置,并同时有第三、第四等多个阈值。遍历的过程可以为多种遍历方法,包括:前序遍历(即先遍历根节点,然后遍历左节点,最后遍历右节点)、中序遍历(即先遍历左节点,然后遍历根节点,最后遍历右节点)或后续遍历(即先遍历左节点,然后遍历右节点,最后遍历根节点)。所述用户关系节点树可以为各种有序树,优选为二叉树。
如图1所示,按照前序遍历则为:ABCDEFGH。
其中所述第一、第二等多个阈值可以设置为相同,也可以设置为不同。
通过上述过程,将建立一棵用户关系节点树,而各用户位于所述用户关系节点树中的不同位置。
如果需要在所述用户关系节点树中加入新用户,需要计算根新用户与根节点及各级子节点的用户相似度,并根据与各根节点及各子节点的相似度是否小于第一阈值、第二阈值确定新用户在用户关系节点树中的位置。
再确定了各用户在用户关系节点树的位置后,将用户关系节点树的所有节点信息(比如根节点信息、子节点信息以及各子节点信息的父节点和子节点信息)进行保存,比如保存在相应的数据库中,将用户与位置的对应关系信息进行保存,比如用户ID(或姓名、编号)等用户信息与用户在用户关系节点树中的位置(比如树节点编号、树节点的层级、子节点和父节点等)进行对应保存。
S2,获取登录用户的用户信息。
用户在登录相应的应用系统后,可以获得用户的用户ID或其他标识息。
S3,根据用户登录数据获取用户在所述用户关系节点树中的位置。
根据该用户标识信息可以从上述保存用户关系节点树相关信息的数据库中,查询该用户信息对应的在用户关系节点树中的位置。
S4,根据所述位置查询需要推荐给所述登录用户的个性化环境信息。
根据该用户关系节点树确定与该用户节点位置对应的子节点和父节点。并根据所述子节点和父节点确定该子节点和父节点对应的用户最近在环境资源信息数据库中最近浏览的环境信息资源数据。比如可以为最近1天内点击过、浏览过的、收藏过的或者标记为喜欢的环境信息资源数据。至于具体推荐那些节点或多长时间内的环境信息资源数据,可根据需要进行调整,比如可以仅推荐父节点或子节点,或者同时推荐父节点和子节点浏览过的资源。并根据按用户相似度(倒序)、资源的更新时间(倒序)、资源的url排序,取排名靠前的多少个资源推荐给用户。
S5,向所述登录用户显示所述用户个性化环境信息。
将确定的上述子节点和父节点对应的用户最近在环境资源信息数据库中最近浏览过的环境信息资源数据显示给用户。
可选的,该方法还包括以下步骤:
S6,用户对推荐的环境信息资源进行反馈。
在显示给用户个性化环境信息资源的显示界面中有一个反馈选项,即用户可以选择推荐的数据是否为用户想要的数据,如果是用户想要的数据,则选择接收,如果不是用户想要的数据,则选择拒绝。
在数据库中将记录用户的上述反馈信息,即用户选择接收的推荐数据,和用户选择拒绝接收的推荐数据。
可选的,该方法还包括以下步骤:
S7,定期对用户关系节点树进行更新
在数据库中存储用户的反馈数据,并根据上述反馈数据定期,比如一周或其他时间段,对所述用户关系节点树进行更新。
即对反馈数据涉及的用户重新计算与该用户相关的用户相似度,具体步计算方法如步骤S1所述。计算得到所述用户相似度以后,根据上述步骤S1的方法,遍历所述用户关系节点树,对用户关系节点树中的与上述用户相关的树节点进行更新,如果需要更新的用户非叶子节点,则需要对该用户节点的所有子节点进行更新。更新完成后,将会得到一个新的用户关系节点树。在后续对用户进行个性化数据推荐时,将以该更新后的用户关系节点树作为数据推荐的依据。
本发明还公开了一种环境信息资源的AI智能个性化推荐系统,包括:
用户关系节点树构建模块101,根据用户行为相似度数据构建用户关系节点树。
用户关系节点树构建模块构建用户关系节点树的过程如下:
按照预定义的时间段,从环境信息资源服务器中获取一定时间内用户浏览过的环境信息资源日志数据,包括:点击、收藏、转发、喜欢或不喜欢等的统计数据,得到各用户之间的相似度数据。
所述用户之间的相似度数据取决于至少两个相似度:用户行为相似度和用户偏好相似度,可选的还可以包括用户交互相似度。
用户行为相似度:
根据所述用户历史日志数据计算用户行为相似度,具体为:
Figure BDA0001817424330000131
其中ru,j代表用户u对物品j的评分,rv,j代表用户v对物品j的评分,mean(ru)表示用户u的评分均值,mean(rv)表示用户v的评分均值,sim(u,v)标识用户u和用户v之间的用户行为相似度。
用户偏好相似度:
用户偏好相似度由三个相似度计算得到:
用户属性相似度:
Figure BDA0001817424330000132
其中,用户属性向量x=(x1,x2,……,xn),y=(y1,y2,……,yn)。
所述用户属性包括用户的一些基本属性信息。
用户位置相似度:
Figure BDA0001817424330000133
x1=(x11,x12,....x1n)和x2=(x21,x22,......,x2n)
所述用户属性向量x1,x2表示与用户位置相关的属性信息,比如所在位置的经纬度,或者建立的三维坐标中的坐标位置等等。
利用word2vec网络模型计算用户关键字相似度Skw
对上述用户属性相似度、用户位置相似度和用户关键字相似度Skw赋予不同权重wpre1,wpre2,wpre3
并通过以下公式确定用户偏好相似度:
Spre=wpre1T+wpre2d12+wpre3Skw
因此用户u与用户v之间的相似度S=W1Sim(u,v)+W2Spre
所述W1,W2表示不同相似度的权重。
此外,可选的还可以考虑用户交互相似度。
用户之间的交互程度包括:用户之间的转发比例,来自资源来源用户的资源的点击、收藏、喜欢的比例,以及不喜欢的比例,都能反映用户之间的交互程度,不喜欢要降低用户之间的交互程度,其他则增加交互程度。
取用户转发信息表最近两个月数据,并且用最近两个月的日志、用户收藏信息表、用户喜欢信息表、用户不喜欢信息表的数据分别与推荐结果历史表最近两个月数据关联,统计某用户假设是用户1与其他用户的转发率(与单个用户的转发次数/总转发次数),统计用户1与资源来源用户的资源点击率、喜欢率、收藏率、不喜欢率(点击数量/推荐数量,其他比率计算类似),分别为转发率、资源点击率、喜欢率、收藏率、不喜欢率设置权重,计算用户1对同一个用户假设是用户2的转发率,资源点击率、喜欢率、收藏率、不喜欢率,计算加权和,即为用户1与用户2的交互程度,后面用这个交互程度更新用户1与用户2的相似度。具体计算公式如下:
转发率:用户A与转发用户B的看过资源的频率=A转发B浏览过的浏览次数/A总转发次数transmitrate
喜欢率likerate:用户A对资源来源用户B推荐资源的喜欢频率=点击数量/推荐总数;
收藏率collectionrate:用户A对资源来源用户B推荐资源的收藏频率=收藏数量/推荐总数。
用户交互相似度Suser=(wit1*transmitrate+wit2*likeratewi3*collectionrate)/(wit1+wit2+wit3)
目前wit2,wit1,wit1表示转发率、喜欢率和收藏率的权重,可根据需要进行调整,比如均将其设置为1。
如考虑了用户交互相似度,则用户u与用户v之间的相似度S=W1Sim(u,v)+W2Spre+W3Suser+。
所述W1,W2,W3表示不同相似度的权重。
对用户之间的相似度数据进行排序,提取相似度最高的多个用户相似度数据,即TOP-N个用户相似度数据,所述N值可根据需要进行调整。
根据所述TOP-N个用户相似度数据,确定用户关系节点树的根节点;
确定根节点的具体规则为:在TOP-N个用户相似度数据中出现次数最多的用户作为根节点。
遍历确定各子节点,具体过程是:将与所述根节点相似度在第一阈值范围内(比如相似度大于0.8)的多个用户作为根节点的子节点,即二级子节点;然后将与各二级子节点相似度在第二阈值范围内的多个用户作为所述二级子节点的子节点,即三级子节点;以此重复,直至确定所有用户在所述用户关系节点树中的位置,并同时由第三、第四等多个阈值。遍历的过程可以为多种遍历方法,包括:前序遍历(即先遍历根节点,然后遍历左节点,最后遍历右节点)、中序遍历(即先遍历左节点,然后遍历根节点,最后遍历右节点)或后续遍历(即先遍历左节点,然后遍历右节点,最后遍历根节点)。所述用户关系节点树可以为各种有序树,优选为二叉树。
其中所述第一、第二等多个阈值可以设置为相同,也可以设置为不同。
通过上述过程,将建立一棵用户关系节点树,而各用户位于所述用户关系节点树中的不同位置。
如果需要在所述用户关系节点树中加入新用户,需要计算根新用户与根节点及各级子节点的用户相似度,并根据与各根节点及各子节点的相似度是否小于第一阈值、第二阈值确定新用户在用户关系节点树中的位置。
该系统还包括:
用户位置存储模块102,用于存储各个用户在用户关系节点树中的节点位置。
在确定了各用户在用户关系节点树的位置后,将用户关系节点树的所有节点信息(比如根节点信息、子节点信息以及各子节点信息的父节点和子节点信息)进行保存,比如保存在用户关系节点树存储模块中。
将用户与位置的对应关系信息进行保存,比如用户ID(或姓名、编号)等用户信息与用户在用户关系节点树中的位置(比如树节点编号、树节点的层级、子节点和父节点等)保存在用户位置存储模块中。
用户信息获取模块103,获取登录用户的用户信息。
用户登录后,预先存储用户信息的数据库中获取登录用户的用户信息,比如用户ID(或姓名、编号)等用户信息。
用户位置确定模块104,根据用户登录数据获取用户在所述用户关系节点树中的位置。根据用户ID(或姓名、编号)等用户信息从用户位置存储模块提取用户在用户关系节点树种的位置。
信息查询推荐模块105,根据所述位置查询需要推荐给所述登录用户的个性化环境信息资源。
对于用户最近浏览的环境信息资源数据,在环境信息资源推荐存储模块中针对每个用户进行存储。因此当查询到登录用户相关的父节点和子节点后,即可以根据父节点和子节点对应的该用户标识信息在环境信息资源推荐存储模块查询需要向用户推荐的环境信息资源。
对每个用户推荐的每类资源内部按用户相似度(倒序)、资源的更新时间(倒序)、资源的url排序,每类资源取前50个。
某用户的推荐列表可能来自多个与他相似度较高的用户。将所有这些资源去重后,保留与他相似度最高的用户看过的资源。
信息显示模块106,向所述登录用户显示所述用户个性化环境信息。
将从环境信息资源推荐存储模块查询得到的环境信息资源数据通过显示界面显示给用户。
还系统还可以包括:推荐信息反馈模块,在显示给用户个性化环境信息资源的显示界面中有一个反馈选项,即用户可以选择推荐的数据是否为用户想要的数据,如果是用户想要的数据,则选择接收,如果不是用户想要的数据,则选择拒绝。
在反馈数据库中将记录用户的上述反馈信息,即用户选择接收的推荐数据,和用户选择拒绝接收的推荐数据。
可选的,该系统还可以包括:用户关系节点树更新模块107,根据上述反馈数据定期,比如一周或其他时间段,对所述用户关系节点树进行更新。
即对反馈数据涉及的用户重新计算与该用户相关的用户相似度,具体计算方法如步骤S1所述。计算得到所述用户相似度以后,根据上述步骤S1的方法,遍历所述用户关系节点树,对用户关系节点树中的与上述用户相关的树节点进行更新,如果需要更新的用户非叶子节点,则需要对该用户节点的所有子节点进行更新。更新完成后,将会得到一个新的用户关系节点树。在后续对用户进行个性化数据推荐时,将以该更新后的用户关系节点树作为数据推荐的依据。
最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
基于这样的理解,本发明实现上述实施方式方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施方式的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个具体实施方式中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的终端实施方式仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能模块可以集成在相同处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在相同模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明实施例不限于上述示范性实施例的细节,而且在不背离本发明实施例的精神或基本特征的情况下,能够以其他的具体形式实现本发明实施例。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明实施例的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明实施例内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统、装置或终端权利要求中陈述的多个单元、模块或装置也可以由同一个单元、模块或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施方式仅用以说明本发明实施例的技术方案而非限制,尽管参照以上较佳实施方式对本发明实施例进行了详细说明,本领域的普通技术人员应当理解,可以对本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。

Claims (6)

1.一种用于环境信息资源AI智能个性化推荐的方法,其特征在于,包括:
根据用户历史日志数据构建用户关系节点树;
获取登录用户的用户信息;
根据用户登录数据获取用户在所述用户关系节点树中的位置;
根据所述位置查询需要推荐给所述登录用户的个性化环境资源信息;
向所述登录用户显示所述用户的个性化环境资源信息;
接收用户对所述用户的个性化环境资源信息的反馈信息;
根据所述反馈信息定期更新所述用户关系节点树;
所述根据用户历史日志数据构建用户关系节点树,包括:
根据用户历史日志数据计算用户行为相似度和用户偏好相似度;
根据所述用户行为相似度和用户偏好相似度计算用户相似度;
根据所述用户相似度构建用户关系节点树;
根据所述用户历史日志数据计算用户行为相似度,具体为:
Figure FDA0002591347180000011
其中ru,j代表用户u对物品j的评分,rv,j代表用户v对物品j的评分,mean(ru)表示用户u的评分均值,mean(rv)表示用户v的评分均值,sim(u,v)标识用户u和用户v之间的用户行为相似度;
分别计算第一用户属性相似度:
Figure FDA0002591347180000012
其中,用户第一基本属性向量x=(x1,x2,…,xn),y=(y1,y2,…,yn)
第二用户位置相似度:
Figure FDA0002591347180000021
x1=(x11,x12,…,x1n)和x2=(x21,x22,…,x2n),利用word2vec网络模型计算用户关键字相似度Skw;x1、x2是用户位置属性向量,表示与用户位置相关的属性信息;
对上述第一用户属性相似度、第二用户位置相似度和用户关键字相似度Skw分别赋予不同权重w1,w2,w3;
并通过以下公式确定用户偏好相似度:Spre=w1T+w2d12+w3Skw
用户u与用户v之间的用户相似度S=Max(Sim(u,v),Spre)。
2.如权利要求1所述的方法,其特征在于,
根据用户在用户关系节点树中的位置将与该用户节点深度差在某个阈值之内的所有节点用户最近浏览的环境信息推荐给该用户。
3.如权利要求1所述的方法,其特征在于,
如果向用户推荐的环境信息资源部分或全部符合用户要求,则用户对符合用户要求的环境信息资源进行标记后进行存储;
如果向用户推荐的环境信息资源全部均不符合用户要求,则用户通过搜索引擎搜索环境信息资源,并将检索得到的符合要求的环境信息资源进行存储。
4.一种用于环境信息资源AI智能个性化推荐的系统,其特征在于,包括:
用户关系节点树构建模块,根据用户历史日志数据构建用户关系节点树;
用户信息获取模块,获取登录用户的用户信息;
用户位置确定模块,根据用户登录数据获取用户在所述用户关系节点树中的位置;
信息查询推荐模块,根据所述位置查询需要推荐给所述登录用户的个性化环境信息资源;
信息显示模块,向所述登录用户显示所述用户的个性化环境资源信息;
信息反馈模块,接收用户对所述用户的个性化环境资源信息的反馈信息;
用户关系节点树更新模块,根据所述反馈信息定期更新所述用户关系节点树;
所述用户关系节点树构建模块,用于:
根据用户历史日志数据计算用户行为相似度和用户偏好相似度;
根据所述用户行为相似度和用户偏好相似度计算用户相似度;
根据所述用户相似度构建用户关系节点树;
根据所述用户历史日志数据计算用户行为相似度,具体为:
Figure FDA0002591347180000031
其中ru,j代表用户u对物品j的评分,rv,j代表用户v对物品j的评分,mean(ru)表示用户u的评分均值,mean(rv)表示用户v的评分均值,sim(u,v)标识用户u和用户v之间的用户行为相似度;
分别计算第一用户属性相似度:
Figure FDA0002591347180000032
其中,用户第一基本属性向量x=(x1,x2,…,xn),y=(y1,y2,…,yn)
第二用户位置相似度:
Figure FDA0002591347180000033
x1=(x11,x12,…,x1n)和x2=(x21,x22,…,x2n),利用word2vec网络模型计算用户关键字相似度Skw;x1、x2是用户位置属性向量,表示与用户位置相关的属性信息;对上述第一用户属性相似度、第二用户位置相似度和用户关键字相似度Skw分别赋予不同权重w1,w2,w3;
并通过以下公式确定用户偏好相似度:
Spre=w1T+w2d12+w3Skw
用户u与用户v之间的用户相似度S=Max(Sim(u,v),Spre)。
5.如权利要求4所述的系统,其特征在于,还包括:
用户位置存储模块,用于存储各个用户在用户关系节点树中的节点位置。
6.如权利要求4所述的系统,其特征在于,还包括:
环境信息资源推荐存储模块,用于针对每个用户存储一段时间内符合用户要求的环境信息资源。
CN201811148742.3A 2018-09-29 2018-09-29 一种用于环境信息资源ai智能个性化推荐的方法及系统 Active CN109299368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811148742.3A CN109299368B (zh) 2018-09-29 2018-09-29 一种用于环境信息资源ai智能个性化推荐的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811148742.3A CN109299368B (zh) 2018-09-29 2018-09-29 一种用于环境信息资源ai智能个性化推荐的方法及系统

Publications (2)

Publication Number Publication Date
CN109299368A CN109299368A (zh) 2019-02-01
CN109299368B true CN109299368B (zh) 2020-11-24

Family

ID=65161184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811148742.3A Active CN109299368B (zh) 2018-09-29 2018-09-29 一种用于环境信息资源ai智能个性化推荐的方法及系统

Country Status (1)

Country Link
CN (1) CN109299368B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292212A (zh) * 2020-03-04 2020-06-16 湖北文理学院 个性化思政教育系统
CN111753208B (zh) * 2020-06-30 2021-08-31 贝壳找房(北京)科技有限公司 确定用户可比属性收敛度的方法、装置、介质和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207914A (zh) * 2013-04-16 2013-07-17 武汉理工大学 基于用户反馈评价的偏好向量生成方法和系统
CN103886054A (zh) * 2014-03-13 2014-06-25 中国科学院自动化研究所 一种网络教学资源的个性化推荐系统和推荐方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514240B (zh) * 2012-11-29 2016-10-12 Tcl集团股份有限公司 一种基于遥控器的家庭成员关系挖掘方法及系统
CN104123284B (zh) * 2013-04-24 2018-01-23 华为技术有限公司 一种推荐的方法及服务器
TWI525460B (zh) * 2013-10-07 2016-03-11 財團法人資訊工業策進會 電子計算裝置、其個人化資訊推薦方法及其電腦程式產品
CN107203518A (zh) * 2016-03-16 2017-09-26 阿里巴巴集团控股有限公司 在线系统个性化推荐的方法、系统以及装置、电子设备
CN106446100A (zh) * 2016-09-13 2017-02-22 乐视控股(北京)有限公司 一种内容推荐方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207914A (zh) * 2013-04-16 2013-07-17 武汉理工大学 基于用户反馈评价的偏好向量生成方法和系统
CN103886054A (zh) * 2014-03-13 2014-06-25 中国科学院自动化研究所 一种网络教学资源的个性化推荐系统和推荐方法

Also Published As

Publication number Publication date
CN109299368A (zh) 2019-02-01

Similar Documents

Publication Publication Date Title
TWI636416B (zh) 內容個人化之多相排序方法和系統
US9098813B1 (en) Methods and systems for conducting a personalized web browser search by probability estimation that is unseen document is of interest to the user
Tinati et al. Identifying communicator roles in twitter
US9189567B1 (en) Determining the likelihood persons in a social graph know each other
US20140040371A1 (en) Systems and methods for identifying geographic locations of social media content collected over social networks
US20130297694A1 (en) Systems and methods for interactive presentation and analysis of social media content collection over social networks
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
CN105976161A (zh) 一种基于时间轴上的智能推荐日历及基于用户的呈现方法
CN110532351B (zh) 推荐词展示方法、装置、设备及计算机可读存储介质
EP2353103A2 (en) Method and system for determining topical relatedness of domain names
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
US20100318427A1 (en) Enhancing database management by search, personal search, advertising, and databases analysis efficiently using core-set implementations
CN111611499B (zh) 协同过滤方法、协同过滤装置及系统
CN112632405A (zh) 一种推荐方法、装置、设备及存储介质
CN111310046A (zh) 对象推荐方法及装置
CN114764479A (zh) 一种基于新闻场景下用户行为的个性化新闻推荐方法
CN114036376A (zh) 一种基于k均值聚类的时间感知自适应兴趣点推荐方法
CN109299368B (zh) 一种用于环境信息资源ai智能个性化推荐的方法及系统
Richa et al. Trust and distrust based cross-domain recommender system
CN110968675A (zh) 一种基于多领域语义融合的推荐方法及系统
Sun Music Individualization Recommendation System Based on Big Data Analysis
Reshma et al. Semantic based trust recommendation system for social networks using virtual groups
Agagu et al. Context-aware recommendation methods
CN110347923B (zh) 一种可回溯的快速裂变式构建用户画像的方法
CN107578326A (zh) 一种推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant