CN109766493B - 一种在神经网络下结合人格特征的跨域推荐方法 - Google Patents
一种在神经网络下结合人格特征的跨域推荐方法 Download PDFInfo
- Publication number
- CN109766493B CN109766493B CN201811584347.XA CN201811584347A CN109766493B CN 109766493 B CN109766493 B CN 109766493B CN 201811584347 A CN201811584347 A CN 201811584347A CN 109766493 B CN109766493 B CN 109766493B
- Authority
- CN
- China
- Prior art keywords
- user
- neural network
- personality characteristics
- data
- microblog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于基于大数据的个性化推荐领域,具体说是提出一种在神经网络下结合人格特征的跨域推荐方法。在神经网络下结合人格特征的跨域推荐方法,具体包括:(1)获取数据;(2)筛选用户;(3)提取关键词。(4)搭建神经网络。(5)针对人格特征,给具有相似人格特征的人进行个性化物品推荐。本发明通过结合人格特征,在神经网络的基础上,利用卷积神经网络CNN搭建神行网络体系,为具有相似人格特征的用户推荐相关物品。由于人格特征是不易改变且容易预测的,因为基于人格特征做个性化推荐能够提高推荐准确度的。
Description
技术领域
本发明属于基于大数据的个性化推荐领域,具体说是提出一种在神经网络下结合人格特征的跨域推荐方法。
背景技术
个性化推荐在当今大数据时代扮演了越来越重要的角色,如何利用海量数据,对用户行为进行预测,准确的向用户推荐其感兴趣的物品是个性化研究者关注的问题。
人格是一种可预测的、相当稳定的因素,能够形成人类行为。其中,5个因素模型被认为是最全面的模型之一,可以引入五种广泛的维度,即所谓的因素和特征,通常被称为“大五”来描述个人的人格:开放性(OPE),责任心(COS),外向性(EXT),亲和性(AGR)和神经质(NEU)。“五大”的测量通常是通过评估“项目”来完成的,这些“项目”是自我描述的句子或形容词,并且通常以简短的问题形式呈现给受试者。
神经网络是一个并行和分布式信息处理网络结构,由大量的简单的处理单元(称为神经元)组成,每个神经元有单一的输出,它可以连接到很多其他的神经元,其输入有多个连接通路,每个连接通路会对应一个连接权系数。相互联系的神经元之间传递增强或抑制信号,增强或抑制通过调整相互间联系的权重系数来实现,通过权重系数调节机制使神经网络的输出收敛于正确的目标值。
发明内容
针对现有个性化准确性不高、存在冷启动等技术难点问题,本发明提出了一种基于人格信息的跨域推荐方法。
为实现所述发明目的,本发明采用以下技术方案:一种基于神经网络结合人格特征推荐方案,我们以微博用户为例,其中包括如下步骤:
(1)获取数据;由于微博的授权认证是需要加密的,也就是需要身份认证的,虽然用户不会向微博透露自身的用户名以及密码,但是微博需要确认第三方的身份并提供特定的用户资源访问授权。新浪微博的授权方式是通过OAUTH认证实现的,它提供了一个稳定而安全的认证授权环境。授权完毕后,API根据用户发送的不同请求,会返回特定的文件,通过对相关文件的解析,便可以获得原始数据资源,其中用户自己发布的微博、他的粉丝、他的点赞、他的转发等。
(2)筛选用户;由于微博用户中的数据可能存在小号、滞销号等无用号,所以需要提取对实验有意义的数据,就需要进行有效用户数据筛选,因此建立一个基于活跃度和影响力的微博用户权重模型(因为活跃度和影响力越高说明微博数据越有代表性)。我们利用HITS算法,将用户的微博内容类比成一个网页进行解析,粉丝数量,粉丝互动值是影响力,发布数量和时间是活跃度,作为指标建立矩阵,然后迭代收敛,选区符合阈值条件的用户。
(3)提取关键词:利用TF-IDF算法获取并计算数据的词条权重,也就是采集关键词词频,关键词词频对于个性化推荐的匹配度是重要的指标(关键词只提取音乐名和食品名相关的内容),这些关键词词频会用于搭建神经网络。TF-IDF实际上是:TF*IDF。主要思想是:如果某个词或短语在一篇文章中出现的频率高(即TF高),并且在其他文章中很少出现(即IDF高),则认为此词或者短语具有很好的类别区分能力,适合用来分类。
(4)搭建神经网络;当得到人格特征和用户在音乐和食品方面相关的关键词数据后,就需要构建一个神经网络,本文是利用卷积神经网络(CNN)将人格特征神经网络化,也就是说其中最重要的算法是卷积算法,我们构建的神经网络也是由很多个卷积构成的,构建过程其实也就是数据的训练过程。
(5)针对人格特征,给具有相似人格特征的人进行个性化物品推荐。
构建的神经网络也是由很多个卷积构成的,构建过程是数据的训练过程:
(1)输入层就是将用户数据提取出来的关键词输入;
(2)隐含层是重点,把所提取的这些数据带入卷积公式得到具备此类人格特征的用户和这类具备这些关键词的音乐/食品的权重值,权重值就是表示关联度的大小,反复卷积就是下一个用户是在前一个的基础上进行卷积,也就是经过很多次之后得到一个相互关联的神经网(得到相互的关联值),加上偏置和激活函数,如果输出不是最后一层就是继续卷积加权;
(3)输出层:直至输出是最后一层,就可以经过前面的计算得到权重值相对较高的输出结果,也就是我们要推荐的最符合的内容。
本发明的有益效果是:通过结合人格特征,在神经网络的基础上,利用卷积神经网络CNN搭建神行网络体系,为具有相似人格特征的用户推荐相关物品。由于人格特征是不易改变且容易预测的,因为基于人格特征做个性化推荐能够提高推荐准确度的。
附图说明
图1是本发明进行个性化推荐的流程图。
具体实施方式
为了便于理解本发明,核心部分是如何利用人格特征搭建神经网络进行个性化推荐,在理解卷积神经网络CNN后,接下来做详细说明:
我们构建的神经网络也是由很多个卷积构成的,构建过程其实也就是数据的训练过程。
具体分为三层:
(1)输入层就是将用户数据提取出来的关键词输入;
(2)隐含层是重点,把所提取的这些数据带入卷积公式得到具备此类人格特征的用户和这类具备这些关键词的音乐/食品的权重值,权重值就是表示关联度的大小,反复卷积就是下一个用户是在前一个的基础上进行卷积,也就是经过很多次之后得到一个相互关联的神经网(得到相互的关联值),加上偏置和激活函数,如果输出不是最后一层就是继续卷积加权。
(3)输出层:直至输出是最后一层,就可以经过前面的计算得到权重值相对较高的输出结果,也就是我们要推荐的最符合的内容。
隐含层的层数通常不止为一,这对于外界是不可见的。其实,每层所做的操作都是将上一层的输出拿来加权求和,再加上偏置后输入激活函数,激活函数的输出如果不是最后一层的话,那么输出又成为下一层神经元的输入。微博用户的人格特征是神经网络结构中的神经分支,每个用户是神经元,构建出的神经网络系统,个性化推荐系统基于神经网络上,给用户推荐有相关关联度也就是神经元互相连接紧密程度高的内容。
一个用户的数据代表一个卷积层,使用权重矩阵加权求和,得到权重二维矩阵卷积核,并加上偏置输入到激活函数中;第二步池化,可以看做是一种特殊的卷积,池化后得到下一层的输入特征;最后将训练样本的所有输出连接起来。这是基本的做法,运用到我们做的结合人格特征的实验中,首先将用户特征和物品域数字化,然后将数字化的信息输入到模型中通过以上步骤能够构建神经网。
本发明涉及基于大数据的个性化推荐领域,提出一种基于人格信息的跨域推荐关键技术研究方法,适用于个性化推荐中的跨域推荐类型。推荐步骤依次为:(1)获取微博用户数据;(2)利用基于活跃度和影响力的微博用户权重模型将小号、滞销号等过滤掉;(3)利用TF-IDF算法获取并计算数据的词条权重;(4)搭建结合人格特征的神经网络模型(5)给相似人格特征的用户做个性化物品推荐。本发明利用微博数据进行抓取、解析和降噪三个过程,对原始的数据进行收集和处理,并且提出了一套微博用户权重计算方法,最终试验结果表明,本发明提出的基于神经网络结合人格特性的个性化模型相比传统用户相似度模型,对于预测正确率与查全率等测度均具有显著提升。
Claims (1)
1.一种在神经网络下结合人格特征的跨域推荐方法,具体步骤如下:
(1)获取数据;由于微博的授权认证是需要加密的,也就是需要身份认证的,虽然用户不会向微博透露自身的用户名以及密码,但是微博需要确认第三方的身份并提供特定的用户资源访问授权;新浪微博的授权方式是通过OAUTH认证实现的,它提供了一个稳定而安全的认证授权环境;授权完毕后,API根据用户发送的不同请求,会返回特定的文件,通过对相关文件的解析,便可以获得原始数据资源,其中包括用户自己发布的微博、他的粉丝、他的点赞、他的转发;
(2)筛选用户;由于微博用户中的数据可能存在包括小号、滞销号的无用号,所以需要提取对实验有意义的数据,就需要进行有效用户数据筛选,因此建立一个基于活跃度和影响力的微博用户权重模型;我们利用HITS算法,将用户的微博内容类比成一个网页进行解析,粉丝数量,粉丝互动值是影响力,发布数量和时间是活跃度,作为指标建立矩阵,然后迭代收敛,选取符合阈值条件的用户;
(3)提取关键词:利用TF-IDF算法获取并计算数据的词条权重,也就是采集关键词词频,关键词词频对于个性化推荐的匹配度是重要的指标,这些关键词词频会用于搭建神经网络;TF-IDF实际上是:TF*IDF;主要思想是:如果某个词或短语在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类;
(4)搭建神经网络;当得到人格特征和用户在音乐和食品方面相关的关键词数据后,就需要构建一个神经网络,本文是利用卷积神经网络将人格特征神经网络化,也就是说其中最重要的算法是卷积算法,我们构建的神经网络也是由很多个卷积构成的,构建过程其实也就是数据的训练过程;
(5)针对人格特征,给具有相似人格特征的人进行个性化物品推荐;
构建的神经网络也是由很多个卷积构成的,构建过程其实也就是数据的训练过程;具体分为三层:
(4.1)输入层就是将用户数据提取出来的关键词输入;
(4.2)隐含层是重点,把所提取的这些数据带入卷积公式得到具备此类人格特征的用户和这类具备这些关键词的音乐/食品的权重值,权重值就是表示关联度的大小,反复卷积就是下一个用户是在前一个的基础上进行卷积,也就是经过很多次之后得到一个相互关联的神经网,加上偏置和激活函数,如果输出不是最后一层就是继续卷积加权;
(4.3)输出层:直至输出是最后一层,就可以经过前面的计算得到权重值相对较高的输出结果,也就是我们要推荐的最符合的内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811584347.XA CN109766493B (zh) | 2018-12-24 | 2018-12-24 | 一种在神经网络下结合人格特征的跨域推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811584347.XA CN109766493B (zh) | 2018-12-24 | 2018-12-24 | 一种在神经网络下结合人格特征的跨域推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109766493A CN109766493A (zh) | 2019-05-17 |
CN109766493B true CN109766493B (zh) | 2022-08-02 |
Family
ID=66451552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811584347.XA Active CN109766493B (zh) | 2018-12-24 | 2018-12-24 | 一种在神经网络下结合人格特征的跨域推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109766493B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291274A (zh) * | 2020-03-02 | 2020-06-16 | 苏州大学 | 一种物品推荐方法、装置、设备及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
CN107480773A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 训练卷积神经网络模型的方法、装置及存储介质 |
CN107895303A (zh) * | 2017-11-15 | 2018-04-10 | 电子科技大学 | 一种基于ocean模型的个性化推荐的方法 |
CN108492200A (zh) * | 2018-02-07 | 2018-09-04 | 中国科学院信息工程研究所 | 一种基于卷积神经网络的用户属性推断方法和装置 |
CN109063163A (zh) * | 2018-08-14 | 2018-12-21 | 腾讯科技(深圳)有限公司 | 一种音乐推荐的方法、装置、终端设备和介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3204896A1 (en) * | 2014-10-07 | 2017-08-16 | Google, Inc. | Training neural networks on partitioned training data |
-
2018
- 2018-12-24 CN CN201811584347.XA patent/CN109766493B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
CN107480773A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 训练卷积神经网络模型的方法、装置及存储介质 |
CN107895303A (zh) * | 2017-11-15 | 2018-04-10 | 电子科技大学 | 一种基于ocean模型的个性化推荐的方法 |
CN108492200A (zh) * | 2018-02-07 | 2018-09-04 | 中国科学院信息工程研究所 | 一种基于卷积神经网络的用户属性推断方法和装置 |
CN109063163A (zh) * | 2018-08-14 | 2018-12-21 | 腾讯科技(深圳)有限公司 | 一种音乐推荐的方法、装置、终端设备和介质 |
Non-Patent Citations (2)
Title |
---|
hands-off therapist robot behavior adaptation to user personality for post-stroke rehabilitation therapy;Adriana Tapus等;《proceedings 2007 ieee international conference on robotics and automation》;20070414;1547-1553 * |
基于协同过滤的电子商务个性化推荐的研究与分析;翟烁;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160315(第3期);I138-7744 * |
Also Published As
Publication number | Publication date |
---|---|
CN109766493A (zh) | 2019-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Connecting social media to e-commerce: Cold-start product recommendation using microblogging information | |
Yin et al. | Mobile marketing recommendation method based on user location feedback | |
Cai et al. | Detecting social bots by jointly modeling deep behavior and content information | |
CN107077486A (zh) | 情感评价系统和方法 | |
CN109034960B (zh) | 一种基于用户节点嵌入的多属性推断的方法 | |
CN105893609A (zh) | 一种基于加权混合的移动app推荐方法 | |
CN113918833B (zh) | 通过社交网络关系的图卷积协同过滤实现的产品推荐方法 | |
CN113918832B (zh) | 基于社交关系的图卷积协同过滤推荐系统 | |
CN113918834B (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
CN107368499B (zh) | 一种客户标签建模及推荐方法及装置 | |
Liu et al. | Online recommendations based on dynamic adjustment of recommendation lists | |
Dai et al. | BTR: a feature-based Bayesian task recommendation scheme for crowdsourcing system | |
CN109766493B (zh) | 一种在神经网络下结合人格特征的跨域推荐方法 | |
Zhao et al. | Personalized recommendation by exploring social users’ behaviors | |
Kumar et al. | Cuisine prediction based on ingredients using tree boosting algorithms | |
Zhao et al. | A Hierarchical Attention Recommender System Based on Cross‐Domain Social Networks | |
Barkan et al. | Modelling Session Activity with Neural Embedding. | |
Yu et al. | FedNRM: A federal personalized news recommendation model achieving user privacy protection | |
Yang et al. | Dynamic slide window-based feature scoring and extraction for on-line rumor detection with CNN | |
CN115525819A (zh) | 一种面向信息茧房的跨领域推荐方法 | |
Nguyen et al. | Collaborative multi-key learning with an anonymization dataset for a recommender system | |
Sadreddin et al. | Chunk-based incremental feature learning for credit-card fraud data stream | |
Ai et al. | Towards better personalization: A meta-learning approach for federated recommender systems | |
Ling et al. | Extracting implicit friends from heterogeneous information network for social recommendation | |
Permatasari et al. | Features Selection for Entity Resolution in Prostitution on Twitter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |