CN110110220A - 融合社交网络和用户评价的推荐模型 - Google Patents
融合社交网络和用户评价的推荐模型 Download PDFInfo
- Publication number
- CN110110220A CN110110220A CN201810642787.XA CN201810642787A CN110110220A CN 110110220 A CN110110220 A CN 110110220A CN 201810642787 A CN201810642787 A CN 201810642787A CN 110110220 A CN110110220 A CN 110110220A
- Authority
- CN
- China
- Prior art keywords
- user
- businessman
- community
- comment
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 15
- 230000004927 fusion Effects 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 3
- 239000013598 vector Substances 0.000 claims description 23
- 238000000034 method Methods 0.000 claims description 19
- 238000012417 linear regression Methods 0.000 claims description 18
- 238000012512 characterization method Methods 0.000 claims description 11
- 239000002131 composite material Substances 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims 2
- 238000002203 pretreatment Methods 0.000 claims 1
- 230000001373 regressive effect Effects 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 238000007418 data mining Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 abstract 1
- 238000012549 training Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及融合社交网络和用户评价的推荐模型。为了反映用户社交关系对用户决策的影响并提高推荐结果的精确度,提出了一种融合社交网络和用户评分评论数据的推荐模型。该模型通过文本处理技术和数据挖掘算法,从评论中提取主题信息作为用户和商家的特征,利用社区发现算法为用户划分社区,最后利用机器学习方法对社区进行建模并进行推荐。该模型既考虑了用户个体的偏好,又包含了社区用户的整体特征,能够给社区用户提供个性化的推荐。
Description
技术领域
为了解决互联网信息过载的问题,使得用户更迅速地找到感兴趣的信息,推荐系统被广泛应用在电子商务、新闻资讯、电影和音乐等方面。本发明涉及推荐系统的文本处理、社区发现和评分预测方法,提出了一种融合社交网络和用户评分评论数据的推荐模型。
背景技术
传统的推荐系统主要考虑用户的评分或物品的属性数据,采用基于协同过滤或者基于内容的推荐算法来生成推荐结果。其中基于协同过滤的推荐算法应用最为广泛,其又可分为基于用户的、基于物品的和基于模型的。最早的协同过滤推荐系统GroupLens是基于用户的。随后基于物品的推荐算法出现并被应用于Amazon网络书城和YouTube视频网站。在Netflix Prize中取得很好成绩的基于模型算法被应用于Netflix的视频推荐系统中。传统的推荐算法精确度较低、可解释性差且存在冷启动问题。为了解决这些问题,当前推荐模型往往融合多种数据进行推荐。
本发明为了提高传统算法的精确度,融合了用户评分、评论和社交网络数据,来更好地挖掘用户的偏好和商家的属性。为了处理这些数据,建立了融合了自然语言处理、社区发现和机器学习算法的推荐模型。通过话题模型抽取评论中包含的用户和商家特征并利用好友关系划分用户社区,然后以社区为单位,基于机器学习算法训练社区用户对商品的评分模型。最后使用用户所在社区的模型来预测该用户对不同商品的评分。话题模型提高了用户偏好和商家属性的可解释性和精确度,社交网络的引入使得推荐系统可以面向用户群进行推荐,降低了算法复杂度和冷启动风险。
发明内容
为了提高推荐结果的精确度,结合了用户的评价信息和社交网络。其中,评价信息包含了评分信息和评论信息。本发明引入了自然语言处理算法挖掘评论信息、社区发现算法分析用户关系、机器学习算法训练预测模型。
上述方法包含了如下步骤:
(1)文本特征提取:通过随机划分,评价信息被分为了训练集和测试集,使用话题模型分析训练集,从而得到用户和商家的特征信息;
(2)特征生成:叠加每个用户和每个商家的每条评论特征就可以表示用户和商家的个体特征;
(3)社区发现:基于社区发现算法将社交网络划分为社区
(4)社区模型训练:结合机器学习模型,将每个社区内评论的特征作为输入,评论的分数作为标签,训练出社区模型。
(5)社区模型预测:步骤(2)中生成的用户和商家特征输入步骤(4)的社区模型进行预测
步骤如图1所示。
在步骤(1)文本特征提取中,包括如下四个个步骤:
①建立评价索引
为了建立评价索引,先将所有用户和商家按照名称排序,并将用户和商家的ID转换为升序的数字。这样就能够通过来查找评论。若用户对同一商家有多条评论,则合并为一条评论,评分取平均。假设有商家M家用户N人,则建立一个M×N的评价矩阵。
②分词
为了分析每条评论的语义特征,需要将句子分解为词。英文单词天然被空格隔开,很容易被转换为词语集合。汉语没有分隔符,所以需要借助分词工具将句子分解为词语。
③提取特征词
当评论被分解为词语以后,将标点符号和没有很大意义并且频繁出现的停止词去除。去除以后,特征词就被存在数组中了。这是数组中包含了重复的词语。
④词频统计
计算每个词出现的次数并删除重复出现的词语。最后将词语数组转换成向量形式,作为话题模型的输入。
步骤(2)特征生成包括如下三个步骤:
①话题提取
隐狄利克雷分配模型(LDA)是一种常用的话题模型,它在信息检索和自然语言处理中有着广泛的应用。使用LDA将一段评论转换为设定维数的向量形式,通过调节话题数K,生成维度为K的特征向量来对评论进行不同的表示。K值越大,话题数越多,对评论的表示也更加准确,但是计算时间也随之上升。
②用户特征生成
用户的评论表达了用户的观点,所以从用户评论中提取的话题可以代表用户特征。用户的特征通过用户所有评论的特征相加并归一化得到。用户特征因子向量的维数和话题模型中设置的话题数相同。
③商家特征生成
同理,商家的特征可以通过商家收到的评论表现出来,所以将商家收到的评论的话题分布向量相加并归一化,得到商家的特征因子。
步骤(3)中使用了社区发现算法来划分社区。模块度是用来衡量社区划分好坏的指标,通过最大化模块度Q来寻找用户最优的社区。采用合并两个社区后,模块度的变化来确定社区的划分边界。
根据社区划分算法,社交网络被划分为多个社区,从而为同社区用户建立社区模型。定义C为所有社区的集合,那么:
C={C1,...,Cn}
集合中每个元素代表了社交网络中的一个用户社区。
在步骤(4)社区模型训练中,利用步骤(3)中的社区划分结果,将每个社区中的用户的评论的特征向量作为输入,此条评论的评分作为标签来训练社区线性回归模型。不断迭代得到具有不同权重和偏差的社区线性回归模型。
步骤(5)为评分的预测。用户对商家的评分与用户和商家双方的特征有关,所以需要叠加双方的特征来预测评分。若用户和商家某话题的频率都比较高,归一化以后会得到更高的概率,反之某话题的频率都比较低则概率较低。通过这种方法,用户和不同商家之间混合特征被计算出来。通过用户所属社区c,找到对应的线性回归模型,从而预测用户对每个商家的评分。
附图说明
图1为融合社交网络和用户评分评论数据的推荐模型的流程图。
具体实施方式
根据说明书中的方法介绍,实施融合社交网络和用户评价数据的推荐模型需要如下步骤:
(1)文本特征提取
①建立索引
②分词
③提取特征词
④词频统计
(2)特征生成
①话题提取
②用户特征生成
③商家特征生成
(3)社区发现
(4)社区模型训练
(5)预测和评价
①回归模型评价
②社交发现评价
除了说明书中的步骤外,还需要对模型结果进行评价,以保证结果的可靠性。
实施本模型时,首先要获取用户的社交网络和用户对商家的评价数据,才能进行推荐。
在实施的过程中,通过以下步骤进行(1)文本特征提取:
①数据加载
使用Spark数据处理工具,将数据加载到内存中。
②数据过滤
使用Spark的过滤方法将有评论的数据过滤出来。
③数字化用户和商家ID
将用户和商家的String类型的ID转换为唯一的数字。
④评论分词
使用空格为分隔符,将词语储存在词库中。
⑤评论词转换为具有词索引和频率的向量形式
例如,有一个评论:
“Given the high quality of the produce,the prices are also quitehigh”
将其中的标点和停用词去除后可以转换为词的数组:
[given,high,quality,produce,prices,also,quite,high]
计算每个词语出现的次数,发现high出现了2次,其余的词语出现了1次,然后将重复的词语删除,转换成向量形式为:
[7,[0,1,2,3,4,5,6],[1.0,2.0,1.0,1.0,1.0,1.0,1.0]]
向量的第一维表示的是数组中有七个词,第二维表示的是这些词的索引,第三位表示的是出现的频率。有了这个向量就可以索引到每一个词并计算它在评论中出现的概率。
在实施过程中,通过以下步骤进行(2)特征生成:
①将词频信息输入LDA模型,得到每条评论的话题分布
θui=(θui1,…,θuik),k∈[1,...,K]
其中θui表示的是用户u对商家i的评论;
k代表的是话题;
θuik表示的是用户u对商家i的评论中出现话题k的概率。
②利用评论的话题分布,使用用户和商家特征因子生成方法,生成用户和商家特征因子。
使用特征因子生成算法进行计算:
k∈[1,...,K]
其中Du表示用户u所有的评论数;
p′uk表示的是用户在话题k上的总概率;
puk是其归一化的表示。
那么用户u的特征因子可以表示为:
pu=(pu1,...,puk)
其中,q′ik表示的是商家在话题k上的总概率,Di表示商家i所有的评论数,θuik表示用户u在第i个
商家上的评论的话题分布向量的第k维。q′ik的归一化表示为:
得到商家的特征因子为:
qi=(qi1,...,qik)
在实施过程中,通过以下步骤进行(3)社区发现:
①从数据中提取的好友关系
将好友关系储存在邻接矩阵中,方便社区发现算法处理。
②将用户邻接矩阵输入CNM社区发现算法,得到每个用户所属的社区
在实施过程中,通过以下步骤进行(4)社区线性回归训练:
①将属于同一社区的用户评论输入线性回归模型进行训练
评分和评论特征向量的关系可以表示为:
rui=WTθui+∈ui
其中W=(W1,...,WK)为话题的权重向量,代表了每个话题的重要程度;
rui为用户u对商家i的评分;
θui表示的是用户u对商家i的评论的特征向量;
∈ui是线性回归模型中的常数偏差。
通过最小化代价函数就能求得W和∈ui:
其中||Wc||2为L2惩罚函数;
λ为惩罚函数参数,λ越大则泛化能力越强,但也可能导致精确度下降。
②调整模型参数,得到每个社区的线性回归模型,最终社区模型如下:
代表社区CN的线性模型的权重向量;
θui表示的是对应社区的用户u对商家i的评论的特征向量;
表示了对应社区模型中用户u对商家i的评分。
在实施过程中,通过以下步骤进行(5)预测和评价:
①查询测试数据中的用户商家对应的特征并相乘,得到混合特征
本发明使用用户和商家特征因子相乘的方法得到混合特征:
θ'uij=pujqij
其中用户和商家的混合特征为θ′uij;
归一化得到
θui为用户和商家的混合特征因子,根据每一个话题维度的特征就能得到。
②找到用户的社区模型,将混合特征输入模型得到预测结果
③使用均方根误差(RMSE)作为评价标准
④对比使用不同的话题个数K和使用社交网络前后RMSE的变化。
Claims (8)
1.融合社交网络和用户评价的推荐模型,其特征主要在于文本评论数据的处理和话题聚类,用户和商家的特征因子生成和融合社区发现算法的回归预测模型,上述的方法包含了以下步骤:
(1)评论数据的预处理;
(2)基于隐狄利克雷分配模型(LDA)的评论聚类;
(3)用户和商家的特征因子算法;
(4)融合社区信息的线性回归预测。
2.权利要求1中所描述的(1)评论数据预处理步骤,其特征在于,将网络中的文本评论数据通过分词、去除标点、去除无意义词语、词频统计的方法,将特征词索引及其词频用向量表示出来,每条文本评论数据被表示成为如下形式:
[词语个数,[词语索引],[词频]]。
3.权利要求1中所描述的(2)基于隐狄利克雷分配模型(LDA)的评论聚类步骤,其特征在于,使用权利要求1中步骤(1)所计算得到的词频,假设话题数被设定为K,那么每条文本被转换成K维话题分布向量。
4.权利要求1中所描述的(3)用户和商家特征因子算法,其包含了两部分:
①通过用户所有的评论的话题分布向量,计算用户的特征因子;
②通过商家收到的评论的话题分布向量,计算商家特征因子。
5.权利要求4中的部分①,通过用户评论的话题分布向量,计算用户的特征因子,用户特征因子计算公式为:
其中,p′uk表示的是用户在话题k上的总概率,Du表示用户u所有的评论数,θuik表示用户u在第i个商家上的评论的话题分布向量的第k维,p′uk的归一化的表示为:
最后得到的用户特征因子为:
pu=(pu1,...,puk) (式3);
权利要求4中的部分②,通过商家评论的话题分布向量,计算商家的特征因子,商家特征因子计算公式为:
其中,q′ik表示的是商家在话题k上的总概率,Di表示商家i所有的评论数,θuik表示用户u在第i个商家上的评论的话题分布向量的第k维,q′ik的归一化表示为:
得到商家的特征因子为:
qi=(qi1,...,qik) (式6);
以上的k都满足:
k∈[1,...,K]。
6.权利要求1中的步骤(4)融合社区信息的线性回归预测,其特征在于:
①使用社区发现算法将用户划分为不同社区;
②结合线性回归模型预测用户对商家的评分。
7.如权利要求6中第一个特征所述,其特征在于,原始的社交网络被处理为邻接矩阵,进而输入社区发现算法将用户划分为不同的社区,定义C为所有社区的集合,那么:
C={C1,...,CN} (式7);
其中n为算法设定的社区数量。
8.如权利要求6中第二个特征所述,其特征在于,对每个社区分别建立线性回归模型,N个具有不同权重和偏差的社区线性回归模型表示为:
其中为用户u对商家i评分的预测,为社区CN的总体特征权重,为社区的总体偏差,计算θui的方法为:
θ′uij=pujqij (式9);
θ′uij为用户和商家的混合特征,然后归一化得到使用K个话题特征维度就能构建用户商家的混合特征向量θui。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810642787.XA CN110110220B (zh) | 2018-06-21 | 2018-06-21 | 融合社交网络和用户评价的推荐模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810642787.XA CN110110220B (zh) | 2018-06-21 | 2018-06-21 | 融合社交网络和用户评价的推荐模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110110220A true CN110110220A (zh) | 2019-08-09 |
CN110110220B CN110110220B (zh) | 2021-06-01 |
Family
ID=67483305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810642787.XA Active CN110110220B (zh) | 2018-06-21 | 2018-06-21 | 融合社交网络和用户评价的推荐模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110220B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274497A (zh) * | 2020-01-22 | 2020-06-12 | 北京百度网讯科技有限公司 | 社区推荐及模型训练方法、装置、电子设备及存储介质 |
CN111368063A (zh) * | 2020-03-06 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 一种基于机器学习的信息推送方法以及相关装置 |
CN112685656A (zh) * | 2020-12-22 | 2021-04-20 | 航天信息股份有限公司 | 标签推荐方法及电子设备 |
CN116861101A (zh) * | 2023-06-30 | 2023-10-10 | 深圳市爱彼利科技有限公司 | 用于社交匹配的数据处理方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110126253A1 (en) * | 2009-11-20 | 2011-05-26 | At&T Intellectual Property I, L.P. | Apparatus and method for managing a social network |
CN103888541A (zh) * | 2014-04-01 | 2014-06-25 | 中国矿业大学 | 一种融合拓扑势和谱聚类的社区发现方法及系统 |
CN105282011A (zh) * | 2015-09-30 | 2016-01-27 | 广东工业大学 | 基于聚类融合算法的社交团体发现方法 |
-
2018
- 2018-06-21 CN CN201810642787.XA patent/CN110110220B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110126253A1 (en) * | 2009-11-20 | 2011-05-26 | At&T Intellectual Property I, L.P. | Apparatus and method for managing a social network |
CN103888541A (zh) * | 2014-04-01 | 2014-06-25 | 中国矿业大学 | 一种融合拓扑势和谱聚类的社区发现方法及系统 |
CN105282011A (zh) * | 2015-09-30 | 2016-01-27 | 广东工业大学 | 基于聚类融合算法的社交团体发现方法 |
Non-Patent Citations (1)
Title |
---|
MA H,ET AL: "An Integrative Social Network and Review Content Based Recommender System", 《JOURNAL OF INDUSTRIAL AND INTELLIGENT INFORMATION》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274497A (zh) * | 2020-01-22 | 2020-06-12 | 北京百度网讯科技有限公司 | 社区推荐及模型训练方法、装置、电子设备及存储介质 |
CN111274497B (zh) * | 2020-01-22 | 2023-08-18 | 北京百度网讯科技有限公司 | 社区推荐及模型训练方法、装置、电子设备及存储介质 |
CN111368063A (zh) * | 2020-03-06 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 一种基于机器学习的信息推送方法以及相关装置 |
CN111368063B (zh) * | 2020-03-06 | 2023-03-17 | 腾讯科技(深圳)有限公司 | 一种基于机器学习的信息推送方法以及相关装置 |
CN112685656A (zh) * | 2020-12-22 | 2021-04-20 | 航天信息股份有限公司 | 标签推荐方法及电子设备 |
CN116861101A (zh) * | 2023-06-30 | 2023-10-10 | 深圳市爱彼利科技有限公司 | 用于社交匹配的数据处理方法和装置 |
CN116861101B (zh) * | 2023-06-30 | 2024-03-29 | 深圳市爱彼利科技有限公司 | 用于社交匹配的数据处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110110220B (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573411B (zh) | 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 | |
Zhang et al. | Do users rate or review? Boost phrase-level sentiment labeling with review-level sentiment classification | |
Amara et al. | Collaborating personalized recommender system and content-based recommender system using TextCorpus | |
Jakob et al. | Beyond the stars: exploiting free-text user reviews to improve the accuracy of movie recommendations | |
CN105183833B (zh) | 一种基于用户模型的微博文本推荐方法及其推荐装置 | |
CN109684538A (zh) | 一种基于用户个人特征的推荐方法及推荐系统 | |
Akaichi | Social networks' Facebook'statutes updates mining for sentiment classification | |
CN109766431A (zh) | 一种基于词义主题模型的社交网络短文本推荐方法 | |
CN106599226A (zh) | 一种内容推荐方法及内容推荐系统 | |
CN110110225B (zh) | 基于用户行为数据分析的在线教育推荐模型及构建方法 | |
CN110110220A (zh) | 融合社交网络和用户评价的推荐模型 | |
CN112991017A (zh) | 基于用户评论解析的标签体系精准推荐方法 | |
Sharma et al. | SentiDraw: Using star ratings of reviews to develop domain specific sentiment lexicon for polarity determination | |
CN108228867A (zh) | 一种基于观点增强的主题协同过滤推荐方法 | |
CN109063147A (zh) | 基于文本相似度的在线课程论坛内容推荐方法及系统 | |
CN110569355B (zh) | 一种基于词块的观点目标抽取和目标情感分类联合方法及系统 | |
CN111061939A (zh) | 基于深度学习的科研学术新闻关键字匹配推荐方法 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
CN111259156A (zh) | 一种面向时间序列的热点聚类方法 | |
Aliane et al. | A genetic algorithm feature selection based approach for Arabic sentiment classification | |
CN106919997B (zh) | 一种基于lda的电子商务的用户消费预测方法 | |
CN109284381A (zh) | 融合表情符号库和主题模型的方面观点褒贬态度挖掘方法 | |
CN104572915B (zh) | 一种基于内容环境增强的用户事件相关度计算方法 | |
Kawamae | Supervised N-gram topic model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |