CN107180028A - 一种基于lda与退火算法组合的推荐技术 - Google Patents
一种基于lda与退火算法组合的推荐技术 Download PDFInfo
- Publication number
- CN107180028A CN107180028A CN201610130800.4A CN201610130800A CN107180028A CN 107180028 A CN107180028 A CN 107180028A CN 201610130800 A CN201610130800 A CN 201610130800A CN 107180028 A CN107180028 A CN 107180028A
- Authority
- CN
- China
- Prior art keywords
- documents
- document
- algorithm
- theme
- lda
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000137 annealing Methods 0.000 title claims abstract description 43
- 238000005516 engineering process Methods 0.000 title description 5
- 239000011159 matrix material Substances 0.000 claims abstract description 17
- 238000005070 sampling Methods 0.000 claims abstract description 7
- 238000011156 evaluation Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000010076 replication Effects 0.000 claims description 2
- 238000010835 comparative analysis Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 6
- 230000032683 aging Effects 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于LDA(Latent Dirichlet Allocation)与退火算法的组合推荐算法,用于法律网站上的文档智能推荐系统上。包括步骤:首先对历史浏览文档进行分析,采用Gibbs抽样构建主题—文档矩阵和主题—词矩阵,得到历史浏览文档的多维主题分布Φnew,从多维主题分布Φnew中抽出k个具有高峰分布的主题作为这些文档的代表主题{zk}rep;然后采用一次退火算法在所有文档中筛选出在代表主题上的分布满足一定条件的历史文档作为备选文档;再采用第二次不同的退火算法从这些备选文档中筛选出来h篇与历史浏览文档在对应的代表主题上有较高相似度的文档作为最终推荐文档。最后进行模型评价,将本发明所提出的算法与单独使用LDA模型推荐算法进行对比分析。经验证,本发明提出的算法无论在性能上还是运行速度上都比单独使用LDA模型有所提高。
Description
技术领域
本发明涉及商务网站的一种基于文档内容推荐的技术领域,特别涉及一种基LDA模型与退火算法组合的推荐算法。
背景技术
从互联网的诞生开始,各类信息技术迅猛发展,电子商务、网上服务等网络业务越来越普及,当然,这些网络业务积累的信息也越来越庞大,用户想从这海量的信息中快速准确地寻找到自己感兴趣的信息已经变得越来越困难。为了解决这个问题,百度、Google等搜索引擎就应运而生了,客户可以方便地针对自己想要的快速搜索到相关信息。但是,在客户无法准确描述自己需求时,即不清楚自己所要信息的关键词时,搜索引擎就无能为力了。
且在实际上,用数学语言描述需求:我们的需求并不是绝对的只是有限的一个点,而往往是一个无边界的邻域,即对信息的需求往往没有明确界定边界。这是因为看似无关的信息间往往是存在藕断丝连关系的。简单来说,就是需求往往会衍生出需求。
如此,在这个信息时代中,便有商家悟到其中道理,从而根据客户的需求,向客户推荐出可能的需求。这便是推荐技术的中心思想。推荐技术使得客户在满足自己需求后发现自己一些潜在的需求,从而较全面的完成需求,而这同时也为商家带来一定利益,故而达到双赢。尽管现在的推荐算法多种多样,但是这个中心思想是不变的。
发明内容
本发明针对商务网站提出的一种基于文档内容的推荐技术,从文档内容的角度出发,对文档内容进行分类,提出结合基于文档内容LDA主题分析算法与退火算法,向用户推荐相似文档,供参考阅读。
本发明使用LDA算法,本质上是一种文档聚类的算法,通过提取文档主题,对各文档文档的主题分布进行研究,将主题分布偏离度低的文档聚为一类。如此通过用户浏览过的历史文档主题分析,找到与其同属一类的其他文档,可根据偏离度最低的文档对用户进行推荐文档。
文档选择了退火算法代替相似度的计算,依据这样一个事实:在实际应用推荐系统中,商品(本发明主要指文档文档)类目过多,因此构建的文档—词矩阵是一个具有高度稀疏性的矩阵,在计算相似度过程中,时间和空间复制度都很高。
所述的基于LDA与退火算法的组合推荐算法具体步骤如下:
1)采用Gibbs抽样构建主题—文档矩阵和主题—词矩阵,得到历史浏览文档的多维主题分布Φnew,从多维主题分布Φnew中抽出k个具有高峰分布的主题作为这些文档的代表主题{zk}rep
2)采用一次退火算法在所有文档中筛选出在代表主题上的分布满足一定条件的历史文档作为备选文档
3)再采用第二次不同的退火算法从这些备选文档中筛选出来h篇与历史浏览文档在对应的代表主题上有较高相似度的文档作为最终推荐文档。
4)模型评价,本发明选择的LDA算法与退火算法组合推荐模型与单独采用LDA主题分析模型进行了对比分析。
本发明提出的基于LDA算法与退火算法组合推荐模型,经验证(见后文算法),效果明显优于单独采用LDA主题分析模型。本发明文档选择了退火算法代替相似度的计算。退火算法本身,是一个简单的寻找近似全局最优的算法,操作简单方便,运行快捷,用来寻找有限篇文档的推荐非常合适。并且本发明采用了两次退火算法,第一次是筛选,第二次才是真正的寻优,如此安排在后面实验中也表明,运行时效和结果准确率都有所提高。
附图说明
图1本发明实施步骤流程图;
图2步骤1历史浏览文档主题词汇频数分布图;
图3步骤1历史未浏览文档1的主题词汇频数分布图 ;
图4步骤1历史未浏览文档2的主题词汇频数分布图;
图5本发明算法与传统算法的平均相似度曲线比较图;
图6本发明算法与传统算法的困惑度曲线比较图。
具体实施方式
具体步骤如下:
步骤1:采用Gibbs抽样构建主题—文档矩阵和主题—词矩阵,得到历史浏览文档的多维主题分布Φnew,从多维主题分布Φnew中抽出k个具有高峰分布的主题作为这些文档的代表主题{zk}rep
步骤2:采用一次退火算法在所有文档中筛选出在代表主题上的分布满足一定条件的历史文档作为备选文档
步骤3:再采用第二次不同的退火算法从这些备选文档中筛选出来h篇与历史浏览文档在对应的代表主题上有较高相似度的文档作为最终推荐文档。
步骤4:模型评价,本发明选择的LDA算法与退火算法组合推荐模型与单独采用LDA主题分析模型进行了对比分析。
本发明提出的基于LDA算法与退火算法组合推荐模型,经验证(见后文算法),效果明显优于单独采用LDA主题分析模型。本发明文档选择了退火算法代替相似度的计算。退火算法本身,是一个简单的寻找近似全局最优的算法,操作简单方便,运行快捷,用来寻找有限篇文档的推荐非常合适。并且本发明采用了两次退火算法,第一次是筛选,第二次才是真正的寻优,如此安排在后面实验中也表明,运行时效和结果准确率都有所提高
所述的步骤1具体说明如下:
抽取文档数据如下表所示:
对文档主题建模的方法便是将主题视为词汇的概率分布。假设有K个主题、、…、,文档中第j个词汇取自主题,则词在文档中的出现概率为:
(式1)
若假设这K个主题形成M篇文档,共有W个词汇,则记表示W个词汇在主题上的分布,该分布服从多项式分布,其中w为W个词汇中的一个;而记表示K个主题在文档上的分布,该分布也服从多项式分布,其中z为K个主题中的一个。则词汇w在文档中的出现概率为:
(式2)
对主题变量抽样。对应目标概率分布函数便是词汇对于主题的后验分布,计算公式如下:
(式3)
关于上述符号说明如下:
上述后验概率分布公式中i=(m,n)是一个二维下标,对应的是第m篇文档的第n个词,zi
就表示这个词对应的主题。而用/i表示去除下标为i的词,故:
表示在语料库中,分配给主题的下标为i的词的频数;
表示在语料库中,分配给主题的所有词的频数和(为唯一性词);
表示在文档中,分配给主题的所有词的频数和;
表示在文档中,分配给该文档的所有词的频数和。
而为β的估计量,为α的估计量。
Gibbs抽样算法过程简述如下:
(1)初始化zi为1到K之间的某个随机整数k,i从(1,1)循环到(M,NM),M是文档的总篇数,NM是第M篇文档的词数(即是所有词汇的频数和)。
(2)根据(式3)按i从(1,1)循环到(M,NM)将下标为i的词汇赋予主题zi,获取算法链(马尔科夫链)的下一个状态。
(3)对(2)迭代一定次数后,取i从(1,1)循环到(M,NM)的每个zi的当前值记录为样本。
由(3)得到的样本可以统计得到一个主题与词汇共现的频数分布矩阵,该矩阵就是LDA模型,如下矩阵表1:
其中,N为单一性词汇数,n(K,N)表示为,即是分配给主题K的词汇的频数。
同时也可以统计得到文档与主题共现的频数分布矩阵,如下表2:
其中,n(M,K)表示为,即是文档中分配给主题K的所有词汇的频数和。则如表1、2所示,以每个单一主题样本列可以按下式估算参数φ和ψ的值:
(式4)
其中,表示语料库中,分配给主题k的任意词汇wi的频数,即表1中的n(k,i);
表示语料库中,分配给主题k的所有词汇w的频数和,即;
表示文档dm中,分配给主题k的所有词汇的频数和,即表2中的n(m,k);
表示文档dm中,分配给所有主题的所有词汇的频数和,即是。
有了LDA模型,我们可以再根据(式3)对历史浏览文档中的每一个词按照上述gibbs抽样过程对历史浏览文档进行主题分析,从而得到历史浏览文档的主题与词汇频数分布矩阵。
所述的步骤2的子步骤具体说明如下:
本发明在得到文档主题分布后,先采用一次退火算法根据主题分布从所有未浏览文档中筛选出与历史浏览文档有相似主题高峰分布的文档,如此大大降低文档基数,以便第二次退火算法的运行。
退火算法过程如下:
(1)采用带有记忆的退火算法确定历史浏览文档主题分布中的几个高峰的峰值主题:如图1,历史浏览文档有5个高峰分布区间,它们对应的峰值主题分别为:k(x1)、k(x2)、k(x3)、k(x4)、k(x5)。其中x1<x2<x3<x4<x5是主题编号1、2、…、K中的数。
该步骤是采用有记忆的退火算法,在寻找最优的过程保留每个局部最优,最后可得到峰值比较式:k(x3)>k(x1)>k(x4)>k(x2)>k(x5)。如图2所示
(2)确定历史浏览文档的代表主题:
先判断最大峰值n(k(x3))是否大于等于上界,若是,则进行以下(2.1)。若不,则进行以下(2.2)。
(2.1)判断最小峰值k(x5)是否大于等于上界,若小于则舍去该峰值k(x5),继续判断排序第四的峰值k(x2)是否大于等于上界,若小于则舍去,继续判断排序第三的峰值k(x4)是否大于等于上界,若小于则舍去,继续判断排序第二的峰值k(x1) 是否大于等于上界,若小于则舍去。最后剩下排序第一的峰值k(x3),显然该峰值是大于等于上界的,且该峰值附近很大可能存在频数值大于上界的主题,故可在该峰值主题左右选出四个依次小于该峰值的频数值对应的主题k(y1)、k(y2)、k(y3)、k(y4),同样判断这些频数值是否大于上界,小于等于的则舍去,保留下来的主题加上第一峰值k(x3)共同作为该历史浏览文档的代表主题{z5}rep。
若最小峰值k(x5)大于等于上界,则这五个峰值主题共同作为历史浏览文档的代表主题{z5}rep;若排序第四的峰值k(x2)大于等于上界,则在第一峰值k(x3)左右取一个依次小于k(x3)的频数值对应的主题。如此类推下去。
说明:这里的上界即是箱形图里的上界。
(2.2)按照(2.1)将上界换成上四分位数进行。
假设得到历史浏览文档的代表主题就是k(x3)、k(x1)、k(x4)、k(x2)、k(x5)。
(3)从历史文档中筛选出相关文档:根据历史浏览文档的代表主题,对历史文档做如下筛选:依次判断历史文档的主题k(x3)、k(x1)、k(x4)、k(x2)、k(x5)的频数值是否大于该分档词汇频数值的上四分位数,只要其中一个满足,则将该历史文档筛选出来作为推荐的备选文档。
所述的步骤3的子步骤具体说明如下:
采用退火算法确定与历史浏览文档最相似的历史文档组合:假设备选文档有L篇,要从中选取h篇作为历史浏览文档的最相似推荐,其中1<h<L。则有C(L,h)种组合法。但采用退火算法则显然不用每种都尝试,下面是退火算法的应用过程:
(1)确定目标函数:设历史浏览文档与备选文档di对应的代表主题和非代表主题分别求余弦相似度和,对前者赋予权值0.7,后者赋予权值0.3,则历史浏览文档与备选文档的相似程度为:
(式5)
则退火算法的目的就是寻找推荐的h篇文档的相似程度和最大,故退火算法的目标函数为:
(式6)
令t表示第t次组合St。
(2)初始化:
取初始解S0为备选文档中依次的前h篇;
取初始状态T0=-1,衰减函数λ=0.95,Ti=λTi-1;
(3)确定随机移动准则:
本发明采用metropolis准则,随机移动接受概率如下:
(式7)
(4)新解产生方式:
随机从1到h中取两个数s和g,然后从当前解以外的所有文档中随机抽取两篇文档代替这两个随机数对应的文档构成新解,根据目标函数和随机移动准则对新解进行分析接受情况并对所得到的目标函数值对应新解记忆保留,循环直至接受概率趋近0时,取所有得到的目标函数值中最大的值对应的组合解作为最终解。
以下是两种与历史浏览文档相似度不同的文档图示,图2的文档doc(x)与历史浏览文档的相似性比图3的文档doc(y)高。
所述的步骤4具体说明如下:
如下表所示(按相似度降序排序):
下面便采用平均相似度分析两种不同算法推荐出的各文档与原文档的主题相似度,以及用困惑度分析推荐文档的混乱程度,以此评估两种算法模型的性能。混乱程度越小,说明文档符合推荐文档的概率越大,推荐算法模型的性能更优。
平均相似度公式如下所示:
(式8)
其中,是原文档的第i个主题;
是推荐文档中序号为j的文档的第i个主题。
(式8)中的采用(式5)的加权余弦相似度,这是因为所要比较的是相关文档具有主要性和直观性的主题的相关性,而不是潜在性的主题的相关性。
困惑度公式如下所示:
(式9)
其中,是推荐文档dj的概率,为所有推荐文档出现率的归一值,而是它对应的文档长度在推荐文档中的归一值,归一处理如下:
所求得的两种算法模型的平均相似度曲线如图5所示。本发明算法所求的平均相似度都明显高于普通算法所求的,这说明在针对有代表性的主要主题,本发明采用的算法是具有更高的准确性的
困惑度越小表明模型对文档的预测能力越强,泛化性能也越强。由图6可见,两种算法模型的困惑度在后面趋于平稳,而推荐篇数超过2后,本发明算法模型的困惑度明显小于普通算法,而且本发明算法模型的困惑度曲线整体较平稳,不像普通算法模型的困惑度曲线一样跨度大。这验证了本发明算法模型的推荐性能比普通算法的好。
综上所述,本发明提出的一种基于LDA与退火算法的组合推荐算法在文档推荐上是较高效的。该算法针对文档,根据LDA对历史文档的主题分析,得到历史浏览文档的多维主题分布Φnew,从多维主题分布Φnew中抽出具有高峰分布的主题作为该历史浏览文档的代表主题,然后采用一次退火算法在所有文档中筛选出在代表主题上的分布满足一定条件的历史文档作为备选文档,然后在采用第二次不同的退火算法从这些备选文档中筛选出来h篇与历史浏览文档在对应的代表主题上有较高相似度的文档作为最终推荐文档。经验证,本发明所提出的算法无论在性能上还是运行速度上都高于普通算法。
Claims (4)
1.一种基于LDA(Latent Dirichlet Allocation)与退火算法的组合算法,用于法律网站上文档的智能推荐,其特征包括以下步骤:
1)、采用Gibbs抽样构建主题—文档矩阵和主题—词矩阵,得到历史浏览文档的多维主题分布Φnew,从多维主题分布Φnew中抽出k个具有高峰分布的主题作为这些文档的代表主题{zk}rep;
2)、采用一次退火算法在所有未浏览的文档中筛选出在代表主题上的分布满足一定条件的历史浏览文档作为备选文档;
3)、再采用第二次不同的退火算法从这些备选文档中筛选出来h篇与历史浏览文档在对应的代表主题上有较高相似度的文档作为最终推荐文档,模型评价,将本发明所提出的算法与单独使用LDA模型推荐算法进行对比分析。
2.根据权利要求1所述一种基于LDA(Latent Dirichlet Allocation)与退火算法的组合推荐算法,其特征在于,选择了退火算法代替传统的文档相似度的计算,依据这样一个事实:在实际应用推荐系统中,商品(文档)类目过多,因此构建的文档—词矩阵是一个具有高度稀疏性的矩阵,在计算相似度过程中,时间和空间复制度都很高。
3.根据权利要求1所述一种基于LDA(Latent Dirichlet Allocation)与退火算法的组合推荐算法,其特征在于,根据历史浏览文档的主题分布情况,从所有未阅读的文档中筛选出与已浏览文档具有相似高峰分布的主题的备选文档,如此大大降低文档基数,提高了推荐效率。
4.根据权利要求1所述一种基于LDA(Latent Dirichlet Allocation)与退火算法的组合推荐算法,模型评价,通过本发明算法与单独采用LDA主题分析模型进行了对比分析,选择主题平均相似度和文档困惑度来评价模型的综合性能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610130800.4A CN107180028A (zh) | 2016-03-09 | 2016-03-09 | 一种基于lda与退火算法组合的推荐技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610130800.4A CN107180028A (zh) | 2016-03-09 | 2016-03-09 | 一种基于lda与退火算法组合的推荐技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107180028A true CN107180028A (zh) | 2017-09-19 |
Family
ID=59830400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610130800.4A Withdrawn CN107180028A (zh) | 2016-03-09 | 2016-03-09 | 一种基于lda与退火算法组合的推荐技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107180028A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763484A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于lda主题模型的法条推荐方法 |
CN109446320A (zh) * | 2018-09-29 | 2019-03-08 | 昆明理工大学 | 一种基于lda的生物医药技术主题挖掘方法 |
CN109709916A (zh) * | 2018-12-20 | 2019-05-03 | 宁波大学 | 一种基于Gibbs取样法的调度方法 |
CN113988087A (zh) * | 2021-10-26 | 2022-01-28 | 北京智谱华章科技有限公司 | 技术主题多指标计算及趋势预测方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577579A (zh) * | 2013-11-08 | 2014-02-12 | 南方电网科学研究院有限责任公司 | 基于用户潜在需求的资源推荐方法及系统 |
CN103823848A (zh) * | 2014-02-11 | 2014-05-28 | 浙江大学 | 一种基于lda和vsm的中草药相似文献的推荐方法 |
CN104850814A (zh) * | 2015-05-14 | 2015-08-19 | 上海交通大学 | 融合二维码的图像优化处理方法 |
-
2016
- 2016-03-09 CN CN201610130800.4A patent/CN107180028A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577579A (zh) * | 2013-11-08 | 2014-02-12 | 南方电网科学研究院有限责任公司 | 基于用户潜在需求的资源推荐方法及系统 |
CN103823848A (zh) * | 2014-02-11 | 2014-05-28 | 浙江大学 | 一种基于lda和vsm的中草药相似文献的推荐方法 |
CN104850814A (zh) * | 2015-05-14 | 2015-08-19 | 上海交通大学 | 融合二维码的图像优化处理方法 |
Non-Patent Citations (1)
Title |
---|
李婧 等: "嫦娥三号软着陆轨道设计与控制策略", 《黑龙江科技信息》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763484A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于lda主题模型的法条推荐方法 |
CN109446320A (zh) * | 2018-09-29 | 2019-03-08 | 昆明理工大学 | 一种基于lda的生物医药技术主题挖掘方法 |
CN109709916A (zh) * | 2018-12-20 | 2019-05-03 | 宁波大学 | 一种基于Gibbs取样法的调度方法 |
CN113988087A (zh) * | 2021-10-26 | 2022-01-28 | 北京智谱华章科技有限公司 | 技术主题多指标计算及趋势预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598086B (zh) | 文章推荐方法、装置、计算机设备及存储介质 | |
KR102019194B1 (ko) | 문서 내 핵심 키워드 추출 시스템 및 방법 | |
WO2017000610A1 (zh) | 一种网页分类的方法和装置 | |
US8533203B2 (en) | Identifying synonyms of entities using a document collection | |
US9176969B2 (en) | Integrating and extracting topics from content of heterogeneous sources | |
CN108228541B (zh) | 生成文档摘要的方法和装置 | |
CN110019794B (zh) | 文本资源的分类方法、装置、存储介质及电子装置 | |
US20100131496A1 (en) | Predictive indexing for fast search | |
CN107180028A (zh) | 一种基于lda与退火算法组合的推荐技术 | |
Clarke et al. | Assessing efficiency–effectiveness tradeoffs in multi-stage retrieval systems without using relevance judgments | |
Babu et al. | An implementation of the user-based collaborative filtering algorithm | |
Zhang et al. | An efficient recommender system using locality sensitive hashing | |
Acharya et al. | Gamma process Poisson factorization for joint modeling of network and documents | |
Lumauag et al. | An enhanced recommendation algorithm based on modified user-based collaborative filtering | |
CN116010681A (zh) | 一种召回模型的训练及检索方法、装置及电子设备 | |
Zhuang et al. | Data summarization with social contexts | |
Celikyilmaz et al. | Leveraging web query logs to learn user intent via bayesian latent variable model | |
Ramadhan et al. | Collaborative filtering recommender system based on memory based in twitter using decision tree learning classification (case study: Movie on netflix) | |
Obiedat | Predicting the popularity of online news using classification methods with feature filtering techniques | |
Song et al. | Research on personalized recommendation system based on association rules | |
CN108509449B (zh) | 一种信息处理的方法及服务器 | |
Lin et al. | Association rule mining with a correlation-based interestingness measure for video semantic concept detection | |
Meng et al. | Variational Bayesian representation learning for grocery recommendation | |
Harakawa et al. | Extraction of hierarchical structure of Web communities including salient keyword estimation for Web video retrieval | |
Rapečka et al. | A new recommendation model for the user clustering-based recommendation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20170919 |