CN104077412A - 一种基于多Markov链的微博用户兴趣预测方法 - Google Patents
一种基于多Markov链的微博用户兴趣预测方法 Download PDFInfo
- Publication number
- CN104077412A CN104077412A CN201410334853.9A CN201410334853A CN104077412A CN 104077412 A CN104077412 A CN 104077412A CN 201410334853 A CN201410334853 A CN 201410334853A CN 104077412 A CN104077412 A CN 104077412A
- Authority
- CN
- China
- Prior art keywords
- markov chain
- microblog users
- interest
- class
- many
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 24
- 238000012360 testing method Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 abstract 1
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于多Markov链的微博用户兴趣预测方法,包括以下步骤:1、分别获取q个、p个用户发表的微博作为训练数据、测试数据;2、以用户为单位,对训练数据、测试数据进行预处理,提取每个用户的兴趣特征值;3、将训练数据转化为Markov链,再基于Markov链两两之间的聚类相似度,对Markov链进行合并,然后利用合并后的Markov链建立多Markov链模型;4、对测试数据进行用户分类;5、基于对测试数据分类得到的用户类别,利用多Markov链模型预测用户的兴趣特征。该方法可以有效预测微博用户的兴趣。
Description
技术领域
本发明涉及社交网络信息分析技术领域,特别是涉及一种基于多Markov链的微博用户兴趣预测方法。
背景技术
随着Web2.0技术和无线网络技术的发展,社交网络对人类社会和生活的影响越来越大。微博作为当今流行的一种社交网络平台,它为用户提供了一个实时交流平台。微博用户可以通过电脑或者移动终端关注自己感兴趣的信息,实时地获取各种网络资源,并发表个人观点等。
相关数据显示,我国微博用户数量由2010年底的6311万猛增至2012年6月的2.74亿,使用率增长近300%,中国网民使用微博的比例已经过半。如此庞大的用户数量群,其知识层次差别很大,所产生的网络信息良莠不齐、形式各异。同时,不同用户的信息需求也不尽相同。
发明内容
本发明的目的在于提供一种基于多Markov链的微博用户兴趣预测方法,该方法可以有效预测微博用户的兴趣。
为实现上述目的,本发明的技术方案是:一种基于多Markov链的微博用户兴趣预测方法,包括以下步骤:
步骤S1:获取q个微博用户发表或转发的微博信息作为训练数据,获取p个微博用户发表或转发的微博信息作为测试数据;
步骤S2:以微博用户为单位,对所述训练数据、测试数据进行预处理,从微博用户发表或转发的微博信息中提取每个微博用户对应的n个兴趣特征值,分别转换为文本向量;
步骤S3:将所述训练数据对应的q个微博用户作为独立的用户类别,每个微博用户利用其对应的n个兴趣特征值生成一条对应的Markov链,共得到q条Markov链,然后计算所述q条Markov链两两之间的聚类相似度,根据聚类相似度对Markov链进行合并,得到若干条合并后的Markov链,每一条合并后的Markov链对应一类微博用户,利用所有合并后的Markov链建立多Markov链模型;
步骤S4:利用最小错误率的贝叶斯判定规则,对所述测试数据对应的p个微博用户进行用户分类;
步骤S5:基于步骤S4确定的微博用户的用户类别,利用步骤S3建立的多Markov链模型预测微博用户的兴趣特征。
进一步的,步骤S1中,对训练数据、测试数据进行预处理包括中文分词和停用词处理,中文分词的方法为:采用中文分词系统,结合自定义的用户词典对微博信息进行分词,停用词处理的方法为:采用HashMap快速索引查表法对无用信息进行过滤,从而降低微博信息的噪音。
进一步的,步骤S3中,多Markov链模型的建立方法如下:
将多Markov链模型表示为一个四元组:(X, K, p(C), MC);
其中,X 是一个离散随机变量,值域为{x1, x2, …,xi,…, xn},每个xi对应一个微博用户的兴趣特征值,称为模型的一个状态;K 表示多Markov链模型包含的用户类别的数目;C={c1,c2,…,ck}表示用户类别,其分布函数p(C)表示不同类别用户的概率分布;MC={mc1, mc2, …, mck}为Markov链的集合,每一个元素mck是描述类别为ck的一类微博用户的兴趣特征值的Markov链;
类别为ck的一类微博用户的兴趣特征值的Markov链的转移矩阵Ak和初始状态分布λk分别为:
(1)
(2)
其中,pkij表示类别为ck的一类微博用户的兴趣特征值中兴趣xi和兴趣xj同时出现的概率,pki表示类别为ck的一类微博用户的兴趣特征值出现的初始状态分布;采用贝叶斯估计法计算转移矩阵Ak和初始状态分布λk中的pkij和pki:
(3)
(4)
其中,αkij为超级参数,采用贝叶斯假设确定其值;Skij表示类别为ck的所有用户的兴趣特征值序列中,状态对(xi, xj)出现的次数;
聚类相似度定义如下:
对于任意两个转移矩阵Ak、Al,设Ak、Al的第i行分别为pkij、plij,pki、pli都表示在给定X[t-1]=xi条件下变量X[t]的分布,即p(Xt|Xt-1= xi),则pki、pli的近似程度用它们的交叉熵CE(pki, pli)为:
(5)
则转移矩阵Ak、Al的聚类相似度δkl为:
(6)
(7)
评价聚类结果的准则函数定义如下:
多Markov链模型中,一个用户的兴趣特征由其所属的Markov链描述,这些内部概率依赖关系表示为一个含有隐变量,即类别变量C的Bayes网络;
将p(M|D)作为评价聚类结果的准则函数:
(8)
其中,M表示一个Bayes网络模型,D表示训练数据,p(M|D)为后验概率,其越大此模型越优;
p(D|M)表示模型M的似然函数,采用如下公式计算:
(9)
其中L(D, C)表示对于节点C的似然函数,L(D, Xt-1, Xt)表示对节点(Xt-1, Xt)的似然函数,分别利用下式计算:
(10)
(11)
对Markov链进行合并:当ck和cl属于同一类的话,合并后的Markov链mc(k+l)为:
(12)
(13)
多Markov链模型的建立流程如下:
步骤S301:设训练数据D={d1, d2, …, dq},利用式(1)~(4),将训练数据D转化为q条Markov链;然后利用式(5)~(7),计算q条Markov链两两之间的聚类相似度,并将计算得到的聚类相似度按从大到小排列成相似度队列Q;利用式(8) ~(11),计算每条Markov链的准则函数值pold,设初值pnew=pold;
步骤S302:当pold小于等于pnew时,令pnew等于pold;
步骤S303:遍历相似度队列Q,利用式(12)、(13),尝试合并Q[I]所对应的两个Markov链,并计算准则函数值pnew,其中Q[I]表示相似度队列Q中第I个元素,I=1, 2, …, length[Q],length[Q]表示相似度队列Q中元素的个数;如果pnew大于pold,正式合并Q[I]对应的两个Markov链,并重新计算并排序相似度队列Q;
步骤S304:重复步骤S302、S303,直至每条Markov链的pold大于pnew,最终获得k条合并后的markov链;
步骤S305:计算结束,步骤S304获得的k条合并后的markov链即组成所述多Markov链模型。
进一步的,步骤S4中,对微博用户进行分类的方法如下:
根据贝叶斯公式,一用户属于类别ck的概率为:
(14)
p ( x1 , x2 , … , xn)为序列( x1,x2,…,xn)的边际概率,对于不同的分类,该值都不会改变,为常数;
利用最小错误率的贝叶斯判定规则得到:
(15)。
进一步的,步骤S5中,采用如下公式预测微博用户的兴趣特征:
(16)
其中,Ak h表示第k类微博用户的兴趣特征值对应的Markov链的h 阶转移矩阵;wi是权值,满足等式w1+w2+…+wh=1;H(t)=[0, 0, …, 1]表示微博用户在时刻t的状态,如果此时微博用户处于状态xi,则该向量的第i维等于1,其余各维都为0;
在向量V(t)中,概率值最大的那一向量分量所对应的状态,就是微博用户在时刻t最可能的状态,从而得到该微博用户所属的兴趣特征。
本发明的有益效果是提供了一种基于多Markov链的微博用户兴趣预测方法,该方法运用多马尔科夫链模型,实现了对微博用户的兴趣的预测,从而可以根据不同时刻用户发表的不同微博进行分析,预测出用户最感兴趣的微博,对其进行推荐。
附图说明
图1是本发明实施例的实现流程图。
图2是本发明实施例中Bayes网络的示意图。
具体实施方式
本发明基于多Markov链的微博用户兴趣预测方法,如图1所示,包括以下步骤:
步骤S1:获取q个微博用户发表或转发的微博信息作为训练数据,获取p个微博用户发表或转发的微博信息作为测试数据(q、p均为大于2的整数)。
在步骤S1中,对训练数据、测试数据进行预处理包括中文分词和停用词处理,中文分词的方法为:采用中文分词系统(本发明采用中科院计算所中文分词系统(ICTCLAS),它是一种基于层叠隐形马尔科夫模型的中文分词系统),结合自定义的用户词典对微博信息进行分词,停用词处理的方法为:采用HashMap快速索引查表法对无用信息进行过滤,从而降低微博信息的噪音。
步骤S2:以微博用户为单位,对所述训练数据、测试数据进行预处理,从微博用户发表或转发的微博信息中提取每个微博用户对应的n个兴趣特征值,分别转换为文本向量。
步骤S3:将所述训练数据对应的q个微博用户作为独立的用户类别,每个微博用户利用其对应的n个兴趣特征值生成一条对应的Markov链,共得到q条Markov链,然后计算所述q条Markov链两两之间的聚类相似度,根据聚类相似度对Markov链进行合并,得到若干条合并后的Markov链,每一条合并后的Markov链对应一类微博用户,利用所有合并后的Markov链建立多Markov链模型。
在步骤S3中,多Markov链模型的建立方法如下:
将多Markov链模型表示为一个四元组:(X, K, p(C), MC);
其中,X 是一个离散随机变量,值域为{x1, x2, …,xi,…, xn},每个xi对应一个微博用户的兴趣特征值,称为模型的一个状态;K 表示多Markov链模型包含的用户类别的数目;C={c1,c2,…,ck}表示用户类别,其分布函数p(C)表示不同类别用户的概率分布;MC={mc1, mc2, …, mck}为Markov链的集合,每一个元素mck是描述类别为ck的一类微博用户的兴趣特征值的Markov链;
类别为ck的一类微博用户的兴趣特征值的Markov链的转移矩阵Ak和初始状态分布λk分别为:
(1)
(2)
其中,pkij表示类别为ck的一类微博用户的兴趣特征值中兴趣xi和兴趣xj同时出现的概率,pki表示类别为ck的一类微博用户的兴趣特征值出现的初始状态分布;采用贝叶斯估计法计算转移矩阵Ak和初始状态分布λk中的pkij和pki:
(3)
(4)
其中,αkij为超级参数,采用贝叶斯假设确定其值;Skij表示类别为ck的所有用户的兴趣特征值序列中,状态对(xi, xj)出现的次数;
聚类相似度定义如下:
对于任意两个转移矩阵Ak、Al,设Ak、Al的第i行分别为pkij、plij,pki、pli都表示在给定X[t-1]=xi条件下变量X[t]的分布,即p(Xt|Xt-1= xi),则pki、pli的近似程度用它们的交叉熵CE(pki, pli)为:
(5)
则转移矩阵Ak、Al的聚类相似度δkl为:
(6)
(7)
当两个Markov链具有完全相同的动态特征时,相似度的值δkl为无穷大;两个Markov链的动态特征差异越大,相似度的值δkl就越小;
评价聚类结果的准则函数定义如下:
多Markov链模型中,一个用户的兴趣特征由其所属的Markov链描述,这些内部概率依赖关系表示为一个含有隐变量,即类别变量C的Bayes网络,如图2所示:
将p(M|D)作为评价聚类结果的准则函数:
(8)
其中,M表示一个Bayes网络模型,D表示训练数据,p(M|D)为后验概率,其越大此模型越优;
p(D|M)表示模型M的似然函数,采用如下公式计算:
如图2所示,该Bayes 网络有两个节点,所以
(9)
其中L(D, C)表示对于节点C的似然函数,L(D, Xt-1, Xt)表示对节点(Xt-1, Xt)的似然函数,分别利用下式计算:
(10)
(11)
对Markov链进行合并:当ck和cl属于同一类的话,合并后的Markov链mc(k+l)为:
(12)
(13)
多Markov链模型的建立流程如下:
步骤S301:设训练数据D={d1, d2, …, dq},利用式(1)~(4),将训练数据D转化为q条Markov链;然后利用式(5)~(7),计算q条Markov链两两之间的聚类相似度,并将计算得到的聚类相似度按从大到小排列成相似度队列Q;利用式(8) ~(11),计算每条Markov链的准则函数值pold,设初值pnew=pold;
步骤S302:当pold小于等于pnew时,令pnew等于pold;
步骤S303:遍历相似度队列Q,利用式(12)、(13),尝试合并Q[I]所对应的两个Markov链,并计算准则函数值pnew,其中Q[I]表示相似度队列Q中第I个元素,I=1, 2, …, length[Q],length[Q]表示相似度队列Q中元素的个数;如果pnew大于pold,正式合并Q[I]对应的两个Markov链,并重新计算并排序相似度队列Q;
步骤S304:重复步骤S302、S303,直至每条Markov链的pold大于pnew,最终获得k条合并后的markov链;
步骤S305:计算结束,步骤S304获得的k条合并后的markov链即组成所述多Markov链模型。
步骤S4:利用最小错误率的贝叶斯判定规则,对所述测试数据对应的p个微博用户进行用户分类。
在步骤S4中,对微博用户进行分类的方法如下:
根据贝叶斯公式,一用户属于类别ck的概率为:
(14)
p ( x1 , x2 , … , xn)为序列( x1,x2,…,xn)的边际概率,对于不同的分类,该值都不会改变,为常数;
利用最小错误率的贝叶斯判定规则得到:
(15)。
步骤S5:基于步骤S4确定的微博用户的用户类别,根据每类微博用户的兴趣特征值,利用步骤S3建立的多Markov链模型预测微博用户的兴趣特征。
在步骤S5中,采用如下公式预测微博用户的兴趣特征:
(16)
其中,Ak h表示第k类微博用户的兴趣特征值对应的Markov链的h 阶转移矩阵;wi是权值,满足等式w1+w2+…+wh=1;H(t)=[0, 0, …, 1]表示微博用户在时刻t的状态,如果此时微博用户处于状态xi,则该向量的第i维等于1,其余各维都为0;
在向量V(t)中,概率值最大的那一向量分量所对应的状态,就是微博用户在时刻t最可能的状态,从而得到该微博用户所属的兴趣特征。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (5)
1.一种基于多Markov链的微博用户兴趣预测方法,其特征在于,包括以下步骤:
步骤S1:获取q个微博用户发表或转发的微博信息作为训练数据,获取p个微博用户发表或转发的微博信息作为测试数据;
步骤S2:以微博用户为单位,对所述训练数据、测试数据进行预处理,从微博用户发表或转发的微博信息中提取每个微博用户对应的n个兴趣特征值,分别转换为文本向量;
步骤S3:将所述训练数据对应的q个微博用户作为独立的用户类别,每个微博用户利用其对应的n个兴趣特征值生成一条对应的Markov链,共得到q条Markov链,然后计算所述q条Markov链两两之间的聚类相似度,根据聚类相似度对Markov链进行合并,得到若干条合并后的Markov链,每一条合并后的Markov链对应一类微博用户,利用所有合并后的Markov链建立多Markov链模型;
步骤S4:利用最小错误率的贝叶斯判定规则,对所述测试数据对应的p个微博用户进行用户分类;
步骤S5:基于步骤S4确定的微博用户的用户类别,利用步骤S3建立的多Markov链模型预测微博用户的兴趣特征。
2.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S1中,对训练数据、测试数据进行预处理包括中文分词和停用词处理,中文分词的方法为:采用中文分词系统,结合自定义的用户词典对微博信息进行分词,停用词处理的方法为:采用HashMap快速索引查表法对无用信息进行过滤,从而降低微博信息的噪音。
3.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S3中,多Markov链模型的建立方法如下:
将多Markov链模型表示为一个四元组:(X, K, p(C), MC);
其中,X 是一个离散随机变量,值域为{x1, x2, …,xi,…, xn},每个xi对应一个微博用户的兴趣特征值,称为模型的一个状态;K 表示多Markov链模型包含的用户类别的数目;C={c1,c2,…,ck}表示用户类别,其分布函数p(C)表示不同类别用户的概率分布;MC={mc1, mc2, …, mck}为Markov链的集合,每一个元素mck是描述类别为ck的一类微博用户的兴趣特征值的Markov链;
类别为ck的一类微博用户的兴趣特征值的Markov链的转移矩阵Ak和初始状态分布λk分别为:
(1)
(2)
其中,pkij表示类别为ck的一类微博用户的兴趣特征值中兴趣xi和兴趣xj同时出现的概率,pki表示类别为ck的一类微博用户的兴趣特征值出现的初始状态分布;采用贝叶斯估计法计算转移矩阵Ak和初始状态分布λk中的pkij和pki:
(3)
(4)
其中,αkij为超级参数,采用贝叶斯假设确定其值;Skij表示类别为ck的所有用户的兴趣特征值序列中,状态对(xi, xj)出现的次数;
聚类相似度定义如下:
对于任意两个转移矩阵Ak、Al,设Ak、Al的第i行分别为pkij、plij,pki、pli都表示在给定X[t-1]=xi条件下变量X[t]的分布,即p(Xt|Xt-1= xi),则pki、pli的近似程度用它们的交叉熵CE(pki, pli)为:
(5)
则转移矩阵Ak、Al的聚类相似度δkl为:
(6)
(7)
评价聚类结果的准则函数定义如下:
多Markov链模型中,一个用户的兴趣特征由其所属的Markov链描述,这些内部概率依赖关系表示为一个含有隐变量,即类别变量C的Bayes网络;
将p(M|D)作为评价聚类结果的准则函数:
(8)
其中,M表示一个Bayes网络模型,D表示训练数据,p(M|D)为后验概率,其越大此模型越优;
p(D|M)表示模型M的似然函数,采用如下公式计算:
(9)
其中L(D, C)表示对于节点C的似然函数,L(D, Xt-1, Xt)表示对节点(Xt-1, Xt)的似然函数,分别利用下式计算:
(10)
(11)
对Markov链进行合并:当ck和cl属于同一类的话,合并后的Markov链mc(k+l)为:
(12)
(13)
多Markov链模型的建立流程如下:
步骤S301:设训练数据D={d1, d2, …, dq},利用式(1)~(4),将训练数据D转化为q条Markov链;然后利用式(5)~(7),计算q条Markov链两两之间的聚类相似度,并将计算得到的聚类相似度按从大到小排列成相似度队列Q;利用式(8) ~(11),计算每条Markov链的准则函数值pold,设初值pnew=pold;
步骤S302:当pold小于等于pnew时,令pnew等于pold;
步骤S303:遍历相似度队列Q,利用式(12)、(13),尝试合并Q[I]所对应的两个Markov链,并计算准则函数值pnew,其中Q[I]表示相似度队列Q中第I个元素,I=1, 2, …, length[Q],length[Q]表示相似度队列Q中元素的个数;如果pnew大于pold,正式合并Q[I]对应的两个Markov链,并重新计算并排序相似度队列Q;
步骤S304:重复步骤S302、S303,直至每条Markov链的pold大于pnew,最终获得k条合并后的markov链;
步骤S305:计算结束,步骤S304获得的k条合并后的markov链即组成所述多Markov链模型。
4.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S4中,对微博用户进行分类的方法如下:
根据贝叶斯公式,一用户属于类别ck的概率为:
(14)
p ( x1 , x2 , … , xn)为序列( x1,x2,…,xn)的边际概率,对于不同的分类,该值都不会改变,为常数;
利用最小错误率的贝叶斯判定规则得到:
(15)。
5.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S5中,采用如下公式预测微博用户的兴趣特征:
(16)
其中,Ak h表示第k类微博用户的兴趣特征值对应的Markov链的h 阶转移矩阵;wi是权值,满足等式w1+w2+…+wh=1;H(t)=[0, 0, …, 1]表示微博用户在时刻t的状态,如果此时微博用户处于状态xi,则该向量的第i维等于1,其余各维都为0;
在向量V(t)中,概率值最大的那一向量分量所对应的状态,就是微博用户在时刻t最可能的状态,从而得到该微博用户所属的兴趣特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410334853.9A CN104077412B (zh) | 2014-07-14 | 2014-07-14 | 一种基于多Markov链的微博用户兴趣预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410334853.9A CN104077412B (zh) | 2014-07-14 | 2014-07-14 | 一种基于多Markov链的微博用户兴趣预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104077412A true CN104077412A (zh) | 2014-10-01 |
CN104077412B CN104077412B (zh) | 2018-04-13 |
Family
ID=51598666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410334853.9A Expired - Fee Related CN104077412B (zh) | 2014-07-14 | 2014-07-14 | 一种基于多Markov链的微博用户兴趣预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104077412B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463371A (zh) * | 2014-12-16 | 2015-03-25 | 山东大学 | 基于风电功率变化量的Markov链建模、预测方法 |
CN105183909A (zh) * | 2015-10-09 | 2015-12-23 | 福州大学 | 基于高斯混合模型的社交网络用户兴趣预测方法 |
CN105844497A (zh) * | 2016-03-31 | 2016-08-10 | 北京奇虎科技有限公司 | 用户数据的预测的方法及预测装置 |
CN107004221A (zh) * | 2014-11-28 | 2017-08-01 | Bc卡有限公司 | 用于预测使用行业的卡使用模式分析方法及执行其的服务器 |
CN108647293A (zh) * | 2018-05-07 | 2018-10-12 | 广州虎牙信息科技有限公司 | 视频推荐方法、装置、存储介质和服务器 |
CN110688484A (zh) * | 2019-09-24 | 2020-01-14 | 北京工商大学 | 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 |
CN111143701A (zh) * | 2019-12-13 | 2020-05-12 | 中国电子科技网络信息安全有限公司 | 一种基于多维度的社交网络用户推荐方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050154686A1 (en) * | 2004-01-09 | 2005-07-14 | Corston Simon H. | Machine-learned approach to determining document relevance for search over large electronic collections of documents |
CN102880728A (zh) * | 2012-10-31 | 2013-01-16 | 中国科学院自动化研究所 | 名人视频搜索结果个性化排序的方法 |
CN103700004A (zh) * | 2013-12-10 | 2014-04-02 | 深圳先进技术研究院 | 一种微博广告服务信息推送方法及装置 |
-
2014
- 2014-07-14 CN CN201410334853.9A patent/CN104077412B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050154686A1 (en) * | 2004-01-09 | 2005-07-14 | Corston Simon H. | Machine-learned approach to determining document relevance for search over large electronic collections of documents |
CN102880728A (zh) * | 2012-10-31 | 2013-01-16 | 中国科学院自动化研究所 | 名人视频搜索结果个性化排序的方法 |
CN103700004A (zh) * | 2013-12-10 | 2014-04-02 | 深圳先进技术研究院 | 一种微博广告服务信息推送方法及装置 |
Non-Patent Citations (1)
Title |
---|
孙秀娟: "基于隐马尔科夫模型的浏览兴趣预测", 《科技导报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107004221A (zh) * | 2014-11-28 | 2017-08-01 | Bc卡有限公司 | 用于预测使用行业的卡使用模式分析方法及执行其的服务器 |
CN104463371A (zh) * | 2014-12-16 | 2015-03-25 | 山东大学 | 基于风电功率变化量的Markov链建模、预测方法 |
CN104463371B (zh) * | 2014-12-16 | 2017-07-11 | 山东大学 | 基于风电功率变化量的Markov链建模、预测方法 |
CN105183909A (zh) * | 2015-10-09 | 2015-12-23 | 福州大学 | 基于高斯混合模型的社交网络用户兴趣预测方法 |
CN105183909B (zh) * | 2015-10-09 | 2017-04-12 | 福州大学 | 基于高斯混合模型的社交网络用户兴趣预测方法 |
CN105844497A (zh) * | 2016-03-31 | 2016-08-10 | 北京奇虎科技有限公司 | 用户数据的预测的方法及预测装置 |
CN108647293A (zh) * | 2018-05-07 | 2018-10-12 | 广州虎牙信息科技有限公司 | 视频推荐方法、装置、存储介质和服务器 |
CN110688484A (zh) * | 2019-09-24 | 2020-01-14 | 北京工商大学 | 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 |
CN111143701A (zh) * | 2019-12-13 | 2020-05-12 | 中国电子科技网络信息安全有限公司 | 一种基于多维度的社交网络用户推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104077412B (zh) | 2018-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104077412A (zh) | 一种基于多Markov链的微博用户兴趣预测方法 | |
CN108052639A (zh) | 基于运营商数据的行业用户推荐方法及装置 | |
CN109145114B (zh) | 基于Kleinberg在线状态机的社交网络事件检测方法 | |
CN106909643A (zh) | 基于知识图谱的社交媒体大数据主题发现方法 | |
CN107403007B (zh) | 一种基于网络的微博消息可信度判别模型的方法 | |
CN103116611A (zh) | 社交网络意见领袖识别方法 | |
Sun et al. | Early exiting with ensemble internal classifiers | |
CN105893637A (zh) | 大规模微博异构信息网络中的链接预测方法 | |
CN103699617A (zh) | 一种基于随机游走的社区发现方法 | |
CN104077723A (zh) | 一种社交网络推荐系统及方法 | |
CN103838804A (zh) | 一种基于社团划分的社交网络用户兴趣关联规则挖掘方法 | |
CN104199884B (zh) | 一种基于r覆盖率优先的社交网络观察点选取方法 | |
CN105550578A (zh) | 一种基于特征选择和决策树的网络异常分类规则提取方法 | |
CN110659436A (zh) | 网络舆情监控方法、装置和设备 | |
CN104331523A (zh) | 一种基于概念对象模型的问句检索方法 | |
Hu et al. | Analysis of influence maximization in large-scale social networks | |
CN105446954A (zh) | 一种面向科技大数据的项目查重方法 | |
Huang et al. | Internet traffic classification based on min-max ensemble feature selection | |
Ke et al. | Spark-based feature selection algorithm of network traffic classification | |
Li et al. | Short text sentiment analysis based on convolutional neural network | |
Kong et al. | Popularity prediction based on interactions of online contents | |
Kalaibar et al. | Spam filtering by using genetic based feature selection | |
CN105608116B (zh) | 基于交互历史数据的个性化推荐方法 | |
CN105574107A (zh) | 基于用户偏好的内容定制推送方法 | |
CN104391887A (zh) | 一种基于网络结构优化的节点属性划分朋友圈的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180413 |
|
CF01 | Termination of patent right due to non-payment of annual fee |