CN104077412A - 一种基于多Markov链的微博用户兴趣预测方法 - Google Patents

一种基于多Markov链的微博用户兴趣预测方法 Download PDF

Info

Publication number
CN104077412A
CN104077412A CN201410334853.9A CN201410334853A CN104077412A CN 104077412 A CN104077412 A CN 104077412A CN 201410334853 A CN201410334853 A CN 201410334853A CN 104077412 A CN104077412 A CN 104077412A
Authority
CN
China
Prior art keywords
markov chain
microblog users
interest
class
many
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410334853.9A
Other languages
English (en)
Other versions
CN104077412B (zh
Inventor
郑相涵
陈国龙
安东云
郭文忠
於志勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201410334853.9A priority Critical patent/CN104077412B/zh
Publication of CN104077412A publication Critical patent/CN104077412A/zh
Application granted granted Critical
Publication of CN104077412B publication Critical patent/CN104077412B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于多Markov链的微博用户兴趣预测方法,包括以下步骤:1、分别获取q个、p个用户发表的微博作为训练数据、测试数据;2、以用户为单位,对训练数据、测试数据进行预处理,提取每个用户的兴趣特征值;3、将训练数据转化为Markov链,再基于Markov链两两之间的聚类相似度,对Markov链进行合并,然后利用合并后的Markov链建立多Markov链模型;4、对测试数据进行用户分类;5、基于对测试数据分类得到的用户类别,利用多Markov链模型预测用户的兴趣特征。该方法可以有效预测微博用户的兴趣。

Description

一种基于多Markov链的微博用户兴趣预测方法
技术领域
本发明涉及社交网络信息分析技术领域,特别是涉及一种基于多Markov链的微博用户兴趣预测方法。
背景技术
随着Web2.0技术和无线网络技术的发展,社交网络对人类社会和生活的影响越来越大。微博作为当今流行的一种社交网络平台,它为用户提供了一个实时交流平台。微博用户可以通过电脑或者移动终端关注自己感兴趣的信息,实时地获取各种网络资源,并发表个人观点等。
相关数据显示,我国微博用户数量由2010年底的6311万猛增至2012年6月的2.74亿,使用率增长近300%,中国网民使用微博的比例已经过半。如此庞大的用户数量群,其知识层次差别很大,所产生的网络信息良莠不齐、形式各异。同时,不同用户的信息需求也不尽相同。
发明内容
本发明的目的在于提供一种基于多Markov链的微博用户兴趣预测方法,该方法可以有效预测微博用户的兴趣。
为实现上述目的,本发明的技术方案是:一种基于多Markov链的微博用户兴趣预测方法,包括以下步骤:
步骤S1:获取q个微博用户发表或转发的微博信息作为训练数据,获取p个微博用户发表或转发的微博信息作为测试数据;
步骤S2:以微博用户为单位,对所述训练数据、测试数据进行预处理,从微博用户发表或转发的微博信息中提取每个微博用户对应的n个兴趣特征值,分别转换为文本向量;
步骤S3:将所述训练数据对应的q个微博用户作为独立的用户类别,每个微博用户利用其对应的n个兴趣特征值生成一条对应的Markov链,共得到q条Markov链,然后计算所述q条Markov链两两之间的聚类相似度,根据聚类相似度对Markov链进行合并,得到若干条合并后的Markov链,每一条合并后的Markov链对应一类微博用户,利用所有合并后的Markov链建立多Markov链模型;
步骤S4:利用最小错误率的贝叶斯判定规则,对所述测试数据对应的p个微博用户进行用户分类;
步骤S5:基于步骤S4确定的微博用户的用户类别,利用步骤S3建立的多Markov链模型预测微博用户的兴趣特征。
进一步的,步骤S1中,对训练数据、测试数据进行预处理包括中文分词和停用词处理,中文分词的方法为:采用中文分词系统,结合自定义的用户词典对微博信息进行分词,停用词处理的方法为:采用HashMap快速索引查表法对无用信息进行过滤,从而降低微博信息的噪音。
进一步的,步骤S3中,多Markov链模型的建立方法如下:
将多Markov链模型表示为一个四元组:(X, K, p(C), MC);
其中,X 是一个离散随机变量,值域为{x1, x2, …,xi,…, xn},每个xi对应一个微博用户的兴趣特征值,称为模型的一个状态;K 表示多Markov链模型包含的用户类别的数目;C={c1,c2,…,ck}表示用户类别,其分布函数p(C)表示不同类别用户的概率分布;MC={mc1, mc2, …, mck}为Markov链的集合,每一个元素mck是描述类别为ck的一类微博用户的兴趣特征值的Markov链;
类别为ck的一类微博用户的兴趣特征值的Markov链的转移矩阵Ak和初始状态分布λk分别为:
    (1)
    (2)
其中,pkij表示类别为ck的一类微博用户的兴趣特征值中兴趣xi和兴趣xj同时出现的概率,pki表示类别为ck的一类微博用户的兴趣特征值出现的初始状态分布;采用贝叶斯估计法计算转移矩阵Ak和初始状态分布λk中的pkij和pki
    (3)
    (4)
其中,αkij为超级参数,采用贝叶斯假设确定其值;Skij表示类别为ck的所有用户的兴趣特征值序列中,状态对(xi, xj)出现的次数;
聚类相似度定义如下:
对于任意两个转移矩阵Ak、Al,设Ak、Al的第i行分别为pkij、plij,pki、pli都表示在给定X[t-1]=xi条件下变量X[t]的分布,即p(Xt|Xt-1= xi),则pki、pli的近似程度用它们的交叉熵CE(pki, pli)为:
    (5)
则转移矩阵Ak、Al的聚类相似度δkl为:
    (6)
    (7)
评价聚类结果的准则函数定义如下:
多Markov链模型中,一个用户的兴趣特征由其所属的Markov链描述,这些内部概率依赖关系表示为一个含有隐变量,即类别变量C的Bayes网络;
将p(M|D)作为评价聚类结果的准则函数:
    (8)
其中,M表示一个Bayes网络模型,D表示训练数据,p(M|D)为后验概率,其越大此模型越优;
p(D|M)表示模型M的似然函数,采用如下公式计算:
    (9)
其中L(D, C)表示对于节点C的似然函数,L(D, Xt-1, Xt)表示对节点(Xt-1, Xt)的似然函数,分别利用下式计算:
    (10)
    (11)
对Markov链进行合并:当ck和cl属于同一类的话,合并后的Markov链mc(k+l)为:
    (12)
    (13)
多Markov链模型的建立流程如下:
步骤S301:设训练数据D={d1, d2, …, dq},利用式(1)~(4),将训练数据D转化为q条Markov链;然后利用式(5)~(7),计算q条Markov链两两之间的聚类相似度,并将计算得到的聚类相似度按从大到小排列成相似度队列Q;利用式(8) ~(11),计算每条Markov链的准则函数值pold,设初值pnew=pold
步骤S302:当pold小于等于pnew时,令pnew等于pold
步骤S303:遍历相似度队列Q,利用式(12)、(13),尝试合并Q[I]所对应的两个Markov链,并计算准则函数值pnew,其中Q[I]表示相似度队列Q中第I个元素,I=1, 2, …, length[Q],length[Q]表示相似度队列Q中元素的个数;如果pnew大于pold,正式合并Q[I]对应的两个Markov链,并重新计算并排序相似度队列Q;
步骤S304:重复步骤S302、S303,直至每条Markov链的pold大于pnew,最终获得k条合并后的markov链;
步骤S305:计算结束,步骤S304获得的k条合并后的markov链即组成所述多Markov链模型。
进一步的,步骤S4中,对微博用户进行分类的方法如下:
根据贝叶斯公式,一用户属于类别ck的概率为:
    (14)
p ( x1 , x2 , … , xn)为序列( x1,x2,…,xn)的边际概率,对于不同的分类,该值都不会改变,为常数;
利用最小错误率的贝叶斯判定规则得到:
    (15)。
进一步的,步骤S5中,采用如下公式预测微博用户的兴趣特征:
  (16)
其中,Ak h表示第k类微博用户的兴趣特征值对应的Markov链的h 阶转移矩阵;wi是权值,满足等式w1+w2+…+wh=1;H(t)=[0, 0, …, 1]表示微博用户在时刻t的状态,如果此时微博用户处于状态xi,则该向量的第i维等于1,其余各维都为0;
在向量V(t)中,概率值最大的那一向量分量所对应的状态,就是微博用户在时刻t最可能的状态,从而得到该微博用户所属的兴趣特征。
本发明的有益效果是提供了一种基于多Markov链的微博用户兴趣预测方法,该方法运用多马尔科夫链模型,实现了对微博用户的兴趣的预测,从而可以根据不同时刻用户发表的不同微博进行分析,预测出用户最感兴趣的微博,对其进行推荐。
附图说明
图1是本发明实施例的实现流程图。
图2是本发明实施例中Bayes网络的示意图。
具体实施方式
本发明基于多Markov链的微博用户兴趣预测方法,如图1所示,包括以下步骤:
步骤S1:获取q个微博用户发表或转发的微博信息作为训练数据,获取p个微博用户发表或转发的微博信息作为测试数据(q、p均为大于2的整数)。
在步骤S1中,对训练数据、测试数据进行预处理包括中文分词和停用词处理,中文分词的方法为:采用中文分词系统(本发明采用中科院计算所中文分词系统(ICTCLAS),它是一种基于层叠隐形马尔科夫模型的中文分词系统),结合自定义的用户词典对微博信息进行分词,停用词处理的方法为:采用HashMap快速索引查表法对无用信息进行过滤,从而降低微博信息的噪音。
步骤S2:以微博用户为单位,对所述训练数据、测试数据进行预处理,从微博用户发表或转发的微博信息中提取每个微博用户对应的n个兴趣特征值,分别转换为文本向量。
步骤S3:将所述训练数据对应的q个微博用户作为独立的用户类别,每个微博用户利用其对应的n个兴趣特征值生成一条对应的Markov链,共得到q条Markov链,然后计算所述q条Markov链两两之间的聚类相似度,根据聚类相似度对Markov链进行合并,得到若干条合并后的Markov链,每一条合并后的Markov链对应一类微博用户,利用所有合并后的Markov链建立多Markov链模型。
在步骤S3中,多Markov链模型的建立方法如下:
将多Markov链模型表示为一个四元组:(X, K, p(C), MC);
其中,X 是一个离散随机变量,值域为{x1, x2, …,xi,…, xn},每个xi对应一个微博用户的兴趣特征值,称为模型的一个状态;K 表示多Markov链模型包含的用户类别的数目;C={c1,c2,…,ck}表示用户类别,其分布函数p(C)表示不同类别用户的概率分布;MC={mc1, mc2, …, mck}为Markov链的集合,每一个元素mck是描述类别为ck的一类微博用户的兴趣特征值的Markov链;
类别为ck的一类微博用户的兴趣特征值的Markov链的转移矩阵Ak和初始状态分布λk分别为:
    (1)
    (2)
其中,pkij表示类别为ck的一类微博用户的兴趣特征值中兴趣xi和兴趣xj同时出现的概率,pki表示类别为ck的一类微博用户的兴趣特征值出现的初始状态分布;采用贝叶斯估计法计算转移矩阵Ak和初始状态分布λk中的pkij和pki
    (3)
    (4)
其中,αkij为超级参数,采用贝叶斯假设确定其值;Skij表示类别为ck的所有用户的兴趣特征值序列中,状态对(xi, xj)出现的次数;
聚类相似度定义如下:
对于任意两个转移矩阵Ak、Al,设Ak、Al的第i行分别为pkij、plij,pki、pli都表示在给定X[t-1]=xi条件下变量X[t]的分布,即p(Xt|Xt-1= xi),则pki、pli的近似程度用它们的交叉熵CE(pki, pli)为:
    (5)
则转移矩阵Ak、Al的聚类相似度δkl为:
    (6)
    (7)
当两个Markov链具有完全相同的动态特征时,相似度的值δkl为无穷大;两个Markov链的动态特征差异越大,相似度的值δkl就越小;
评价聚类结果的准则函数定义如下:
多Markov链模型中,一个用户的兴趣特征由其所属的Markov链描述,这些内部概率依赖关系表示为一个含有隐变量,即类别变量C的Bayes网络,如图2所示:
将p(M|D)作为评价聚类结果的准则函数:
    (8)
其中,M表示一个Bayes网络模型,D表示训练数据,p(M|D)为后验概率,其越大此模型越优;
p(D|M)表示模型M的似然函数,采用如下公式计算:
如图2所示,该Bayes 网络有两个节点,所以
    (9)
其中L(D, C)表示对于节点C的似然函数,L(D, Xt-1, Xt)表示对节点(Xt-1, Xt)的似然函数,分别利用下式计算:
    (10)
    (11)
对Markov链进行合并:当ck和cl属于同一类的话,合并后的Markov链mc(k+l)为:
    (12)
    (13)
多Markov链模型的建立流程如下:
步骤S301:设训练数据D={d1, d2, …, dq},利用式(1)~(4),将训练数据D转化为q条Markov链;然后利用式(5)~(7),计算q条Markov链两两之间的聚类相似度,并将计算得到的聚类相似度按从大到小排列成相似度队列Q;利用式(8) ~(11),计算每条Markov链的准则函数值pold,设初值pnew=pold
步骤S302:当pold小于等于pnew时,令pnew等于pold
步骤S303:遍历相似度队列Q,利用式(12)、(13),尝试合并Q[I]所对应的两个Markov链,并计算准则函数值pnew,其中Q[I]表示相似度队列Q中第I个元素,I=1, 2, …, length[Q],length[Q]表示相似度队列Q中元素的个数;如果pnew大于pold,正式合并Q[I]对应的两个Markov链,并重新计算并排序相似度队列Q;
步骤S304:重复步骤S302、S303,直至每条Markov链的pold大于pnew,最终获得k条合并后的markov链;
步骤S305:计算结束,步骤S304获得的k条合并后的markov链即组成所述多Markov链模型。
步骤S4:利用最小错误率的贝叶斯判定规则,对所述测试数据对应的p个微博用户进行用户分类。
在步骤S4中,对微博用户进行分类的方法如下:
根据贝叶斯公式,一用户属于类别ck的概率为:
    (14)
p ( x1 , x2 , … , xn)为序列( x1,x2,…,xn)的边际概率,对于不同的分类,该值都不会改变,为常数;
利用最小错误率的贝叶斯判定规则得到:
    (15)。
步骤S5:基于步骤S4确定的微博用户的用户类别,根据每类微博用户的兴趣特征值,利用步骤S3建立的多Markov链模型预测微博用户的兴趣特征。
在步骤S5中,采用如下公式预测微博用户的兴趣特征:
  (16)
其中,Ak h表示第k类微博用户的兴趣特征值对应的Markov链的h 阶转移矩阵;wi是权值,满足等式w1+w2+…+wh=1;H(t)=[0, 0, …, 1]表示微博用户在时刻t的状态,如果此时微博用户处于状态xi,则该向量的第i维等于1,其余各维都为0;
在向量V(t)中,概率值最大的那一向量分量所对应的状态,就是微博用户在时刻t最可能的状态,从而得到该微博用户所属的兴趣特征。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (5)

1.一种基于多Markov链的微博用户兴趣预测方法,其特征在于,包括以下步骤:
步骤S1:获取q个微博用户发表或转发的微博信息作为训练数据,获取p个微博用户发表或转发的微博信息作为测试数据;
步骤S2:以微博用户为单位,对所述训练数据、测试数据进行预处理,从微博用户发表或转发的微博信息中提取每个微博用户对应的n个兴趣特征值,分别转换为文本向量;
步骤S3:将所述训练数据对应的q个微博用户作为独立的用户类别,每个微博用户利用其对应的n个兴趣特征值生成一条对应的Markov链,共得到q条Markov链,然后计算所述q条Markov链两两之间的聚类相似度,根据聚类相似度对Markov链进行合并,得到若干条合并后的Markov链,每一条合并后的Markov链对应一类微博用户,利用所有合并后的Markov链建立多Markov链模型;
步骤S4:利用最小错误率的贝叶斯判定规则,对所述测试数据对应的p个微博用户进行用户分类;
步骤S5:基于步骤S4确定的微博用户的用户类别,利用步骤S3建立的多Markov链模型预测微博用户的兴趣特征。
2.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S1中,对训练数据、测试数据进行预处理包括中文分词和停用词处理,中文分词的方法为:采用中文分词系统,结合自定义的用户词典对微博信息进行分词,停用词处理的方法为:采用HashMap快速索引查表法对无用信息进行过滤,从而降低微博信息的噪音。
3.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S3中,多Markov链模型的建立方法如下:
将多Markov链模型表示为一个四元组:(X, K, p(C), MC);
其中,X 是一个离散随机变量,值域为{x1, x2, …,xi,…, xn},每个xi对应一个微博用户的兴趣特征值,称为模型的一个状态;K 表示多Markov链模型包含的用户类别的数目;C={c1,c2,…,ck}表示用户类别,其分布函数p(C)表示不同类别用户的概率分布;MC={mc1, mc2, …, mck}为Markov链的集合,每一个元素mck是描述类别为ck的一类微博用户的兴趣特征值的Markov链;
类别为ck的一类微博用户的兴趣特征值的Markov链的转移矩阵Ak和初始状态分布λk分别为:
    (1)
    (2)
其中,pkij表示类别为ck的一类微博用户的兴趣特征值中兴趣xi和兴趣xj同时出现的概率,pki表示类别为ck的一类微博用户的兴趣特征值出现的初始状态分布;采用贝叶斯估计法计算转移矩阵Ak和初始状态分布λk中的pkij和pki
    (3)
    (4)
其中,αkij为超级参数,采用贝叶斯假设确定其值;Skij表示类别为ck的所有用户的兴趣特征值序列中,状态对(xi, xj)出现的次数;
聚类相似度定义如下:
对于任意两个转移矩阵Ak、Al,设Ak、Al的第i行分别为pkij、plij,pki、pli都表示在给定X[t-1]=xi条件下变量X[t]的分布,即p(Xt|Xt-1= xi),则pki、pli的近似程度用它们的交叉熵CE(pki, pli)为:
    (5)
则转移矩阵Ak、Al的聚类相似度δkl为:
    (6)
    (7)
评价聚类结果的准则函数定义如下:
多Markov链模型中,一个用户的兴趣特征由其所属的Markov链描述,这些内部概率依赖关系表示为一个含有隐变量,即类别变量C的Bayes网络;
将p(M|D)作为评价聚类结果的准则函数:
    (8)
其中,M表示一个Bayes网络模型,D表示训练数据,p(M|D)为后验概率,其越大此模型越优;
p(D|M)表示模型M的似然函数,采用如下公式计算:
    (9)
其中L(D, C)表示对于节点C的似然函数,L(D, Xt-1, Xt)表示对节点(Xt-1, Xt)的似然函数,分别利用下式计算:
    (10)
    (11)
对Markov链进行合并:当ck和cl属于同一类的话,合并后的Markov链mc(k+l)为:
    (12)
    (13)
多Markov链模型的建立流程如下:
步骤S301:设训练数据D={d1, d2, …, dq},利用式(1)~(4),将训练数据D转化为q条Markov链;然后利用式(5)~(7),计算q条Markov链两两之间的聚类相似度,并将计算得到的聚类相似度按从大到小排列成相似度队列Q;利用式(8) ~(11),计算每条Markov链的准则函数值pold,设初值pnew=pold
步骤S302:当pold小于等于pnew时,令pnew等于pold
步骤S303:遍历相似度队列Q,利用式(12)、(13),尝试合并Q[I]所对应的两个Markov链,并计算准则函数值pnew,其中Q[I]表示相似度队列Q中第I个元素,I=1, 2, …, length[Q],length[Q]表示相似度队列Q中元素的个数;如果pnew大于pold,正式合并Q[I]对应的两个Markov链,并重新计算并排序相似度队列Q;
步骤S304:重复步骤S302、S303,直至每条Markov链的pold大于pnew,最终获得k条合并后的markov链;
步骤S305:计算结束,步骤S304获得的k条合并后的markov链即组成所述多Markov链模型。
4.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S4中,对微博用户进行分类的方法如下:
根据贝叶斯公式,一用户属于类别ck的概率为:
    (14)
p ( x1 , x2 , … , xn)为序列( x1,x2,…,xn)的边际概率,对于不同的分类,该值都不会改变,为常数;
利用最小错误率的贝叶斯判定规则得到:
    (15)。
5.根据权利要求1所述的一种基于多Markov链的微博用户兴趣预测方法,其特征在于,步骤S5中,采用如下公式预测微博用户的兴趣特征:
  (16)
其中,Ak h表示第k类微博用户的兴趣特征值对应的Markov链的h 阶转移矩阵;wi是权值,满足等式w1+w2+…+wh=1;H(t)=[0, 0, …, 1]表示微博用户在时刻t的状态,如果此时微博用户处于状态xi,则该向量的第i维等于1,其余各维都为0;
在向量V(t)中,概率值最大的那一向量分量所对应的状态,就是微博用户在时刻t最可能的状态,从而得到该微博用户所属的兴趣特征。
CN201410334853.9A 2014-07-14 2014-07-14 一种基于多Markov链的微博用户兴趣预测方法 Active CN104077412B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410334853.9A CN104077412B (zh) 2014-07-14 2014-07-14 一种基于多Markov链的微博用户兴趣预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410334853.9A CN104077412B (zh) 2014-07-14 2014-07-14 一种基于多Markov链的微博用户兴趣预测方法

Publications (2)

Publication Number Publication Date
CN104077412A true CN104077412A (zh) 2014-10-01
CN104077412B CN104077412B (zh) 2018-04-13

Family

ID=51598666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410334853.9A Active CN104077412B (zh) 2014-07-14 2014-07-14 一种基于多Markov链的微博用户兴趣预测方法

Country Status (1)

Country Link
CN (1) CN104077412B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463371A (zh) * 2014-12-16 2015-03-25 山东大学 基于风电功率变化量的Markov链建模、预测方法
CN105183909A (zh) * 2015-10-09 2015-12-23 福州大学 基于高斯混合模型的社交网络用户兴趣预测方法
CN105844497A (zh) * 2016-03-31 2016-08-10 北京奇虎科技有限公司 用户数据的预测的方法及预测装置
CN107004221A (zh) * 2014-11-28 2017-08-01 Bc卡有限公司 用于预测使用行业的卡使用模式分析方法及执行其的服务器
CN108647293A (zh) * 2018-05-07 2018-10-12 广州虎牙信息科技有限公司 视频推荐方法、装置、存储介质和服务器
CN110688484A (zh) * 2019-09-24 2020-01-14 北京工商大学 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法
CN111143701A (zh) * 2019-12-13 2020-05-12 中国电子科技网络信息安全有限公司 一种基于多维度的社交网络用户推荐方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050154686A1 (en) * 2004-01-09 2005-07-14 Corston Simon H. Machine-learned approach to determining document relevance for search over large electronic collections of documents
CN102880728A (zh) * 2012-10-31 2013-01-16 中国科学院自动化研究所 名人视频搜索结果个性化排序的方法
CN103700004A (zh) * 2013-12-10 2014-04-02 深圳先进技术研究院 一种微博广告服务信息推送方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050154686A1 (en) * 2004-01-09 2005-07-14 Corston Simon H. Machine-learned approach to determining document relevance for search over large electronic collections of documents
CN102880728A (zh) * 2012-10-31 2013-01-16 中国科学院自动化研究所 名人视频搜索结果个性化排序的方法
CN103700004A (zh) * 2013-12-10 2014-04-02 深圳先进技术研究院 一种微博广告服务信息推送方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙秀娟: "基于隐马尔科夫模型的浏览兴趣预测", 《科技导报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107004221A (zh) * 2014-11-28 2017-08-01 Bc卡有限公司 用于预测使用行业的卡使用模式分析方法及执行其的服务器
CN104463371A (zh) * 2014-12-16 2015-03-25 山东大学 基于风电功率变化量的Markov链建模、预测方法
CN104463371B (zh) * 2014-12-16 2017-07-11 山东大学 基于风电功率变化量的Markov链建模、预测方法
CN105183909A (zh) * 2015-10-09 2015-12-23 福州大学 基于高斯混合模型的社交网络用户兴趣预测方法
CN105183909B (zh) * 2015-10-09 2017-04-12 福州大学 基于高斯混合模型的社交网络用户兴趣预测方法
CN105844497A (zh) * 2016-03-31 2016-08-10 北京奇虎科技有限公司 用户数据的预测的方法及预测装置
CN108647293A (zh) * 2018-05-07 2018-10-12 广州虎牙信息科技有限公司 视频推荐方法、装置、存储介质和服务器
CN110688484A (zh) * 2019-09-24 2020-01-14 北京工商大学 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法
CN111143701A (zh) * 2019-12-13 2020-05-12 中国电子科技网络信息安全有限公司 一种基于多维度的社交网络用户推荐方法及系统

Also Published As

Publication number Publication date
CN104077412B (zh) 2018-04-13

Similar Documents

Publication Publication Date Title
CN104077412A (zh) 一种基于多Markov链的微博用户兴趣预测方法
CN103678670B (zh) 一种微博热词与热点话题挖掘系统及方法
CN104615608B (zh) 一种数据挖掘处理系统及方法
CN109145114B (zh) 基于Kleinberg在线状态机的社交网络事件检测方法
CN104484343A (zh) 一种对微博进行主题发现与追踪的方法
CN106055661B (zh) 基于多Markov链模型的多兴趣资源推荐方法
CN105183909B (zh) 基于高斯混合模型的社交网络用户兴趣预测方法
CN106909643A (zh) 基于知识图谱的社交媒体大数据主题发现方法
CN103116611A (zh) 社交网络意见领袖识别方法
Guo et al. Feature selection based on Rough set and modified genetic algorithm for intrusion detection
CN105956093A (zh) 一种基于多视图锚点图哈希技术的个性化推荐方法
CN103699617A (zh) 一种基于随机游走的社区发现方法
CN104077723A (zh) 一种社交网络推荐系统及方法
CN103838804A (zh) 一种基于社团划分的社交网络用户兴趣关联规则挖掘方法
CN103942298B (zh) 基于线性回归的推荐方法及系统
CN107403007A (zh) 一种基于网络的微博消息可信度判别模型的方法
CN110659436A (zh) 网络舆情监控方法、装置和设备
CN104331523A (zh) 一种基于概念对象模型的问句检索方法
CN104199884B (zh) 一种基于r覆盖率优先的社交网络观察点选取方法
CN109783805A (zh) 一种网络社区用户识别方法及装置
Shi et al. PSO-based community detection in complex networks
CN105205075A (zh) 基于协同自扩展的命名实体集合扩展方法及查询推荐方法
Kong et al. Popularity prediction based on interactions of online contents
CN104156228A (zh) 一种客户端短信过滤嵌入式特征库及更新方法
Lu et al. A method of SNS topic models extraction based on self-adaptively LDA modeling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant