CN103218400A - 基于链接与文本内容的网络社区用户群划分方法 - Google Patents

基于链接与文本内容的网络社区用户群划分方法 Download PDF

Info

Publication number
CN103218400A
CN103218400A CN2013100840391A CN201310084039A CN103218400A CN 103218400 A CN103218400 A CN 103218400A CN 2013100840391 A CN2013100840391 A CN 2013100840391A CN 201310084039 A CN201310084039 A CN 201310084039A CN 103218400 A CN103218400 A CN 103218400A
Authority
CN
China
Prior art keywords
class
link
text
user
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100840391A
Other languages
English (en)
Other versions
CN103218400B (zh
Inventor
闫健卓
王颖
方丽英
王普
齐孟尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201310084039.1A priority Critical patent/CN103218400B/zh
Publication of CN103218400A publication Critical patent/CN103218400A/zh
Application granted granted Critical
Publication of CN103218400B publication Critical patent/CN103218400B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于互联网络领域,提供了一种基于链接与文本内容的网络社区用户群划分方法。本发明利用基于链接的分析方法对网络社区用户在链接上所表现出的网络结构进行分析,同时利用基于兴趣的分析方法对用户在文本内容上所表现的相同兴趣结构进行分析,将二者的结果进行差异性融合,得到具有综合性的网络社区用户群划分结果。在此基础上,分别对每一个划分结果进行评价,验证整划分结果的准确性,对不满足指标要求的,按照紧密程度对该群体成员进行筛选。通过两种方式相互验证和补充,提高了划分结果的准确性、可靠性,使得网络社区用户群的划分不再单纯以链接关系为依据,更多地突出了丰富的文本信息在网络社区用户群划分过程中的重要作用。

Description

基于链接与文本内容的网络社区用户群划分方法
技术领域
本发明属于互联网络领域,具体涉及一种基于链接与文本内容的网络社区用户群划分方法,旨在为网络社区优化和个性化服务提供理论基础与技术手段。
背景技术
随着Web2.0技术的发展,互联网进入了一个崭新的阶段。根据中国互联网信息中心发布的第31次中国互联网络发展状况统计报告表明,中国网民达到5.64亿,互联网普及率达到42.1%。用户数量的增长,进一步推动了网络服务与应用的革新与发展。网络社区为人们提供了一个资源丰富的、便捷的网上交流平台。在网络社区中,一方面,用户可以通过相互链接显性地表现彼此间的关注和关联;另一方面,具有相同兴趣爱好的用户会通过发表文章、评论等信息隐性地表现彼此间关注和联系。发掘存在于网络社区中用户间的显性和隐性关系,可以客观地反映网络社区中用户之间的关联关系,对于发现完善和优化网络社区应用服务、增加价值具有基础性作用与意义。
网络社区的生存往往需要经过探索、建立、发展、成熟、灭亡五个阶段,其中社区的成熟阶段具有最大的用户群和稳定的关系网络,如何使得社区维持在成熟阶段,保证社区的可持续发展,引起了国内外专家学者的广泛关注。主要围绕如何完善网络社区中检索、好友识别等功能,提升社区的个性化和主动式服务质量。申请号为CN102929889A的专利公布了一种完善社区网络的方法和系统,利用提取网页特征词,计算语义相似的方法对网络社区中每个用户的网页内容进行标签标定,以便于优化社区中的信息检索;申请号为CN1021857872的专利公布了一种自动识别好友的方法与系统,通过提取用户输入内容中的好友信息与好友列表进行匹配来确认该好友身份,提醒用户添加新好友。但这些技术都是仅从单一用户的表象特征着手分析,既没有考虑到用户隐含在文本、链接等内容背后的隐性特征,也没有认识到分析网络结构和用户群体特征的重要性。
发明内容
为了解决现有技术中存在的上述问题,本发明提出了一种应用链接分析和web文本信息分类技术相结合实现网络社区用户群划分的方法,旨在为网络社区应用服务的优化与完善提供方法和技术手段。
本发明的原理如下:
链接分析方法是搜索引擎中最常用与快速的方法,用于分析正向链接与反向链接的数量,以此为基础对每个链接进行排序形成检索结果。事实上,链接分析的主要作用是分析链接间的紧密程度,正、反向链接数量越大,链接间的紧密程度越高。在网络社区中,用户通常会建立友情链接或者引用链接,通过对这些链接进行分析,可挖掘出社区中用户间的亲疏关系,划分网络社区用户群。
网络社区用户通过发表文章、评论即时地表现自己的观点认识,但对这些信息进行收集和整理不难发现,用户发表的文章,关注的内容具有一定相似性。利用web文本分类技术对每个用户的文本信息进行分类统计,可清晰地分析出每个用户的兴趣偏好,根据“物以类聚,人以群分”的思想,网络社区用户群可按照相同兴趣爱好进行划分。
本发明采用的技术方案如下:
本发明利用基于链接的分析方法对网络社区用户在链接上所表现出的网络结构进行分析,同时利用基于文本内容的分析方法对网络社区用户在文本内容上所表现的相同兴趣结构进行分析,将二者的结果进行差异性融合,得到具有综合性的网络社区用户群划分结果。在此基础上,分别对每一个划分结果运用社会网络分析方法对网络密度、群半径等多个指标进行评价,验证整个网络社区用户群划分结果的准确性。若发现不满足指标要求,将按照紧密程度对该群体成员进行筛选。以保证网络社区用户划分结果的可靠性。
一种基于链接与文本内容的网络社区用户群划分方法,其特征在于包括以下步骤:
步骤一,利用爬虫技术分别爬取网页文本内容(包括正文、评论)和链接(包括友情链接、引用链接),并分别存入文本数据库和链接数据库。
步骤二,利用基于java语言开发的中文分词工具包IKAnalyzer对网页文本内容进行中文分词,利用基于支持向量机(SVM)的文本分类方法对文本进行分类。
步骤三,统计每个网络用户的网页文本类别,得到网络社区中用户在文本内容中所表现的兴趣取向,并用向量表示如下:
Characteri={I1,I2,I3,……}
其中,Character表示用户兴趣特征集合,Ii表示兴趣i的特征权值。
以此为基础,网络社区用户兴趣以矩阵形式表示如下:
I 11 I 12 I 13 . . . I 1 n I 21 I 22 I 23 . . . I 2 n . . . . . . I m 1 I m 2 I m 3 . . . I mn
其中,n表示兴趣特征个数,m表示用户数量。
步骤四,通过计算最小类间距离和平均类内距离,选择最优聚类K的值,方法如下:
最小类间距离为:
b ( j , i ) = min i ≤ k ≤ c i , k ≠ j ( 1 n k Σ p = 1 n k | | x p ( k ) - x i ( j ) | | 2 )
其中,ci为聚类个数,k和j表示类别,均小于ci表示第j类的第i个样本,表示k类的第P个样本,nk表示k类中的样本数。
平均类内距离为:
w ( j , i ) = 1 n j - 1 Σ q = 1 , q ≠ i n j | | x q ( j ) - x i ( j ) | | 2
其中
Figure BDA00002924571600035
表示第j类的第q个样本,并且q≠i,nj表示第j类中的样本个数。
则该样本的最小类间距离和类内距离之和为:
baw(j,i)=b(j,i)+w(j,i)
最小类间距离和类内距离之差为:
bsw(j,i)=b(j,i)-w(j,i)
令:则最佳聚类数K为:
K = arg max { 1 n ΣΣU }
步骤五,根据K值选择结果,利用K-means算法,以网络社区用户兴趣矩阵作为输入,进行聚类分析,划分出基于用户兴趣的用户群体。
步骤六,顺序读取链接数据库,循环爬取每个URL内容中的友情链接与引用链接。
步骤七,统计每个连接出现在友情链接和引用链接中的次数,包括链接的出度和入度,其中,出度为引用的次数,入度为被引用的次数。
步骤八,应用Pajek提供的一整套复杂网络关系分析算法,利用Pajek可视化工具,输入链接出入度值,构建网络社区用户社群图,直观、清晰地展示用户间亲疏关系和群体分类情况。
步骤九,对社群图各群体划分情况进行分析,与基于文本内容的划分结果进行比较,对两者结果进行差异性融合。
步骤十,根据融合的结果,计算每个群网络密度、图直径、群半径和点的链接数量,并对点度中心度和凝聚子群进行分析和评价,剔除不满足指标的点。
网络密度的表达式为:
ρ = 2 * N line n * ( n - 1 )
其中,ρ网络密度,Nline为两点之间的连线数,n为点的个数。
图直径的表达式为:
D=max{d(i,j)}
其中,D为图直径,d(i,j)为i和j两点的距离。
与现有技术相比,本发明改进的地方主要有如下两点:
(1)现有的网络社区用户群划分方法基本是通过获取相互链接数量实现的,本发明考虑到用户通过相同兴趣爱好所表现出的关联关系。如ABCD四个用户,ABC三者之间存在链接关系,根据现有方法的划分结果为ABC一组,D一组,但事实ABC与D之间四者具有相同的兴趣爱好,因此利用本发明的方法可以得到ABCD之间是存在关联关系的,应划分为同一族群。
(2)现有的技术往往从单一指标对结果进行评价,如节点对社区贡献度,而本发明考虑到方法的实用意义,不仅利用社会网络分析方法对网络划分结果进行二次反复验证,同时通过密度、图直径、群半径和点的链接数量,并对点度中心度、凝聚子群等几个指标对每个族群划分结果进行评价。增强了分析结果的可信度与可靠性。
本发明的有益效果是:在利用链接分析的基础上,结合文本兴趣偏好分析,对网络社区用户群进行划分。通过两种方式相互验证和补充,提高了划分结果的准确性、可靠性,使得网络社区用户群的划分不再单纯以链接关系作为依据,更多地突出了丰富的文本信息在网络社区用户群划分过程中的重要作用。本发明不仅客观地反映了网络社区中用户之间的关系,而且清晰地展示了用户群体的公共兴趣特征,为向不同特征的用户群提供更主动、直接的服务,如业务推荐和朋友推荐等,提供了依据,也为电子商务和个性化服务提供基础性技术支撑。
附图说明
图1为本发明的整体结构图;
图2为本发明所涉及的方法流程图;
图3为计算得到的U—K曲线;
图4为基于链接分析的用户群划分结果图;
图5为基于链接与文本内容的网络社区划分结果图。
具体实施方式
下面结合附图对本发明实施例进行详细说明。
本发明的整体结构图如图1所示。本发明包括分析阶段和验证修正阶段两部分。其中分析阶段主要利用链接分析和聚类分析两种方法;验证与修正阶段主要利用社会网络分析方法中的多个指标对网络社区用户群划分结果进行评价。对于不满足指标标准的进行及时修正。
本实施例选取新浪博客进行网络社区用户群划分方法实现的对象,并从中任意选择1000位博主作为研究目标。本发明的方法流程图如图2所示,具体包括以下步骤:
步骤一,爬取每个用户的网页文本内容与链接,存入文本数据库和链接数据库。
步骤二,利用基于java语言开发的中文分词工具包IKAnalyzer对网页文本内容进行中文分词,利用基于支持向量机(SVM)的文本分类方法对文本进行分类。
步骤三,对用户兴趣进行表示,其中选取7个兴趣特征,分别为娱乐、经济、文学、科技、健康、军事、体育,则网络社区用户兴趣表示结果如下:
0.14 0.25 0.08 0.43 0.05 0.00 0 . 05 0.52 0.02 0.10 0.03 0.12 0.00 0.21 0.17 0.13 0.03 0.16 0.04 0.43 0.04 . . . . . . 0.09 0.22 0.13 0.08 0.15 0.03 0.30
步骤四,通过计算最小类间距离和平均类内距离,选择最优K值。K的范围为2~10。通过计算得到的U—K曲线如图3所示,由图可知,K=5时,U取得最大值,所以K的最优值为5。
步骤五,令K=5,利用K-means算法,以网络社区用户兴趣矩阵作为输入,进行聚类分析,划分出基于用户兴趣的用户群体。划分结果如表1所示。
表1 基于文本内容的用户群划分结果
娱乐 经济 文学 科技 健康 体育 军事 编号 类别
12.9 19.35 16.94 9.68 0.81 40.32 0.00 4 1
2.55 16.36 8.73 49.45 0.00 20 0.00 7 1
7.41 25.93 20.37 1.85 0.00 42.59 0.00 11 1
0.00 23.81 12.38 31.43 0.00 24.29 0.48 12 1
3.85 30.29 11.54 17.31 0.00 33.65 0.00 14 1
14.71 23.53 16.91 11.03 0.00 30.88 1.47 18 1
3.30 8.96 18.40 16.40 0.47 48.58 0.00 19 1
14.09 22.82 24.83 4.03 0.00 31.54 0.00 24 1
0.78 19.38 8.53 44.96 0.00 22.87 0.00 26 1
12.03 13.53 21.80 12.78 1.50 33.83 0.00 28 1
14.63 22.56 12.80 15.24 2.44 29.27 0.00 31 1
4.36 18.12 15.94 12.32 0.00 47.10 0.00 33 1
从表1可以看出,类别1中包含编号为4、7、11、12、14等多个用户,这些用户的共同特征为对体育和经济表现出极大的兴趣,而对于健康和军事方面信息关注度不高。
步骤六,读取链接数据库,爬取每个URL内容中的友情链接与引用链接。
步骤七,统计每个链接的出度和入度,其中出度为引用的次数,入度为被引用的次数。
步骤八,利用Pajek可视化工具,输入链接出入度值,构建网络社区用户社群图。基于链接的用户群划分结果如图4所示。
步骤九,对社群图各群体划分情况进行分析,与基于文本内容的划分结果进行比较,对两者结果进行差异性融合。
对社群图各群体划分情况进行分析,与基于文本内容的划分结果进行比较,发现基于链接的划分结果中,缺少编号为26、33、14、42、4等多个结点,说明在这些用户之间不存在链接关系,但是从基于文本内容的划分结果中,可以看出他们之间是具有共同特性与兴趣联系的。对两者结果进行差异性融合后的结果如图5所示。
步骤十,根据上述结果,计算每个群网络密度、图直径、群半径和点的链接数量,并对点度中心度、凝聚子群进行分析和评价,剔除不满足指标的点。
经计算群密度为0.0435718,图的直径为12,一般情况下,群密度>0.01说明该网络内点与点之间连接比较紧密。18号节点是整个网络的中心结点,点度中心度为59,而81号结点点度中心度为1,与其他节点连接不紧密,说明该用户与其他用户联系不频繁,因此可以剔除该结点。

Claims (1)

1.一种基于链接与文本内容的网络社区用户群划分方法,其特征在于包括以下步骤:
步骤一,利用爬虫技术分别爬取网页文本内容和链接,并分别存入文本数据库和链接数据库;
步骤二,利用基于java语言开发的中文分词工具包IKAnalyzer对网页文本内容进行中文分词,利用基于支持向量机的文本分类方法对文本进行分类;
步骤三,统计每个网络用户的网页文本类别,得到网络社区中用户在文本内容中所表现的兴趣取向,并用向量表示如下:
Characteri={I1,I2,I3,……}
其中,Character表示用户兴趣特征集合,Ii表示兴趣i的特征权值;
以此为基础,用下面的矩阵形式表示网络社区用户兴趣:
I 11 I 12 I 13 . . . I 1 n I 21 I 22 I 23 . . . I 2 n . . . . . . I m 1 I m 2 I m 3 . . . I mn
其中,n表示兴趣特征个数,m表示用户数量;
步骤四,通过计算最小类间距离和平均类内距离,选择最优聚类K的值,方法如下:
最小类间距离为:
b ( j , i ) = min i ≤ k ≤ c i , k ≠ j ( 1 n k Σ p = 1 n k | | x p ( k ) - x i ( j ) | | 2 )
其中,ci为聚类个数,k和j表示类别,其值均小于
Figure FDA00002924571500013
表示第j类的第i个样本,
Figure FDA00002924571500014
表示k类的第P个样本,nk表示k类中的样本数;
平均类内距离为:
w ( j , i ) = 1 n j - 1 Σ q = 1 , q ≠ i n j | | x q ( j ) - x i ( j ) | | 2
其中,表示第j类的第q个样本,并且q≠i,nj表示第j类中的样本个数;
则该样本的最小类间距离和类内距离之和为:
baw(j,i)=b(j,i)+w(j,i)
最小类间距离和类内距离之差为:
bsw(j,i)=b(j,i)-w(j,i)
令:
Figure FDA00002924571500021
则最佳聚类数K为:
K = arg max { 1 n ΣΣU }
步骤五,根据K值选择结果,利用K-means算法,以网络社区用户兴趣矩阵作为输入,进行聚类分析,划分出基于用户兴趣的用户群体;
步骤六,顺序读取链接数据库,循环爬取每个URL内容中的友情链接与引用链接;
步骤七,统计每个连接出现在友情链接和引用链接中的次数,包括链接的出度和入度,其中,出度为引用的次数,入度为被引用的次数;
步骤八,应用Pajek提供的一整套复杂网络关系分析算法,利用Pajek可视化工具,输入链接出入度值,构建网络社区用户社群图,展示用户间亲疏关系和群体分类情况;
步骤九,对社群图各群体划分情况进行分析,与基于文本内容的划分结果进行比较,对两者结果进行差异性融合;
步骤十,根据融合的结果,计算每个群网络密度、图直径、群半径和点的链接数量,并对点度中心度和凝聚子群进行分析和评价,剔除不满足指标的点;
网络密度的表达式为:
ρ = 2 * N line n * ( n - 1 )
其中,ρ网络密度,Nline为两点之间的连线数,n为点的个数;
图直径的表达式为:
D=max{d(i,j)}
其中,D为图直径,d(i,j)为i和j两点的距离。
CN201310084039.1A 2013-03-15 2013-03-15 基于链接与文本内容的网络社区用户群划分方法 Active CN103218400B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310084039.1A CN103218400B (zh) 2013-03-15 2013-03-15 基于链接与文本内容的网络社区用户群划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310084039.1A CN103218400B (zh) 2013-03-15 2013-03-15 基于链接与文本内容的网络社区用户群划分方法

Publications (2)

Publication Number Publication Date
CN103218400A true CN103218400A (zh) 2013-07-24
CN103218400B CN103218400B (zh) 2017-04-05

Family

ID=48816187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310084039.1A Active CN103218400B (zh) 2013-03-15 2013-03-15 基于链接与文本内容的网络社区用户群划分方法

Country Status (1)

Country Link
CN (1) CN103218400B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572985A (zh) * 2015-01-04 2015-04-29 大连理工大学 一种基于复杂网络社区发现的工业数据样本筛选方法
CN104794145A (zh) * 2014-01-17 2015-07-22 英特尔公司 基于内容和关系距离来连接人们
CN104933621A (zh) * 2015-06-19 2015-09-23 天睿信科技术(北京)有限公司 一种担保圈的大数据分析系统和方法
CN105488211A (zh) * 2015-12-11 2016-04-13 成都陌云科技有限公司 基于特征分析的用户群确定方法
CN105512301A (zh) * 2015-12-11 2016-04-20 成都陌云科技有限公司 基于社交内容的用户分组方法
CN105630980A (zh) * 2015-12-25 2016-06-01 北京奇虎科技有限公司 游戏推荐策略获取方法及装置
CN103778186B (zh) * 2013-12-31 2016-08-10 南京财经大学 一种“网络马甲”的检测方法
CN105989077A (zh) * 2015-02-09 2016-10-05 北京字节跳动科技有限公司 一种基于推荐的兴趣社区用户引导方法
CN106095839A (zh) * 2016-06-03 2016-11-09 北京网智天元科技股份有限公司 特定观影群体数据的提取及其处理方法
CN107436877A (zh) * 2016-05-25 2017-12-05 北京京东尚科信息技术有限公司 热点话题推送方法和装置
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2326805A1 (en) * 2000-11-24 2002-05-24 Ibm Canada Limited-Ibm Canada Limitee Method and apparatus for deleting data in a database
CN1564157A (zh) * 2004-03-23 2005-01-12 南京大学 一种可扩展、可定制的主题集中式万维网爬虫设置方法
CN101751438A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 自适应语义驱动的主题网页过滤系统
CN102075851A (zh) * 2009-11-20 2011-05-25 北京邮电大学 一种移动网络中用户偏好的获取方法及系统
CN102880644A (zh) * 2012-08-24 2013-01-16 电子科技大学 社区发现方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2326805A1 (en) * 2000-11-24 2002-05-24 Ibm Canada Limited-Ibm Canada Limitee Method and apparatus for deleting data in a database
CN1564157A (zh) * 2004-03-23 2005-01-12 南京大学 一种可扩展、可定制的主题集中式万维网爬虫设置方法
CN101751438A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 自适应语义驱动的主题网页过滤系统
CN102075851A (zh) * 2009-11-20 2011-05-25 北京邮电大学 一种移动网络中用户偏好的获取方法及系统
CN102880644A (zh) * 2012-08-24 2013-01-16 电子科技大学 社区发现方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
付志涛: "基于Web日志的网络用户聚类研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
周世兵等: "K-means算法最佳聚类数确定方法", 《计算机应用》 *
王天宇: "社交网络服务的用户群体特征分析与组织探测研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778186B (zh) * 2013-12-31 2016-08-10 南京财经大学 一种“网络马甲”的检测方法
CN104794145A (zh) * 2014-01-17 2015-07-22 英特尔公司 基于内容和关系距离来连接人们
CN104794145B (zh) * 2014-01-17 2019-09-13 英特尔公司 基于内容和关系距离来连接人们
US10002127B2 (en) 2014-01-17 2018-06-19 Intel Corporation Connecting people based on content and relational distance
CN104572985A (zh) * 2015-01-04 2015-04-29 大连理工大学 一种基于复杂网络社区发现的工业数据样本筛选方法
CN105989077A (zh) * 2015-02-09 2016-10-05 北京字节跳动科技有限公司 一种基于推荐的兴趣社区用户引导方法
CN104933621A (zh) * 2015-06-19 2015-09-23 天睿信科技术(北京)有限公司 一种担保圈的大数据分析系统和方法
CN105512301A (zh) * 2015-12-11 2016-04-20 成都陌云科技有限公司 基于社交内容的用户分组方法
CN105488211A (zh) * 2015-12-11 2016-04-13 成都陌云科技有限公司 基于特征分析的用户群确定方法
CN105630980A (zh) * 2015-12-25 2016-06-01 北京奇虎科技有限公司 游戏推荐策略获取方法及装置
CN105630980B (zh) * 2015-12-25 2019-05-28 北京奇虎科技有限公司 游戏推荐策略获取方法及装置
CN107436877A (zh) * 2016-05-25 2017-12-05 北京京东尚科信息技术有限公司 热点话题推送方法和装置
CN107436877B (zh) * 2016-05-25 2021-03-30 北京京东尚科信息技术有限公司 热点话题推送方法和装置
CN106095839A (zh) * 2016-06-03 2016-11-09 北京网智天元科技股份有限公司 特定观影群体数据的提取及其处理方法
CN106095839B (zh) * 2016-06-03 2020-02-14 网智天元科技集团股份有限公司 特定观影群体数据的提取及其处理方法
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法

Also Published As

Publication number Publication date
CN103218400B (zh) 2017-04-05

Similar Documents

Publication Publication Date Title
CN103218400A (zh) 基于链接与文本内容的网络社区用户群划分方法
CN103488678B (zh) 一种基于用户签到相似度的好友推荐系统
US20210224269A1 (en) Method and apparatus of recommending information based on fused relationship network, and device and medium
CN104794656A (zh) 一种应用于社交网络的推荐方法和推荐系统
KR101543780B1 (ko) 동적 사용자 프로필 및 소셜 네트워크 신뢰성을 이용한 전문가 검색 시스템 및 방법
CN104834695A (zh) 基于用户兴趣度和地理位置的活动推荐方法
CN104008109A (zh) 基于用户兴趣的Web信息推送服务系统
CN103116611A (zh) 社交网络意见领袖识别方法
CN103176982A (zh) 一种电子图书推荐的方法及系统
CN103778145A (zh) 一种信息推荐方法和系统
KR20160079863A (ko) 소셜 데이터 네트워크에서의 사용자의 거동 세그먼트화를 위한 시스템 및 방법
CN102163198A (zh) 提供新词或热词的方法及系统
CN107562947A (zh) 一种移动时空感知下动态即时推荐服务模型建立方法
CN106407349A (zh) 一种产品推荐方法及装置
CN105095625B (zh) 点击率预估模型建立方法、装置及信息提供方法、系统
CN102855333A (zh) 一种基于组推荐的服务选取系统及其选取方法
CN102682046A (zh) 社交网络的节点搜索和分析方法及搜索系统
Bagci et al. Random walk based context-aware activity recommendation for location based social networks
CN107403007A (zh) 一种基于网络的微博消息可信度判别模型的方法
CN104731958A (zh) 一种面向用户需求倾向的云制造服务推荐方法
CN103136331A (zh) 微博网络意见领袖识别方法
CN106354844A (zh) 基于文本挖掘的服务组合包推荐系统及方法
Zhang et al. Proposing a new friend recommendation method, FRUTAI, to enhance social media providers' performance
Ju et al. Relationship strength estimation based on Wechat Friends Circle
CN106302849A (zh) 一种通过运营商数据进行移固融合的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20130724

Assignee: Luoyang Jinhui Electronic Technology Co.,Ltd.

Assignor: Beijing University of Technology

Contract record no.: X2024980000220

Denomination of invention: A method for dividing user groups in online communities based on links and text content

Granted publication date: 20170405

License type: Common License

Record date: 20240105

EE01 Entry into force of recordation of patent licensing contract