CN104391887B - 一种基于网络结构优化的节点属性划分朋友圈的方法 - Google Patents
一种基于网络结构优化的节点属性划分朋友圈的方法 Download PDFInfo
- Publication number
- CN104391887B CN104391887B CN201410629873.9A CN201410629873A CN104391887B CN 104391887 B CN104391887 B CN 104391887B CN 201410629873 A CN201410629873 A CN 201410629873A CN 104391887 B CN104391887 B CN 104391887B
- Authority
- CN
- China
- Prior art keywords
- friend
- friends
- characteristic vector
- circle
- corporations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 27
- 238000005457 optimization Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于网络结构优化的节点属性划分朋友圈的方法,包括:建立特征向量步骤;计算朋友之间的曼哈顿距离步骤;选定核心朋友步骤;划分社团步骤;社团优化调整步骤。本发明先使用节点属性进行初步的社团划分,然后利用网络结构信息对于划分结果进一步优化调整,充分利用在线社交网络中可以获取到的信息,能够获得更加准确的社团划分结果,从而实现对用户的朋友圈自动分组,能够有效完善社交网络平台功能,适用于社交网络平台功能的应用和优化。
Description
技术领域
本发明属于数据处理技术领域,尤其是涉及一种根据社交网络中用户朋友圈中朋友的档案信息,进行分组划分,然后利用朋友圈中朋友连接关系对分组进行优化的朋友圈分组方法。
背景技术
社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系,这些个体成员拥有共同的兴趣、同属某一特定的主题或是共有某种属性。随着社交网络的发展,我们可能在一个社交网络平台上拥有几百甚至上千在线朋友组成的朋友圈,我们“粉”(建立社交关系)的人会产生大量的信息,为了处理信息过载问题,就需要管理我们的个人社交网络。当社交朋友数量越来越庞大时,对朋友圈进行分组就成为必然。而当前的社交网络平台中没有提供自动分组功能,对于在社交平台上拥有上千乃至上万朋友的用户来说,手工对朋友圈进行分组是一件耗时费力的事情。
发明内容
为解决上述问题,本发明公开了基于网络结构优化的节点属性划分朋友圈的方法,它先采用朋友圈中用户的档案信息作为依据进行粗略的分组,然后利用朋友圈的网络结构对分组进行调整,实现对于朋友圈自动分组的功能。
为了达到上述目的,本发明提供如下技术方案:
一种基于网络结构优化的节点属性划分朋友圈的方法,包括以下步骤:
建立特征向量:根据当前用户朋友圈中每个朋友的档案信息建立朋友的特征向量;
计算朋友之间的曼哈顿距离:先对两个朋友之间的特征向量取并,然后对得到的结果向量取模;
选定核心朋友:选取与其他任意朋友距离都小于阈值α的朋友作为核心;
划分社团:针对每个核心朋友,找到其余用户与核心朋友共同的特征,根据共同特征扩展具有相同特征的朋友形成社团;
社团优化调整:将朋友调整至与其连接数最大的分组中。
进一步的,所述特征向量包括以下信息中的至少一种:年龄、性别、所在地、出生地、教育经历、工作单位、工作地点、爱好。
优选的,阈值α的取值范围如下:1/3特征向量维度数≤阈值α≤1/2特征向量维度数。
具体的,所述特征向量维度数与建立特征向量步骤中选取的档案信息数量一致。
具体的,所述社团优化调整步骤具体为:计算每个朋友与其所属的多个分组的连接数,选其最大连接数的分组作为该朋友的分组,循环迭代,直到分组不再发生变化或者达到一定的次数。
与现有技术相比,本发明具有如下优点和有益效果:
本发明基于网络结构优化的节点属性划分朋友圈,有效组织个人朋友圈,从而可以过滤冗杂无用的信息,有效避免信息过载问题。本发明先使用节点属性进行初步的社团划分,然后利用网络结构信息对于划分结果进一步优化调整,充分利用在线社交网络中可以获取到的用户档案信息和结构信息,能够获得更加准确的社团划分结果,从而实现对用户的朋友圈自动分组,避免有一方信息缺失时带来的缺陷。本发明能够有效完善社交网络平台功能,适合于各类社交网络平台给用户提供自动分组朋友圈的功能,适用于社交网络平台功能的应用和优化。
附图说明
图1为本发明的步骤流程图。
具体实施方式
以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
本发明步骤流程图如图1所示,具体包括如下步骤:
步骤10,采用个人用户在某一社交网络的朋友圈中朋友档案信息中的各类信息——如年龄、性别、所在地、出生地、教育经历、工作单位、工作地点、爱好等等建立朋友圈中每个朋友的特征向量Xi,Xi=(x1,x2,...,xm),其中xj(1≤j≤m)是档案信息中某一信息的整数表示,比如1代表男性0代表女性。假设朋友圈中有N个朋友,则i∈[0,N),根据选取档案信息的项数特征向量有相应的维度m,在同一朋友圈中为朋友建立特征向量时应选取相同的档案信息。
步骤20,计算任意两个朋友之间的曼哈顿距离dij(dij表示朋友i与朋友j之间的曼哈顿距离)。计算两个特征向量的曼哈顿距离本质上就是计算两个用户拥有相同特征的多少,在同一社团的用户更倾向于有更多的相同特征。曼哈顿距离的计算方法是:先对两个特征向量取并,然后对得到的结果向量取模,即dij=||Xi&Xj||。
步骤30,选取与朋友圈中其他所有朋友的曼哈顿距离都小于α的朋友作为核心朋友。这样选出来的朋友具有独特的特征,和其他朋友相互之间拥有同样特征的可能性最小,能够相互区分开,根据这样的核心扩展能够得到较好的社团划分结果。α的取值根据步骤10中建立的特征向量维度的大小来选取,一般是经验值。朋友圈中的朋友联系得松散,阈值α的取值就要小一些;朋友圈中的朋友联系得紧密,阈值α的取值就要相应大一些,一般以选在特征向量维度数的1/3到1/2之间为佳。
步骤40,基于核心朋友,寻找其余朋友与核心朋友的共同特征并进行分组。当找到当前用户与核心朋友共同的特征时,当记录特征在特征向量Xi中的位置,以此为根据在其余非核心朋友中继续寻找拥有这些特征的朋友扩展进一个分组中,并标识该分组为Ck(k∈[0,K),K是核心朋友的总数,k表示当前核心朋友的标号),本方法允许一个朋友属于多个社团。这些特征标示着这个分组(即社团)的特征,比如一个核心朋友与当前用户有着类似的年龄和相同的大学教育经历,那么这个核心朋友扩展出的分组必定是当前用户的大学同学;对每一个核心朋友进行此项操作,遍历每一个用户,形成初步的社团划分结果。
步骤50,档案信息不全或者出于隐私考虑并不对外公开,上述步骤就不能有效划分了,所以在本步骤利用朋友的连接关系,对于前边得到的社团进行调整。
使用朋友圈的网络结构对分组调整。
步骤501,计算每一个朋友相对于每一个分组Ck中的朋友有边相连(即指人与人之间具有关联)的连接数,存储到lik中,其中i表示第i个朋友,k表示第k个分组,lik表示第i个朋友与社团Ck中的多少个朋友有边相连。
步骤502,找出当前朋友i与所有分组的连接数最大的那个分组的标号(即朋友i的lik最大时的k值)。如果指朋友i未被划分到连接数最大的那个分组中,那么调整这个朋友的分组为连接数最大的分组,转到步骤501循环迭代,直到分组不再发生变化或者迭代达到一定的次数。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (5)
1.一种基于网络结构优化的节点属性划分朋友圈的方法,其特征在于,包括以下步骤:
建立特征向量:根据当前用户朋友圈中每个朋友的档案信息建立朋友的特征向量;
计算朋友之间的曼哈顿距离:dij=||Xi&Xj||,其中,Xi、Xj分别为朋友i和朋友j的特征向量、dij表示朋友i与朋友j之间的曼哈顿距离;
选定核心朋友:选取与其他任意朋友距离都小于阈值α的朋友作为核心;
划分社团:对照当前用户的特征向量和核心朋友的特征向量找到一致特征,参照一致特征对比其他非核心朋友,将拥有同样特征的非核心朋友加入到核心朋友所在的社团;
社团优化调整:将朋友调整至与其连接数最大的分组中。
2.根据权利要求1所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于,所述特征向量包括以下信息中的至少一种:年龄、性别、所在地、出生地、教育经历、工作单位、工作地点、爱好。
3.根据权利要求1或2所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于,所述阈值α的取值范围如下:1/3特征向量维度数≤阈值α≤1/2特征向量维度数。
4.根据权利要求3所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于:所述特征向量维度数与建立特征向量步骤中选取的档案信息数量一致。
5.根据权利要求1或2所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于:所述社团优化调整步骤具体为:计算每个朋友与其所属的多个分组的连接数,选其最大连接数的分组作为该朋友的分组,循环迭代,直到分组不再发生变化或者达到一定的次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410629873.9A CN104391887B (zh) | 2014-11-10 | 2014-11-10 | 一种基于网络结构优化的节点属性划分朋友圈的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410629873.9A CN104391887B (zh) | 2014-11-10 | 2014-11-10 | 一种基于网络结构优化的节点属性划分朋友圈的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104391887A CN104391887A (zh) | 2015-03-04 |
CN104391887B true CN104391887B (zh) | 2018-01-12 |
Family
ID=52609791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410629873.9A Expired - Fee Related CN104391887B (zh) | 2014-11-10 | 2014-11-10 | 一种基于网络结构优化的节点属性划分朋友圈的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104391887B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110083777B (zh) * | 2018-01-26 | 2022-11-25 | 腾讯科技(深圳)有限公司 | 一种社交网络用户分组方法、装置及服务器 |
CN108848097A (zh) * | 2018-06-25 | 2018-11-20 | 武汉滴滴网络科技有限公司 | 一种基于情侣网络社交的系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916256A (zh) * | 2010-07-13 | 2010-12-15 | 北京大学 | 综合行动者兴趣与网络拓扑的社区发现方法 |
CN103426042A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 社交网络的分组方法及系统 |
CN103428164A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 用户社交网络关系圈划分方法和系统 |
CN103577493A (zh) * | 2012-08-09 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种社交网络中好友分组的方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2754120A4 (en) * | 2011-02-22 | 2015-02-18 | Rao S Infosoft Join Pvt Ltd | COMMUNICATION BASED ON GROUPS IN A SPACE OF SOCIAL NETWORKING |
-
2014
- 2014-11-10 CN CN201410629873.9A patent/CN104391887B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916256A (zh) * | 2010-07-13 | 2010-12-15 | 北京大学 | 综合行动者兴趣与网络拓扑的社区发现方法 |
CN103426042A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 社交网络的分组方法及系统 |
CN103428164A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 用户社交网络关系圈划分方法和系统 |
CN103577493A (zh) * | 2012-08-09 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种社交网络中好友分组的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104391887A (zh) | 2015-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10474827B2 (en) | Application recommendation method and application recommendation apparatus | |
CN105468742B (zh) | 恶意订单识别方法及装置 | |
CA2880737C (en) | A user recommendation method and a user recommendation system using the same | |
CN102831176B (zh) | 推荐好友的方法及服务器 | |
CN104778173B (zh) | 目标用户确定方法、装置及设备 | |
CN103325061B (zh) | 一种社区发现方法和系统 | |
CN107545889A (zh) | 适用于模式识别的模型的优化方法、装置及终端设备 | |
US10169476B2 (en) | Method, apparatus, and computer-readable storage medium for grouping social network nodes | |
CN109389168A (zh) | 项目推荐模型训练方法、项目推荐方法以及装置 | |
CN113343803A (zh) | 模型训练方法、装置、设备和存储介质 | |
CN108022171B (zh) | 一种数据处理方法及设备 | |
EP3667517A1 (en) | Natural language processing method and apparatus | |
KR101356948B1 (ko) | Sns에서 사회적 이웃의 관심사와 사회적 활동의 토픽을 통해 사용자 관심사를 추론하는 방법 및 그 시스템 | |
CN115270001B (zh) | 基于云端协同学习的隐私保护推荐方法及系统 | |
CN113205495B (zh) | 图像质量评价及模型训练方法、装置、设备和存储介质 | |
CN107346333A (zh) | 一种基于链路预测的在线社交网络好友推荐方法与系统 | |
WO2023065640A1 (zh) | 一种模型参数调整方法、装置、电子设备和存储介质 | |
CN104391887B (zh) | 一种基于网络结构优化的节点属性划分朋友圈的方法 | |
CN115796310A (zh) | 信息推荐及模型训练方法、装置、设备和存储介质 | |
CN112331261A (zh) | 药物预测方法及模型的训练方法、装置、电子设备及介质 | |
CN114841371A (zh) | 基于特征的分箱处理方法、装置、设备及介质 | |
CN113052246B (zh) | 用于训练分类模型及图像分类的方法和相关装置 | |
CN105069003B (zh) | 一种基于转发链相似度的用户关注对象推荐计算方法 | |
CN107918652B (zh) | 一种利用多模态网络学习进行基于社交关系的电影推荐的方法 | |
CN113240177A (zh) | 训练预测模型的方法、预测方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220129 Address after: Room 301, No. 6, shuiyougang, Gulou District, Nanjing, Jiangsu 210013 Patentee after: Nanjing mujin Education Technology Co.,Ltd. Address before: 210044 No. 219, Ning six road, Nanjing, Jiangsu Patentee before: Nanjing University of Information Science and Technology |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180112 |
|
CF01 | Termination of patent right due to non-payment of annual fee |