CN107767278A - 社群层次结构构建方法和装置 - Google Patents
社群层次结构构建方法和装置 Download PDFInfo
- Publication number
- CN107767278A CN107767278A CN201610672105.0A CN201610672105A CN107767278A CN 107767278 A CN107767278 A CN 107767278A CN 201610672105 A CN201610672105 A CN 201610672105A CN 107767278 A CN107767278 A CN 107767278A
- Authority
- CN
- China
- Prior art keywords
- user
- community
- data
- hierarchy
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims description 52
- 238000012546 transfer Methods 0.000 claims description 39
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 10
- 230000002452 interceptive effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种社群层次结构构建方法,所述方法包括:获取社群中的社交数据;根据所述社交数据构建数据网络,所述数据网络中以所述社群中的用户为节点,以用户之间的社交关系为边;根据所述数据网络计算所述社群中的用户层级数据,所述用户层级数据反映了用户在所述社群中的重要性;根据所述用户层级数据构建所述社群的层次结构数据。由于所获取的社交数据能够体现出用户在社群中所生成与用户在社群中的地位、作用或重要性等,因而根据社交数据所构建出的社群层次结构的准确性更高。此外,还对应提供了一种社群层次结构构建装置。
Description
技术领域
本发明涉及信息处理技术领域,特别是涉及一种社群层次结构构建方法和装置。
背景技术
社群是某种特殊的社会关系、地区性的社区群体,由多个具有相同关联关系的用户所构成。不同的社群具有相同或不同的层次结构。社群的层次结构是以一定的标准区分出来的,反映社群用户在社群体系架构中的地位及作用的组织结构。
传统的社群结构层次的构建方法一般是通过对社群用户基本信息来构建社群层次结构,由于网络上的用户的基本信息不一定真实,因而传统的方法所构建的社群的层次结构的准确度不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高社群层次结构的构建的准确度的社群层次结构构建方法和装置。
一种社群层次结构构建方法,所述方法包括:
获取社群中的社交数据;
根据所述社交数据构建数据网络,所述数据网络中以所述社群中的用户为节点,以用户之间的社交关系为边;
根据所述数据网络计算所述社群中的用户层级数据,所述用户层级数据反映了用户在所述社群中的重要性;
根据所述用户层级数据构建所述社群的层次结构数据。
一种社群层次结构构建装置,所述装置包括:
社交数据获取模块,用于获取社群中的社交数据;
数据网络构建模块,用于根据所述社交数据构建数据网络,所述数据网络中以所述社群中的用户为节点,以用户之间的社交关系为边;
用户层级数据计算模块,用于根据所述数据网络计算所述社群中的用户层级数据,所述用户层级数据反映了用户在所述社群中的重要性;
层次结构数据构建模块,用于根据所述用户层级数据构建所述社群的层次结构数据。
本实施例中,通过根据社交数据构建数据网络,并根据所构建的社交网络来计算处社群中的用户层级数据,进而根据用户层级数据来构建该社群的层次结构数据,由于所获取的社交数据能够体现出用户在社群中所生成与用户在社群中的地位、作用或重要性等,因而根据社交数据所构建出的社群层次结构的准确性更高。
附图说明
图1为一个实施例中用于实现社群层次结构构建方法的服务器的内部结构图;
图2为一个实施例中社群层次结构构建方法的流程图;
图3为一个实施例中用户层级数据分布的示意图;
图4为一个实施例中根据数据网络计算社群中的用户层级数据的步骤的流程图;
图5为一个实施例中根据初始权值向量和邻接矩阵进行计算,得到社群中的用户层级数据的步骤的流程图;
图6为一个实施例中社群层次结构构建装置的结构框图;
图7为另一个实施例中社群层次结构构建装置的结构框图;
图8为一个实施例中用户层级数据计算模块的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1所示,提供了一种服务器,该服务器用于实现社群层次结构构建方法,包括通过系统总线连接的处理器、存储介质和内存。其中,该服务器的存储介质存储有操作系统、数据库和一种社群层次结构构建装置。数据库用于存储数据,如存储每个社群的用户信息以及该社群中的社交数据等。该操作系统用于实现一种社群层次结构构建方法。该服务器的处理器用于提供计算和控制能力,支撑整个接入服务器的运行。该服务器的内存为存储介质中的社群层次结构构建装置的运行提供环境。
在一个实施例中,如图2所示,提供了一种社群层次结构构建方法,该方法可应用于如图1所示的服务器中,具体包括以下步骤:
步骤202,获取社群中的社交数据。
本实施例中,社群是由多个具有某种相同关系属性的网络用户所构成的一种的社区群体,一般表示为具有相互关系的网络。一个班级、一个企业或者一种依托网络存在的新媒体平台都可以看作一个社群。比如为由相互之间具有同学关系的用户所构成的一个班级社群,或者为同一企业之间的同事所构成的企业社群等等。社群可由一个群组所构成,也可由多个具有关联性的社群所构成,该群组包括即时通信中的聊天群或讨论组等。
每个社群对应设置有一个社群标识,通过该社群标识可唯一识别和确定相应的社群。服务器可根据企业挖掘数据及好友关系链数据来构建所要识别用户身份的社群。
进一步的,社群中的信息包括社群的描述信息、社群中的用户的基本信息以及社群中的社交数据等。社群的描述信息包括社群的名称以及社群的类别,社群的类别包括企业类社群和学校类社群等,不同类别的社群用户的用户层级数据也不相同。用户层级数据用于反映相应用户在该社群中的地位及作用。
比如企业类社群,其内用户的级别层次可包括领导层、经理层、组长层以及普通员工等,对于学校类的社群,其内用户的级别层次可包括校长、年级主任、普通老师、学生等。
具体的,服务器可记录用户在社群中的社交数据,社交数据为用户在社群中所生成与用户在社群中的地位、作用或重要性等具有关联性的社交数据。该社交数据可包括用户在社群中发送的文章或评论等信息,还可包括社群中的用户之间的资源转移数据等。
资源可以是但不限于货币金额、虚拟货币金额、积分数额、电子代金券、电子凭证、电子优惠券、购物券等,其在第三方平台上的展示形式通常是以“电子红包”的样式进行展示。服务器可记录每个资源的发送用户、接收用户以及资源数额等数据,根据该所记录的信息构成相应的资源转移数据。
在一个实施例中,获取社群中的社交数据的步骤,包括:获取预设时间段内所生成的社交数据,
其中,预设时间段可为任意设置的时间段,比如,可为最近一个月、半年或一年等。服务器在记录社交数据的过程中,可对应记录该社交数据所生成的时间,根据该生成时间来判断相应的社交数据是否在预设时间段内。服务器在准备构建社或更新群层次结构的时候,可获取该社群在最近的一段时间内所产生的社交数据。
步骤204,根据社交数据构建数据网络,数据网络中以社群中的用户为节点,以用户之间的社交关系为边。
本实施例中,可将社群中的用户作为节点,将用户与用户之间的社交关系作为边。其中,边所表示的社交关系可以是好友关系或者用户之间的互动联系。比如,用户A所生成的一条社交数据,该社交数据和用户B之间具有互动联系,则记有用户A到用户B(B->A)的一条有向边。通过所形成的用户节点与边可构成相应的数据网络。
比如该社交数据为用户A在社群中所发送的一篇文章,该文章被用户B所评论、收藏或转发等,使得与用户B产生了互动联系。又比如,该社交数据为用户A在社群中所发送的一个资源,该资源被用户B所获取。
步骤206,根据数据网络计算社群中的用户层级数据,用户层级数据反映了用户在社群中的重要性。
本实施例中,可通过数据网络中的节点与边构建相关的计算模型,将所构建的边中所反映的社交关系进行量化,生成相应的数值。具体的,服务器可根据具体的社交数据设置对应的量化规则,根据社交数据在社群中所体现的用户的重要性大小来以及用户之间的社交关系的紧密程度来进行相匹配的量化,对于重要性越大、或社交关系越紧密的社交数据,其所量化到数据网络中的用户节点或边所对应的数值也越大。
根据所构建的模型采用对应的数值计算,以计算出社群中的用户层级数据,该用户层级数据为根据量化后的社交数据所计算出的具体数值,该数值的大小可反映出对应用户在社群中的重要性。一般的,同一社群中,数值越大的用户层级数据,其对应用户在该社群中的重要性越大。
步骤208,根据用户层级数据构建社群的层次结构数据。
本实施例中,根据社群中的整体用户的用户层级数据的分布情况来构建社群的层次结构数据。其中,层次结构数据包括社群的层级数量,以及每个层级中所包含的用户与用户数量。具体的,可根据用户层级数据的分布情况,将处于相同或相近数量级的用户层级数据对应的用户划分到作为同一级别层次(同一层级),根据所划分的级别层次的数量和每个层次对应的平均用户层级数据之间的差值来确定该社群的层次结构数据。并可根据该层次结构数据反映出社群的整体层级形式,比如表现为锥形的层级或扁平型的层级等。
举例来说,如图3所示,提供了一种用户层级数据分布的示意图,其中,横坐标表示相应的级别数值,纵坐标表示相应的人数。每个点表示处于相应层级的用户的人数以及对应用户层级数据的最小数值。根据该图所表示的级别数值的分部情况,可所构建的层次结构数据的层次为6个层级的锥形层级。所划分的层次结构数据如下表1所示。
表1社群的层次结构划分表
该社群总人数为16000,第一层级包含10个社群用户,对应的用户层级数据的数值均不小于0.0015。第二层级包含22个社群用户,对应的用户层级数据的数值均处于0.00064到0.0015之间。第三层级包括58个社群用户,对应的用户层级数据的数值均处于0.00064到0.0015之间。第四层级包括175个社群用户,对应的用户层级数据的数值均处于0.000315到0.00064之间。第五层级包括1505个社群用户,对应的用户层级数据的数值均处于0.000166到0.000315之间,该网络中最后计算得到的用户层级数的总和相加为1。第六层级包括14230个社群用户,对应的用户层级数据的数值均小于0.000054。其中第一层级为最高领导层层,第二层级为高级领导层,第三层级为经理层,第四层级为总监层,第五层级为组长层,第六层级为普通员工层。
本实施例中,通过根据社交数据构建数据网络,并根据所构建的社交网络来计算处社群中的用户层级数据,进而根据用户层级数据来构建该社群的层次结构数据,由于所获取的社交数据能够体现出用户在社群中所生成与用户在社群中的地位、作用或重要性等,因而根据社交数据所构建出的社群层次结构的准确性更高。
进一步的,可从所构建的层次结构数据中获取每个社群用户在社群中所处的层次,将社群用户在社群中所处的层次作为征信系统或广告定向投系统中的一个考量因子,从而可提高征信建模准确度和广告定向投放的精准度。
在一个实施例中,在获取社群中的社交数据的步骤之前,该社群层次结构构建方法还包括:获取第一群组和与第一群组具有关联关系的至少一个第二群组,根据第一群组的群组信息和第二群组的群组信息生成社群。
本实施例中,服务器上具有海量的群组,每个群组的群组信息包括群组名称、群组成员基本信息以及群组成员在该群组中生成的社交数据等。服务器可通过设置与待识别用户身份对应的社群有关的关键字,并查询群组名称中包含该关键字的群组。该关键字可具有一个或多个。比如可包括“腾讯”、“Tencent”、“公司”以及“企业”等。当所查询出的群组具有多个时,可从其中选取一个匹配度最高的群组,作为第一群组。
与第一群组具有关联关系的第二群组,是指第一群组与第二群组之间具有多个相同的群组成员。每个群组成员具有唯一的用户标识,该用户标识可为对应群组成员的用户账号等。服务器可提取第一群组中的群组成员所加入的其它群组,计算所提取出的每个群组中的群组成员与第一群组中所包含的群组成员的重复度。
具体的,可获取所提取的群组中所包含的用户标识以及群组成员人数,并计算与第一群组中具有相同的用户标记的数量,通过该数量与群组成员人数可计算出相应的重复度。当该重复度大于预设重复度时,可将对应所提取出的群组作为第二群组。其中,预设重复度可为预先设置的任意重复度,比如可设置为60%。容易理解的,第二群组可具有一个或多个。
在获取到第一群组和第二群组后,可根据该第一群组的群组信息和第二群组的群组信息生成对应的社群,其中,第一群组和第二群组中所包括的所有群组成员即成为该社群中的成员,第一群组与第二群组中的用户所生成社交数据即为社群中的社交数据。
本实施例中,通过根据第一群组的群组信息以及与第一群组具有关联关系的至少一个第二群组的群组信息生成相应的社群,使得所构建的社群的信息更加全面和丰富,从而也使得后续所构建测社群的层次结构数据的准确度更高。
在一个实施例中,社交数据包括社群中的用户之间的资源转移数据。
具体的,每个资源转移数据可以以<fromuin,touin,amount,sendid>的消息体的形式来记录。其中,fromuin表示资源发送用户的用户标识;touin表示资源接收用户的用户标识,且资源接收用户可具有多个;amount表示资源的转移数额;sendid用于唯一标识该资源转移数据的事件,使得根据该sendid可唯一确定对应的资源转移数据。用户标识用于唯一识别与确定用户的身份信息,可为用户的及时通讯账号等。通过叠加整个社群中的资源转移数据中的amount,可得到社群中的产生的社群资源总数额。通过叠加具有相同fromuin的资源转移数据中的amount,可得到该fromuin对应的用户所发送的资源的数额,计为用户资源总数额。
由于资源转移数据可体现出用户在对应社群中的地位、作用或重要性等,因而将资源转移数据作为社交数据,使得所计算出的社群的层次结构数据与而更加精确。
在一个实施例中,如图4所示,根据数据网络计算社群中的用户层级数据的步骤,包括:
步骤402,获取数据网络中的用户节点的初始权值,根据初始权值构建初始权值向量。
本实施例中,服务器可对社交数据量进行量化,及统计每个用户所生成的社交数据的量化总值(计为用户总值),进而可根据用户总值为对应用户节点设置相匹配的初始权值,使得该初始权值与用户总值呈一定的比例关系。通过汇总用户节点的初始权值,可构建相应的初始权值向量。其中,初始权值向量中的每个初始权值即为对应用户节点的初始权值。计为向量V(0),该权值向量V(0)可以列向量或行向量来表示,其维数与社群用户的数量相同。
具体的,可叠加每个用户节点的用户总值,得到的叠加和计为社群总值,则可将用户节点的初始权值设置为对应用户总值与社群总值之比,则所有初始权值之和为1。
当社交数据为用户之间的资源转移数据时,步骤402包括:获取用户节点对应的用户作为资源发送用户所对应的用户资源总数额,计算用户节点的初始权值为获取的用户资源总数额占社群资源总数额的比例。
具体的,针对每个用户节点,可将对应具有相同资源发送用户的所有资源转移数据中的资源的转移数额进行相加,得到的总和即为用户资源总数额。将社群中的所有资源转移数据中的资源的转移数额进行相加,得到的总和即为社群资源总数额。用户节点的初始权值与对应的用户总资源数额呈一定的比例关系,具体的,可为对应的用户资源总数额与社群资源总数额之比。
步骤404,计算数据网络中的用户节点之间的关联度,根据关联度构建邻接矩阵。
用户节点之间的关联度可通过每个社交数据中的用户之间的互动关系来确定。同样的,可将用户之间的互动关系进行量化,将该量化后的数值作为对应的关联度。
根据关联度构建的邻接矩阵,可记为可A=(aij)n×n,n为社群用户的数量。aij表示用户i对用户j的关联度。进一步的,该邻接矩阵可为有向的邻接矩阵,即aij与aji可不相同,即用户i对用户j的关联度以及用户j对用户i的关联度可不相同。该邻接矩阵中的每一列或每一行则表示对应的一个用户与整个社群用户之间的关联度,且每一列或每一行的关联度之和均相同。通过所构建的邻接矩阵,可反映出整个社群中的用户之间的关联关系。
当社交数据为用户之间的资源转移数据时,步骤404包括:根据用户节点对应的用户作为资源发送用户所对应的资源接收用户的数量,计算用户节点之间的关联度。
具体的,针对每个用户节点,可统计具有相同资源发送用户的所有资源转移数据中的资源接收用户的出现次数,根据出现次数来计算用户节点之间的关联度。可将该用户与资源接收用户之间的关联度按照出现次数的比例设置相匹配的关联度,将用户与非资源接收用户之间的关联度设置为0。
举例来说,设用户j所发送的资源分别被k个用户所获取过,则当用户i从用户j获取过资源时,记aij=1/k。或者,用户j所发送的资源分别被领取x次,当用户i从用户j获取过y次资源时,记aij=x/y。
步骤406,根据初始权值向量和邻接矩阵进行计算,得到社群中的用户层级数据。
本实施例中,服务器中设置有用户层级数据的计算模型,该计算模型可为度中心性计算模型、介数中心性计算模型、k-core计算模型或者PageRank计算模型等。在构建出初始权值向量和邻接矩阵后,可将初始权值向量和邻接矩阵中的参数数值代入该计算模型中进行计算,进而可计算出社群中的用户层级数据。
本实施例中,通过构建初始权值向量和邻接矩阵,进而根据初始权值向量和邻接矩阵得出用户层级数据,可在一定程度上降低计算的复杂度。
在一个实施例中,根据初始权值向量和邻接矩阵进行计算,得到社群中的用户层级数据的步骤,包括:将初始权值向量与邻接矩阵相乘,得到目标向量,将目标向量不断与邻接矩阵相乘,进行迭代,直到得到最终的目标向量收敛,最终的目标向量为用户层级数据。
本实施例中,若V(0)为列向量,则将所构建的初始权值向量V(0)右乘邻接矩阵A,将得到的乘积结果记为第一权值向量V(1)。判断所计算出的结果是否收敛,若是,则将该计算结果V(1)作为目标向量。若不收敛,则将所计算出的结果V(1)继续右乘邻接矩阵A,进行迭代,得到新的计算结果。对于每次得到的权值向量,将其与上一次计算得到的权值向量进行比较,直至该计算结果收敛为止。其中,第i次的计算结果即为V(i)。类似的,若V(0)为行向量,则将所构建的初始权值向量V(0)左乘邻接矩阵A。
具体的,服务器中可设置一预设数值,在计算出V(i)后,可比较V(i)中的每个参数与V(i-1)中的对应参数之差的绝对值是否均小于该预设数值,若是,则判断该V(i)收敛,否则,判断不收敛。最终得到的收敛的目标向量中的每个数值即表示对应用户的用户层级数据。
以社交数据为用户之间的资源转移数据为例,若用户A从用户B获取过资源,记有B->A的一条有向边。
其中,V(0)=[v1(0) v2(0)...vn(0)]T,其维度为n,n为社群中的用户数量,节点i的初始权值vi(0)可设置为对应用户资源总数值与社群资源总数值之比。
设节点i的资源接收用户的数量即为出度,计为ki out,则且举例来说,若用户i所发送的资源被5个用户所获取,则该用户i的出度为5,则构建的矩阵中,代表用户i所指向的获取过该资源的用户的参数的元素的数值则为1/5,代表用户i指向的其它未获取过该资源的用户的的参数的元素的数值则为0。
目标向量V(1)=ATV(0),其中,AT表示矩阵A的转置。
进行迭代:V(k)=ATV(k-1)=(AT)kV(0),直至所计算出的V(k)收敛,即第k次计算出的V(k)第k-1次计算出V(k-1)之间的差值为0或小于所设置的预设数值,则该V(k)为用户层级数据。该V(k)为用户层级数据,V(k)中的每个数值vi(k)即表节点i对应的用户的用户层级数据。根据矩阵运算规则,可计算出用户i的用户层级数据为
本实施例中,通过迭代计算,得到的收敛的目标向量作为用户层级数据,使得可提高用户层级数据的计算准确度,进而可提高根据用户层级数据构建的社群的层次结构数据的准确度。
在一个实施例中,如图5所示,根据初始权值向量和邻接矩阵进行计算,得到社群中的用户层级数据的步骤,包括:
步骤502,将单位向量与第一预设系数相乘,得到第一中间向量。
其中,第一预设系数可为大于0且小于1的任意系数。
在一个实施例中,可当所构建的邻接矩阵中存在参数的数值达到第一预设数值时,或所构建的邻接矩阵中存在某一行或某一列的参数的数值均小于第二预设数值时,则执行步骤502。
比如所构建的矩阵中存在某一行或某一列的元素均为0,或存在某一行或某一列的元素仅有一个元素的数值为1而其它元素的数值均为0。即当存在节点i的出度ki out为1或0时,可执行步骤502。
步骤504,将初始权值向量与邻接矩阵以及第二预设系数相乘,得到第二中间向量。
本实施例中,第一预设系数与第二预设系数之和为1。若初始向量V(0)为列向量,则将所构建的初始权值向量V(0)右乘邻接矩阵A,将得到的结果再乘以第二预设系数进行缩减,将缩减后的结果计为第二中间向量。同样的,若初始向量V(0)为行向量,则将所构建的初始权值向量V(0)左乘邻接矩阵A,将得到的结果再乘以第二预设系数进行缩减,将缩减后的结果计为第二中间向量。
步骤506,将第一中间向量与第二中间向量之和作为目标向量。
步骤508,将目标向量与邻接矩阵以及第一预设系数相乘,得到新的第二中间向量。
步骤510,将新的第二中间向量与第一中间向量之和作为新的目标向量。
步骤512,将新的目标向量与上一次计算得到的目标向量进行比较,判断新的目标向量是否收敛。若是,则执行步骤514,否则,执行步骤508~512。
本实施例中,若判断新的目标向量不收敛,则执行步骤508~512,将该最新计算出的目标向量与邻接矩阵以及第一预设系数相乘,得到新的第二中间向量,将新的第二中间向量与第一中间向量之和作为新的目标向量,实现迭代运算,直到得到的最终的目标向量收敛,最终的目标向量为用户层级数据。
步骤514,将得到的最终的目标向量为用户层级数据。
同样的以社交数据为用户之间的资源转移数据为例,计单位向量为e=[1 1...]T1,其维度为n,第一预设系数为1-α,第二预设系数为α。则第一次计算出的目标向量为:V(1)=αATV(0)+(1-α)e。
进行迭代:第k次迭代计算出的目标向量为V(k)=ATV(k-1)=(AT)kV(0),直至所计算出的V(k)收敛,即第k次计算出的V(k)第k-1次计算出V(k-1)之间的差值为0或小于所设置的预设数值,则该V(k)为用户层级数据。V(k)中的每个数值vi(k)即表节点i对应的用户的用户层级数据。其中,第k次计算出的目标向量为:V(k)=αATV(k-1)+(1-α)e=(BT)kV(0),矩阵根据矩阵运算规则,可计算出用户i的用户层级数据为
本实施例中,通过引入第一预设系数与第二预设系数进行迭代计算,得到的收敛的目标向量作为用户层级数据,使得可进一步提高用户层级数据的计算准确度,进而也提高了根据用户层级数据构建的社群的层次结构数据的准确度。
在一个实施例中,根据社交数据构建数据网络的步骤,包括:根据预设条件对社交数据进行筛选,根据选取的满足预设条件的社交数据构建数据网络。
本实施例中,当该社交数据为资源转移数据时,可判断资源转移数据的资源接收用户的数量是否达到第一数值,若是,则继续判断资源转移数据的资源数额是否达到第二数值,若是,则保留资源转移数据,若资源接收用户的数量小于第一数值或资源数额小于第二数值,则过滤掉资源转移数据。
服务器中预先设置了第一数值和第二数值,第一数值用于作为判断资源转移数量是否达到相应数值的阈值,第二数值作为判断资源数额是否达到相应数额的阈值。其中,第一数值和第二数值均可为任意数值。
针对每个所获取到的资源转移信息,可判断对应的是否达到第一数值,且资源数额是否达到第二数值。选取对应资源转移数量达到第一数值、且资源数额达到第二数值的资源转移信息,并滤掉资源转移数量未达到第一数值或资源数额未达到第二数值的资源转移信息。
举例来说,可设置第一数值为2,第二数值为2,通过该具体的第一数值和第二数值,则对应仅保留发送的资源转移数量为超过1个,且转移数值达到2元的资源转移信息。
本实施例中,当资源接收用户的数量过少或资源数额过少时,对应的资源转移数据所体现的用户在社群中所生成与用户在社群中的地位、作用或重要性的程度太小,反而还起到干扰作用。通过所设置的预设条件对社交数据进行筛选,可降低服务器对社群的层次结构数据的构建的计算量,还可提高所构建的社群的层次结构数据的准确度。
在一个实施例中,判断资源转移信息的资源转移数量是否达到第一数值,以及判断资源转移信息的资源数额是否达到第二数值,这两者的顺序可不做限定。
在一个实施例中,如图6所示,提供了一种社群层次结构构建装置,该装置包括:
社交数据获取模块602,用于获取社群中的社交数据。
数据网络构建模块604,用于根据社交数据构建数据网络,数据网络中以社群中的用户为节点,以用户之间的社交关系为边。
用户层级数据计算模块606,用于根据数据网络计算社群中的用户层级数据,用户层级数据反映了用户在社群中的重要性。
层次结构数据构建模块608,用于根据用户层级数据构建社群的层次结构数据。
在一个实施例中,如图7所示,提供了另一种社群层次结构构建装置,该装置还包括:
社群生成模块601,用于获取第一群组和与第一群组具有关联关系的至少一个第二群组,根据第一群组的群组信息和第二群组的群组信息生成社群。
在一个实施例中,如图8所示,用户层级数据计算模块606包括:
初始权值构建单元802,用于获取数据网络中的用户节点的初始权值,根据初始权值构建初始权值向量。
邻接矩阵构建单元804,用于计算数据网络中的用户节点之间的关联度,根据关联度构建邻接矩阵。
用户层级数据计算单元806,用于根据初始权值向量和邻接矩阵进行计算,得到社群中的用户层级数据。
在一个实施例中,用户层级数据计算单元806还用于将初始权值向量与邻接矩阵相乘,得到目标向量,将目标向量不断与邻接矩阵相乘,进行迭代,直到得到最终的目标向量收敛,最终的目标向量为用户层级数据。
在一个实施例中,用户层级数据计算单元806还用于将单位向量与第一预设系数相乘,得到第一中间向量;将初始权值向量与邻接矩阵以及第二预设系数相乘,得到第二中间向量,第一预设系数与第二预设系数之和为1;将第一中间向量与第二中间向量之和作为目标向量;将目标向量与邻接矩阵以及第一预设系数相乘,得到新的第二中间向量;将新的第二中间向量与第一中间向量之和作为新的目标向量,实现迭代运算,直到得到的最终的目标向量收敛,最终的目标向量为用户层级数据。
在一个实施例中,社交数据包括社群中的用户之间的资源转移数据。
在一个实施例中,资源转移数据包括资源发送用户、资源接收用户和资源数额。
初始权值构建单元802还用于获取用户节点对应的用户作为资源发送用户所对应的用户资源总数额,计算用户节点的初始权值为获取的用户资源总数额占社群资源总数额的比例。
邻接矩阵构建单元804还用于根据用户节点对应的用户作为资源发送用户所对应的资源接收用户的数量,计算用户节点之间的关联度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (14)
1.一种社群层次结构构建方法,其特征在于,所述方法包括:
获取社群中的社交数据;
根据所述社交数据构建数据网络,所述数据网络中以所述社群中的用户为节点,以用户之间的社交关系为边;
根据所述数据网络计算所述社群中的用户层级数据,所述用户层级数据反映了用户在所述社群中的重要性;
根据所述用户层级数据构建所述社群的层次结构数据。
2.根据权利要求1所述的方法,其特征在于,在获取社群中的社交数据的步骤之前,包括:
获取第一群组和与所述第一群组具有关联关系的至少一个第二群组,根据所述第一群组的群组信息和第二群组的群组信息生成社群。
3.根据权利要求1所述的方法,其特征在于,所述根据所述数据网络计算所述社群中的用户层级数据的步骤,包括:
获取所述数据网络中的用户节点的初始权值,根据所述初始权值构建初始权值向量;
计算所述数据网络中的用户节点之间的关联度,根据所述关联度构建邻接矩阵;
根据所述初始权值向量和所述邻接矩阵进行计算,得到社群中的用户层级数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述初始权值向量和所述邻接矩阵进行计算,得到社群中的用户层级数据的步骤,包括:
将所述初始权值向量与所述邻接矩阵相乘,得到目标向量,将所述目标向量不断与所述邻接矩阵相乘,进行迭代,直到得到最终的目标向量收敛,所述最终的目标向量为所述用户层级数据。
5.根据权利要求3所述的方法,其特征在于,所述根据所述初始权值向量和所述邻接矩阵进行计算,得到社群中的用户层级数据的步骤,包括:
将单位向量与第一预设系数相乘,得到第一中间向量;
将所述初始权值向量与所述邻接矩阵以及第二预设系数相乘,得到第二中间向量,所述第一预设系数与第二预设系数之和为1;
将所述第一中间向量与所述第二中间向量之和作为目标向量;
将所述目标向量与所述邻接矩阵以及第一预设系数相乘,得到新的第二中间向量;
将所述新的第二中间向量与所述第一中间向量之和作为新的目标向量,实现迭代运算,直到得到的最终的目标向量收敛,所述最终的目标向量为所述用户层级数据。
6.根据权利要求3所述的方法,其特征在于,所述社交数据包括社群中的用户之间的资源转移数据。
7.根据权利要求6所述的方法,其特征在于,所述资源转移数据包括资源发送用户、资源接收用户和资源数额;
所述获取所述数据网络中的用户节点的初始权值的步骤,包括:
获取所述用户节点对应的用户作为资源发送用户所对应的用户资源总数额,计算所述用户节点的初始权值为所述获取的用户资源总数额占社群资源总数额的比例;
所述计算所述数据网络中的用户节点之间的关联度的步骤,包括:
根据所述用户节点对应的用户作为资源发送用户所对应的资源接收用户的数量,计算用户节点之间的关联度。
8.一种社群层次结构构建装置,其特征在于,所述装置包括:
社交数据获取模块,用于获取社群中的社交数据;
数据网络构建模块,用于根据所述社交数据构建数据网络,所述数据网络中以所述社群中的用户为节点,以用户之间的社交关系为边;
用户层级数据计算模块,用于根据所述数据网络计算所述社群中的用户层级数据,所述用户层级数据反映了用户在所述社群中的重要性;
层次结构数据构建模块,用于根据所述用户层级数据构建所述社群的层次结构数据。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
社群生成模块,用于获取第一群组和与所述第一群组具有关联关系的至少一个第二群组,根据所述第一群组的群组信息和第二群组的群组信息生成社群。
10.根据权利要求8所述的装置,其特征在于,所述用户层级数据计算模块包括:
初始权值构建单元,用于获取所述数据网络中的用户节点的初始权值,根据所述初始权值构建初始权值向量;
邻接矩阵构建单元,用于计算所述数据网络中的用户节点之间的关联度,根据所述关联度构建邻接矩阵;
用户层级数据计算单元,用于根据所述初始权值向量和所述邻接矩阵进行计算,得到社群中的用户层级数据。
11.根据权利要求10所述的装置,其特征在于,所述用户层级数据计算单元还用于将所述初始权值向量与所述邻接矩阵相乘,得到目标向量,将所述目标向量不断与所述邻接矩阵相乘,进行迭代,直到得到最终的目标向量收敛,所述最终的目标向量为所述用户层级数据。
12.根据权利要求11所述的装置,其特征在于,所述用户层级数据计算单元还用于将单位向量与第一预设系数相乘,得到第一中间向量;将所述初始权值向量与所述邻接矩阵以及第二预设系数相乘,得到第二中间向量,所述第一预设系数与第二预设系数之和为1;将所述第一中间向量与所述第二中间向量之和作为目标向量;将所述目标向量与所述邻接矩阵以及第一预设系数相乘,得到新的第二中间向量;将所述新的第二中间向量与所述第一中间向量之和作为新的目标向量,实现迭代运算,直到得到的最终的目标向量收敛,所述最终的目标向量为所述用户层级数据。
13.根据权利要求10所述的装置,其特征在于,所述社交数据包括社群中的用户之间的资源转移数据。
14.根据权利要求13所述的装置,其特征在于,所述资源转移数据包括资源发送用户、资源接收用户和资源数额;
所述初始权值构建单元还用于获取所述用户节点对应的用户作为资源发送用户所对应的用户资源总数额,计算所述用户节点的初始权值为所述获取的用户资源总数额占社群资源总数额的比例;
邻接矩阵构建单元还用于根据所述用户节点对应的用户作为资源发送用户所对应的资源接收用户的数量,计算用户节点之间的关联度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610672105.0A CN107767278B (zh) | 2016-08-15 | 2016-08-15 | 社群层次结构构建方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610672105.0A CN107767278B (zh) | 2016-08-15 | 2016-08-15 | 社群层次结构构建方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107767278A true CN107767278A (zh) | 2018-03-06 |
CN107767278B CN107767278B (zh) | 2021-08-24 |
Family
ID=61260991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610672105.0A Active CN107767278B (zh) | 2016-08-15 | 2016-08-15 | 社群层次结构构建方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107767278B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020125721A1 (zh) * | 2018-12-21 | 2020-06-25 | 腾讯科技(深圳)有限公司 | 用于在社交网络中确定节点的社交层次的方法和设备 |
CN113111255A (zh) * | 2021-03-25 | 2021-07-13 | 卓尔智联(武汉)研究院有限公司 | 用户群体划分方法、装置、电子设备及计算机存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855542A (zh) * | 2012-07-19 | 2013-01-02 | 周宇 | “学习基因”个体学习能力测评方法 |
CN103036941A (zh) * | 2011-10-08 | 2013-04-10 | 美国博通公司 | 社交网络分组层次结构 |
CN103678669A (zh) * | 2013-12-25 | 2014-03-26 | 福州大学 | 一种社交网络中的社区影响力评估系统及方法 |
US20150339404A1 (en) * | 2014-05-23 | 2015-11-26 | Linkedin Corporation | Inferring seniority level of a member of an on-line social network |
CN105306540A (zh) * | 2015-09-24 | 2016-02-03 | 华东师范大学 | 一种获得社交网络中影响力最大的前k个节点的方法 |
CN105630800A (zh) * | 2014-10-29 | 2016-06-01 | 杭州师范大学 | 一种节点重要性排序的方法和系统 |
CN105723402A (zh) * | 2013-10-25 | 2016-06-29 | 西斯摩斯公司 | 用于确定社交数据网络中的影响者的系统和方法 |
US20160197873A1 (en) * | 2015-01-05 | 2016-07-07 | Ali Saad ALGHAMDI | Method and apparatus for valuing and optimizing the application of social capital in social-media networks |
-
2016
- 2016-08-15 CN CN201610672105.0A patent/CN107767278B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103036941A (zh) * | 2011-10-08 | 2013-04-10 | 美国博通公司 | 社交网络分组层次结构 |
CN102855542A (zh) * | 2012-07-19 | 2013-01-02 | 周宇 | “学习基因”个体学习能力测评方法 |
CN105723402A (zh) * | 2013-10-25 | 2016-06-29 | 西斯摩斯公司 | 用于确定社交数据网络中的影响者的系统和方法 |
CN103678669A (zh) * | 2013-12-25 | 2014-03-26 | 福州大学 | 一种社交网络中的社区影响力评估系统及方法 |
US20150339404A1 (en) * | 2014-05-23 | 2015-11-26 | Linkedin Corporation | Inferring seniority level of a member of an on-line social network |
CN105630800A (zh) * | 2014-10-29 | 2016-06-01 | 杭州师范大学 | 一种节点重要性排序的方法和系统 |
US20160197873A1 (en) * | 2015-01-05 | 2016-07-07 | Ali Saad ALGHAMDI | Method and apparatus for valuing and optimizing the application of social capital in social-media networks |
CN105306540A (zh) * | 2015-09-24 | 2016-02-03 | 华东师范大学 | 一种获得社交网络中影响力最大的前k个节点的方法 |
Non-Patent Citations (1)
Title |
---|
李阳辉等: "基于深度学习的社交网络平台细粒度情感分析", 《计算机应用研究》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020125721A1 (zh) * | 2018-12-21 | 2020-06-25 | 腾讯科技(深圳)有限公司 | 用于在社交网络中确定节点的社交层次的方法和设备 |
CN111353904A (zh) * | 2018-12-21 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 用于在社交网络中确定节点的社交层次的方法和设备 |
CN111353904B (zh) * | 2018-12-21 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 用于在社交网络中确定节点的社交层次的方法和设备 |
CN113111255A (zh) * | 2021-03-25 | 2021-07-13 | 卓尔智联(武汉)研究院有限公司 | 用户群体划分方法、装置、电子设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107767278B (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ren et al. | Pythagorean fuzzy TODIM approach to multi-criteria decision making | |
Podvezko et al. | Dependence of multi‐criteria evaluation result on choice of preference functions and their parameters | |
da Rocha et al. | Identifying bank frauds using CRISP-DM and decision trees | |
Somerfield et al. | A comparison of the power of categorical and correlational tests applied to community ecology data from gradient studies | |
Jha et al. | A critique of the environmental sustainability index | |
Tsyganok et al. | Usage of multicriteria decision‐making support arsenal for strategic planning in environmental protection sphere | |
Irvanizam et al. | An Improved EDAS Method Based on Bipolar Neutrosophic Set and Its Application in Group Decision‐Making | |
CN112101577B (zh) | 基于XGBoost的跨样本联邦学习、测试方法、系统、设备和介质 | |
Ouadah et al. | Degree‐based goodness‐of‐fit tests for heterogeneous random graph models: Independent and exchangeable cases | |
CN107767278A (zh) | 社群层次结构构建方法和装置 | |
CN114896977A (zh) | 一种物联网实体服务信任值的动态评估方法 | |
Rai et al. | Identifying the leaders and main conspirators of the attacks in terrorist networks | |
CN104965846A (zh) | MapReduce平台上的虚拟人建立方法 | |
Hilliard et al. | On the statistical significance of event effects on unsystematic volatility | |
CN116361759B (zh) | 一种基于量化权限指引的智能合规控制方法 | |
Chipperfield et al. | Estimating precision and recall for deterministic and probabilistic record linkage | |
Kronenfeld | Validating the historical record: a relative distance test and correction formula for selection bias in presettlement land surveys | |
CN108520337A (zh) | 一种基于网络风险熵差的谣言风险评估方法 | |
Tayyaran et al. | Telecommuting and residential location decisions: combined stated and revealed preferences model | |
Giudici | Integration of qualitative and quantitative operational risk data: A Bayesian approach | |
CN101719137A (zh) | 基于不确定性处理的网络论坛用户兴趣建模方法 | |
CN109191334A (zh) | 五重去重传销数据分析方法 | |
Manzhula et al. | Evaluation method of economic benefit taking into account additional data in decision-making process | |
Ali et al. | Generalized Chain Regression‐cum‐Chain Ratio Estimator for Population Mean under Stratified Extreme‐cum‐Median Ranked Set Sampling | |
de Jonge et al. | Dealing with artificially dichotomized variables in meta-analytic structural equation modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |