CN112101390A - 属性信息确定方法、属性信息确定装置及电子设备 - Google Patents
属性信息确定方法、属性信息确定装置及电子设备 Download PDFInfo
- Publication number
- CN112101390A CN112101390A CN201910454915.2A CN201910454915A CN112101390A CN 112101390 A CN112101390 A CN 112101390A CN 201910454915 A CN201910454915 A CN 201910454915A CN 112101390 A CN112101390 A CN 112101390A
- Authority
- CN
- China
- Prior art keywords
- nodes
- community
- node
- attribute information
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000006116 polymerization reaction Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 4
- 238000000638 solvent extraction Methods 0.000 claims description 4
- 238000012423 maintenance Methods 0.000 abstract description 20
- 238000010586 diagram Methods 0.000 description 19
- 239000011159 matrix material Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供一种属性信息确定方法、属性信息确定装置及电子设备;涉及计算机技术领域。所述属性信息确定方法包括:根据第一关系网络中各节点之间的连接关系确定每个节点的特征值,并根据特征值从各节点中确定多个目标节点;根据多个目标节点以及多个目标节点之间的连接关系构建第二关系网络;将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息确定该社区的属性信息;将每个社区的属性信息确定为该社区内的目标节点的属性信息。本公开中的属性信息确定方法能够一定程度上克服通过不同判定规则确定出每个行业中间人存在着的维护效率较低的问题,进而提升针对不同行业中间人的识别规则的维护效率。
Description
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种属性信息确定方法、属性信息确定装置及电子设备。
背景技术
在社交网络中,中间人节点是将两个或多个原本不相连的节点或社区联系在一起的节点。中间人的社交关系相较亲人、同事以及同学等强关系可以被认为是相对较弱的关系,但是弱关系相较强关系能够连接多个社区。多数行业中均存在中间人节点,如果能够从众多行业中分别确定出维护弱关系的中间人节点,相较传统的通过强关系在社区内部/行业内部进行信息传播,通过中间人则能够实现在多个社区/多个行业之间进行信息传播,这样能够提升信息传播效率。
针对不同的行业,通常存在不同的用于确定该行业中间人的判定规则,通过不同的判定规则能够从每个行业中确定出与其对应的中间人。但是,通过这种方法确定出每个行业的中间人存在着维护效率较低的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种属性信息确定方法、属性信息确定装置及电子设备,进而在一定程度上克服通过不同判定规则确定出每个行业中间人存在着的维护效率较低的问题,进而通过社区划分的方式将同一社区的中间人确定为同一行业,以在一定程度上改善因需要维护多个判定规则而造成的维护效率较低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种属性信息确定方法,包括:
根据第一关系网络中各节点之间的连接关系确定每个节点的特征值,并根据特征值从各节点中确定多个目标节点;
根据多个目标节点以及多个目标节点之间的连接关系构建第二关系网络;
将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息确定该社区的属性信息;
将每个社区的属性信息确定为该社区内的目标节点的属性信息。
在本公开的一种示例性实施例中,根据第一关系网络中各节点之间的连接关系确定每个节点的特征值,包括:
根据第一关系网络中各节点之间的连接关系确定每个节点的实际连接关系数量与预测连接关系数量之比,作为该节点的社交关系密度;
根据社交关系密度确定每个节点的特征值。
在本公开的一种示例性实施例中,该属性信息确定方法还包括:
根据连接关系确定每个节点连接的节点数量,并根据节点数量确定出该节点的预测连接关系数量。
在本公开的一种示例性实施例中,该属性信息确定方法还包括:
将第一关系网络中每个节点作为中心进行社区划分,以识别与该节点属于同一社区的待合并节点。
在本公开的一种示例性实施例中,该属性信息确定方法还包括:
将待合并节点合并至该节点在第二关系网络中所属的社区。
在本公开的一种示例性实施例中,将第二关系网络中的目标节点划分为多个社区,包括:
根据多个目标节点之间的连接关系确定节点之间的结构相关度;
根据结构相关度和各目标节点的关联信息确定目标节点的聚合度;
通过聚合度对目标节点进行聚类,并根据聚类结果将第二关系网络中的目标节点划分为多个社区。
在本公开的一种示例性实施例中,该属性信息确定方法还包括:
根据属性信息确定检索关键词,并将检索关键词与属性信息进行关联。
在本公开的一种示例性实施例中,将每个社区的属性信息确定为该社区内的目标节点的属性信息,包括:
确定每个社区内与该社区的属性信息不同的目标节点;
将该社区的属性信息确定为与该社区的属性信息不同的目标节点的属性信息。
根据本公开的第二方面,提供一种属性信息确定装置,包括特征值确定单元、关系网络构建单元、社区划分单元以及属性信息确定单元,其中:
特征值确定单元,用于根据第一关系网络中各节点之间的连接关系确定每个节点的特征值,并根据特征值从各节点中确定多个目标节点;
关系网络构建单元,用于根据多个目标节点以及多个目标节点之间的连接关系构建第二关系网络;
社区划分单元,用于将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息确定该社区的属性信息;
属性信息确定单元,用于将每个社区的属性信息确定为该社区内的目标节点的属性信息。
在本公开的一种示例性实施例中,特征值确定单元根据第一关系网络中各节点之间的连接关系确定每个节点的特征值的方式具体为:特征值确定单元根据第一关系网络中各节点之间的连接关系确定每个节点的实际连接关系数量与预测连接关系数量之比,作为该节点的社交关系密度;特征值确定单元根据社交关系密度确定每个节点的特征值。
在本公开的一种示例性实施例中,属性信息确定装置还包括连接关系数量确定单元,其中:连接关系数量确定单元,用于根据连接关系确定每个节点连接的节点数量,并根据节点数量确定出该节点的预测连接关系数量。
在本公开的一种示例性实施例中,社区划分单元,还用于将第一关系网络中每个节点作为中心进行社区划分,以识别与该节点属于同一社区的待合并节点。
在本公开的一种示例性实施例中,属性信息确定装置还包括节点合并单元,其中:节点合并单元,用于将待合并节点合并至该节点在第二关系网络中所属的社区。
在本公开的一种示例性实施例中,社区划分单元将第二关系网络中的目标节点划分为多个社区的方式具体为:社区划分单元根据多个目标节点之间的连接关系确定节点之间的结构相关度;社区划分单元根据结构相关度和各目标节点的关联信息确定目标节点的聚合度;社区划分单元通过聚合度对目标节点进行聚类,并根据聚类结果将第二关系网络中的目标节点划分为多个社区。
在本公开的一种示例性实施例中,属性信息确定装置还包括检索关键词确定单元,其中:检索关键词确定单元,用于根据属性信息确定检索关键词,并将检索关键词与属性信息进行关联。
在本公开的一种示例性实施例中,属性信息确定单元将每个社区的属性信息确定为该社区内的目标节点的属性信息的方式具体为:属性信息确定单元确定每个社区内与该社区的属性信息不同的目标节点;属性信息确定单元将该社区的属性信息确定为与该社区的属性信息不同的目标节点的属性信息。
根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开的一示例实施方式所提供的属性信息确定方法中,通过第一关系网络中各节点之间的连接关系能够确定出每个节点的特征值,第一关系网络中的各节点可以理解为不同的用户;进而,根据特征值从各节点中确定出多个目标节点,目标节点可以理解为确定出的中间人节点;进而,根据多个目标节点可以构建第二关系网络,第二关系网络中的节点可以理解为均是中间人节点;进而,将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息(如,昵称、签名等)确定该社区的属性信息(如,所属的行业);进而,将每个社区的属性信息确定为该社区内的目标节点的属性信息,可以理解为,如果该社区属于某一行业(如,汽车销售行业),则划分到该社区的节点也属于这个行业。依据上述方案描述,本公开一方面能够在一定程度上克服通过不同判定规则确定出每个行业中间人存在着的维护效率较低的问题,进而通过社区划分的方式将同一社区的中间人确定为同一行业,以在一定程度上改善因需要维护多个判定规则而造成的维护效率较低的问题;另一方面能够通过社区划分的方式确定出不同行业的中间人提升中间人识别效率、识别准确率以及召回率;又一方面能够社区划分的方式将同一社区的中间人确定为同一行业,降低对于不同行业中间人识别规则的维护成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施例的一种属性信息确定方法及装置的示例性系统架构的示意图;
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本公开的一个实施例的属性信息确定方法的流程图;
图4示意性示出了根据本公开的一个实施例中的节点关系网络示意图;
图5示意性示出了根据本公开的一个实施例中确定节点特征值的步骤的流程图;
图6示意性示出了根据本公开的一个实施例中对第二关系网络中的目标节点进行社区划分的步骤的流程图;
图7示意性示出了根据本公开的一个实施例中对第二关系网络中的目标节点进行社区划分的结果示意图;
图8示意性示出了根据本公开的一个实施例中确定社区内目标节点的属性信息的步骤的流程图;
图9示意性示出了根据本公开的一个实施例中的中心节点关系网络示意图;
图10示意性示出了根据本公开的一个实施例中的另一种属性信息确定方法的流程示意图;
图11示意性示出了根据本公开的一个实施例中的属性信息确定装置的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的一种属性信息确定方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的属性信息确定方法一般由服务器105执行,相应地,属性信息确定装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的属性信息确定方法也可以由终端设备101、102、103执行,相应的,属性信息确定装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,操作人员可以通过终端设备101、102、103向服务器105请求各节点的特征值,并通过服务器105构建第二关系网络、进行社区划分、确定各社区的属性信息以及确定各社区内节点的属性信息,进而,通过终端设备101、102、103接收服务器返回的属性信息确定结果。
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的方法和装置中限定的各种功能。在一些实施例中,计算机系统200还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现如图3、图5、图6、图8以及图10所示的各个步骤等。
以下对本公开实施例的技术方案进行详细阐述:
在社交网络中,用户与用户之间通常存在强关系和弱关系这两种关系,其中,强关系可以理解为父母、同学或同事这类较为亲密的关系,其余关系则可以理解为弱关系,即,不经常联系的关系。社区内通常存在强关系和弱关系,而弱关系通常是连接两种社区的纽带;其中,社区可以理解为一种社交圈。举例来说,一个处于汽车销售行业的用户同时与两个社交圈存在连接关系,该用户则可以理解为两个社交圈的纽带或中间人,社交圈内的强关系用户给另一个社交圈用户传播信息的能力较弱,而中间人作为连接两个社交圈的纽带能够帮助两个社交圈进行信息互通。因此,如果能够从众多用户中确定出中间人,则可以通过中间人快速的传播信息,进而提升信息传播效率。
但是,由于用户量较大的原因,从海量用户中筛选出中间人用户的难度较大。发明人尝试根据不同的行业制定不同的规则,以根据这些规则从相应的行业中筛选得出每个行业对应的中间人,但是,这样又出现了另外一个问题,即,维护这些规则的难度较大,导致确定出中间人用户的效率较低。
基于上述一个或多个问题,本示例实施方式提供了一种属性信息确定方法。该属性信息确定方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图3所示,该属性信息确定方法可以包括以下步骤S310至步骤S340:
步骤S310.根据第一关系网络中各节点之间的连接关系确定每个节点的特征值,并根据特征值从各节点中确定多个目标节点。
步骤S320.根据多个目标节点以及多个目标节点之间的连接关系构建第二关系网络。
步骤S330.将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息确定该社区的属性信息。
步骤S340.将每个社区的属性信息确定为该社区内的目标节点的属性信息。
在本示例实施方式所提供的属性信息确定方法中,通过第一关系网络中各节点之间的连接关系能够确定出每个节点的特征值,第一关系网络中的各节点可以理解为不同的用户;进而,根据特征值从各节点中确定出多个目标节点,目标节点可以理解为确定出的中间人节点;进而,根据多个目标节点可以构建第二关系网络,第二关系网络中的节点可以理解为均是中间人节点;进而,将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息(如,昵称、签名等)确定该社区的属性信息(如,所属的行业);进而,将每个社区的属性信息确定为该社区内的目标节点的属性信息,可以理解为,如果该社区属于某一行业(如,汽车销售行业),则划分到该社区的节点也属于这个行业。依据上述方案描述,本公开一方面能够在一定程度上克服通过不同判定规则确定出每个行业中间人存在着的维护效率较低的问题,进而通过社区划分的方式将同一社区的中间人确定为同一行业,以在一定程度上改善因需要维护多个判定规则而造成的维护效率较低的问题;另一方面能够通过社区划分的方式确定出不同行业的中间人提升中间人识别效率、识别准确率以及召回率;又一方面能够社区划分的方式将同一社区的中间人确定为同一行业,降低对于不同行业中间人识别规则的维护成本。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在步骤S310中,根据第一关系网络中各节点之间的连接关系确定每个节点的特征值,并根据特征值从各节点中确定多个目标节点。
本示例实施方式中,第一关系网络中可以包括多个节点,如,中间人节点和非中间人节点;其中,节点可以理解为用户,目标节点可以理解为中间人节点;第一关系网络可以用于表示用户之间的连接关系。特征值可以为一个数值,用于表示该节点与其他节点建立连接关系的能力,也可以理解为该节点的社交能力;举例来说,如果节点A与其他节点建立连接关系的能力较强,即节点A的社交能力较强,节点A的特征值则较高,如果节点B与其他节点建立连接关系的能力较弱,即节点B的社交能力较弱,节点B的特征值则较低。另外,连接关系为用户所在节点之间存在的信息传递关系,如果在两个用户之间一个用户为另一个用户的好友或两个用户互为好友,则表示两个用户之间能够进行信息传递。举例来说,如果用户A为用户B的好友,用户B不是用户A的好友,虽然用户A在社交平台上发出的共享信息不能够被用户B所获知,但是用户B在社交平台上发出的共享信息能够被用户A所获知,这样可以实现信息传递,即用户B对用户A进行信息传递;如果两个用户互为好友关系,则用户A和用户B在社交平台上发出的共享信息均能够被对方获知,且用户A和用户B通过交流也能够实现信息传递。
本示例实施方式中,请参阅图4,图4示出了根据本公开一示例性实施例的节点关系网络示意图。如图4所示,节点关系网络示意图包括节点A、节点B、节点C、节点D、节点E、节点F以及节点G。具体地,上述的第一关系网络和第二关系网络均可以为图4中所示的节点关系网络,节点关系网络中包括节点及连接节点的边,节点A、节点B、节点C、节点D、节点E、节点F以及节点G可以理解为不同的用户,当某两个用户之间存在连接节点的边,则可以认为上述两个用户之间存在连接关系(如,好友关系);其中,在两个用户之间,只要一个用户是另一个用户的好友,则两者之间存在连接节点的边,如果两个用户互为对方的好友,则必然两者之间存在连接节点的边。
本示例实施方式中,根据特征值从各节点中确定多个目标节点的方式具体可以为:将各节点中特征值大于预设特征值的节点确定为目标节点,以得到多个目标节点。
作为一种示例性实施例,根据第一关系网络中各节点之间的连接关系确定每个节点的特征值的方式具体可以包括步骤S510和步骤S520。请参阅图5,图5示意性示出了根据本公开的一个实施例中确定节点特征值的步骤的流程图。如图5所示,具体地:
步骤S510.根据第一关系网络中各节点之间的连接关系确定每个节点的实际连接关系数量与预测连接关系数量之比,作为该节点的社交关系密度。
步骤S520.根据社交关系密度确定每个节点的特征值。
在步骤S510中,由于在第一关系网络中存在各节点之间的连接关系,因此,当第一关系网络中每个节点作为中心节点时,根据与中心节点有连接关系的节点以及这些节点之间的连接关系可以确定出每个节点的实际连接关系数量;预测连接关系数量可以理解为与中心节点有连接关系的节点的数量减一的结果乘以该数量,相乘结果即为预测连接关系数量,可以理解为针对中心节点最大可能存在的边数。另外,实际连接关系数量与预测连接关系数量之比为社交关系密度,社交关系密度为一个数值,社交关系密度越高,反映用户连接原本不认识的好友的能力越弱,即,社交关系密度用于表示用户连接原本不认识的好友的能力。举例来说,如果第一关系网络中存在节点A、节点B、节点C和节点D,其中,节点A分别与节点B、节点C和节点D之间存在连接关系,因此节点A作为中心节点对应的实际连接关系数量可以为3,预测连接关系数量可以为6,即针对中心节点最大可能存在的边数,故,节点A的社交关系密度可以为0.5。
在步骤S520中,根据社交关系密度确定每个节点的特征值的方式具体可以为:将一分别减去每个节点的社交关系密度后得到的结果确定为相应每个节点的特征值。其中,特征值越高,反映连接原本不认识的好友的能力越强,可以理解为中间人能力越强。
可见,实施该示例性实施例,能够根据每个节点之间的连接关系确定出节点的特征值,即,每个节点连接原本不认识的好友的能力,这样能够提升对于中间人节点的识别效率。
在步骤S320中,根据多个目标节点以及多个目标节点之间的连接关系构建第二关系网络。
本示例实施方式中,第二关系网络中的节点均为中间人节点。
本示例实施方式中,根据多个目标节点以及多个目标节点之间的连接关系构建第二关系网络的方式具体可以为:根据多个目标节点之间的连接关系将多个目标节点进行连接,以构建第二关系网络。
在步骤S330中,将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息确定该社区的属性信息。
本示例实施方式中,社区内可以包含一类中间人节点,该类中间人节点的连接关系的紧密程度大于预设紧密程度。关联信息用于表示该节点的用户的个性化特征,如昵称、个性签名等。属性信息用于表示社区内节点的所属行业信息,如,房产中介行业、汽车销售行业以及猎头行业等。举例来说,如果根据用户A的关联信息确定出用户A所属的行业为汽车销售行业,而用户A所属的社区内节点的属性信息应为房产中介行业,可见,用户A虽然是汽车销售行业,但是用户A与多个房产中介行业的用户存在连接关系,因此,可以将用户A也确定为房产中介行业。
作为一种示例性实施例,将第二关系网络中的目标节点划分为多个社区的方式具体可以包括步骤S610、步骤S620以及步骤S630。请参阅图6,图6示意性示出了根据本公开的一个实施例中对第二关系网络中的目标节点进行社区划分的步骤的流程图。如图6所示,具体地:
步骤S610.根据多个目标节点之间的连接关系确定节点之间的结构相关度。
步骤S620.根据结构相关度和各目标节点的关联信息确定目标节点的聚合度。
步骤S630.通过聚合度对目标节点进行聚类,并根据聚类结果将第二关系网络中的目标节点划分为多个社区。
其中,可选的,根据多个目标节点之间的连接关系确定节点之间的结构相关度的方式具体可以为:基于网络拓扑结构确定各节点的全局影响力并且根据节点的局部领域,确定节点之间结构相关度。
进一步可选地,根据结构相关度和各目标节点的关联信息确定目标节点的聚合度的方式具体可以为:确定各目标节点的关联信息(如,昵称、签名等);根据关联信息之间的相似度确定节点之间的属性相关度;将节点的结构相关度和属性相关度结合,作为节点的聚合度。
更进一步可选地,还包括:根据节点的聚合度,确定节点的相似度矩阵和对角矩阵;通过相似度矩阵和对角矩阵构造对应的拉普拉斯矩阵;确定拉普拉斯矩阵前K个特征值与特征向量,根据前K个特征值与特征向量构建特征向量矩阵。
再进一步可选地,通过聚合度对目标节点进行聚类并根据聚类结果将第二关系网络中的目标节点划分为多个社区的方式具体可以为:通过模糊聚类算法对特征向量矩阵的行向量进行聚类,根据行向量的隶属度将第二关系网络中的目标节点划分为多个社区。
本示例实施方式中,请参阅图7,图7示出了根据本公开一示例性实施例的对第二关系网络中的目标节点进行社区划分的结果示意图。如图7所示,对第二关系网络中的目标节点进行社区划分的结果示意图包括社区A、社区B以及社区C,社区A中包括节点1、节点2、节点3、节点4以及节点5,社区B中包括节点6、节点7、节点8以及节点9,社区C中包括节点10、节点11、节点12、节点13、节点14以及节点15;其中,节点1与节点5和节点4之间存在连接关系、节点2与节点5和节点4之间存在连接关系、节点3与节点5和节点4之间存在连接关系、节点8与节点10和节点5之间存在连接关系、节点11与节点10、节点3、节点13、节点15以及节点12之间存在连接关系、节点6与节点7和节点8之间存在连接关系、节点9与节点7和节点8之间存在连接关系、节点6与节点9之间存在连接关系、节点7与节点8之间存在连接关系、节点14与节点10、节点12、节点13以及节点15之间存在连接关系、节点12与节点15之间存在连接关系。另外,需要说明的是,除图7示意性示出的社区划分结果示意图之外,可选的,社区划分结果还可以包括两个社区包括相同的一个或多个节点的情况(未图示)。举例来说,社区A和社区C均包含节点8,因此,节点8为社区A和社区C的交集,节点8即属于社区A也属于社区C。
可见,实施该示例性实施例,能够通过对目标节点进行社区划分,进而确定出不同行业的中间人节点,以便提升广告推广效率和推广效果。
在步骤S340中,将每个社区的属性信息确定为该社区内的目标节点的属性信息。
作为一种示例性实施例,将第二关系网络中的目标节点划分为多个社区具体可以包括以下步骤:根据不同的行业确定与其对应的行业关键词;根据行业关键词将第二关系网络中的目标节点划分为多个社区。举例来说,如果行业为房产中介行业,则关键词可以为房地产、中介以及房产中介等,根据房地产、中介以及房产中介能够更准确的确定出房产中介行业的中间人节点集合。
作为一种示例性实施例,将每个社区的属性信息确定为该社区内的目标节点的属性信息的方式具体可以包括步骤S810和步骤S820,请参阅图8,图8示意性示出了根据本公开的一个实施例中确定社区内目标节点的属性信息的步骤的流程图。如图8所示,具体地:
步骤S810.确定每个社区内与该社区的属性信息不同的目标节点。
步骤S820.将该社区的属性信息确定为与该社区的属性信息不同的目标节点的属性信息。
本示例实施方式中,社区内与该社区的属性信息不同的目标节点可以理解为,社区内大部分节点均属于房产中介行业而小部分节点属于猎头行业,则该小部分节点的属性信息则与该社区的属性信息不同。通过将该小部分节点的属性信息确定为房产中介行业,能够实现上述的将每个社区的属性信息确定为该社区内的目标节点的属性信息。
可见,实施该示例性实施例,能够通过为社区内的不同属性信息的节点赋上与其他节点相同的属性信息,以实现对于不同行业的中间人节点的挖掘,提升中间人节点的挖掘效率。
可见,实施图1所示的属性信息确定方法,能够在一定程度上克服通过不同判定规则确定出每个行业中间人存在着的维护效率较低的问题,进而通过社区划分的方式将同一社区的中间人确定为同一行业,以在一定程度上改善因需要维护多个判定规则而造成的维护效率较低的问题;以及,能够通过社区划分的方式确定出不同行业的中间人提升中间人识别效率、识别准确率以及召回率;以及,能够社区划分的方式将同一社区的中间人确定为同一行业,降低对于不同行业中间人识别规则的维护成本。
作为一种示例性实施例,该属性信息确定方法还可以包括以下步骤:根据连接关系确定每个节点连接的节点数量,并根据节点数量确定出该节点的预测连接关系数量。
作为一种示例性实施例,该属性信息确定方法还可以包括以下步骤:将第一关系网络中每个节点作为中心进行社区划分,以识别与该节点属于同一社区的待合并节点。
本示例实施方式中,可选的,将第一关系网络中每个节点作为中心进行社区划分的方式具体可以为:通过社区发现算法将第一关系网络中每个节点作为中心进行社区划分。其中,社区发现算法可以为K-L(Kernighan-Lin)算法、谱二分算法或GN算法,本发明实施例不作限定。其中,K-L(Kernighan-Lin)算法是一种将已知网络划分为已知大小的两个社区的二分方法,主要思想是为网络划分定义了一个函数增益Q,Q表示的是社区内部的边数与社区之间的边数之差,根据这个方法找出使增益函数Q的值成为最大值的划分社区的方法。具体地,可以将社区结构中的结点移动到其他的社区结构中或者交换不同社区结构中的结点。从初始解开始搜索,直到从当前的解出发找不到更优的候选解为止;此外,谱二分算法利用的是拉普拉斯矩阵的特征值和特征向量的性质来进行社区划分。拉普拉斯矩阵的第二小特征值越小,划分的效果就越好。所以谱二分法使用拉普拉斯矩阵的第二小特征值来划分社区;此外,GN算法是一个基于删除边的算法,本质是基于聚类中的分裂思想,在原理上是使用边介数作为相似度的度量方法。在GN算法中,每次都会选择边介数高的边删除,进而网络分裂速度远快于随机删除边时的网络分裂。
本示例实施方式中,与该节点属于同于同一社区的待合并节点可以理解为同事节点或弱中间人节点,因特征值较低而未被确定为目标节点。
本示例实施方式中,请参阅图9,图9示出了根据本公开一示例性实施例的中心节点关系网络示意图。如图9所示,图9中包括多个节点,以及节点之间的连接关系,在中心节点关系网络示意图中心的节点可以为中心节点,除中心节点外的其他节点可以为与中心节点存在连接关系的节点。
可见,实施该示例性实施例,能够通过将每个节点作为中心节点进行社区划分,以便将因特征值较低而未被确定为目标节点(即,中间人节点)进行召回,提升对于中间人节点的召回率。
作为一种示例性实施例,该属性信息确定方法还可以包括以下步骤:将待合并节点合并至该节点在第二关系网络中所属的社区。
本示例实施方式中,可选的,将待合并节点合并至该节点在第二关系网络中所属的社区,包括:比对待合并节点所述的社区与该节点在第二关系网络中所属的社区的重合度,当重合度高于预设重合度时,将待合并节点合并至该节点在第二关系网络中所属的社区。
可见,实施该示例性实施例,能够将因特征值较低而未被确定为目标节点(即,中间人节点)进行召回,提升对于中间人节点的召回率。
作为一种示例性实施例,该属性信息确定方法还可以包括以下步骤:根据属性信息确定检索关键词,并将检索关键词与属性信息进行关联。
本示例实施方式中,可以通过输入检索关键词检索到该属性信息对应的节点,即,用户。举例来说,如果属性信息包括所属行业信息,如,汽车销售行业,那么,终端设备或服务器可以确定出检索关键词为汽车、销售以及汽车销售。检索关键词可以包括属性信息中的分词及分词的组合。
本示例实施方式中,根据属性信息确定检索关键词的方式具体可以为:对属性信息进行切分获得多个分词,将分词及分词的多种组合确定为与属性信息对应的检索关键词。
可见,实施该示例性实施例,能够确定出检索关键词,以便属性信息的查询,进而快速确定出需要进行广告投放的属性信息对应的社区,提升广告投放效率。
本示例实施方式中,请参阅图10,图10示出了根据本公开一示例性实施例的另一种属性信息确定方法的流程示意图。如图10所示,另一种属性信息确定方法包括步骤S1010、步骤S1020、步骤S1030、步骤S1040、步骤S1050、步骤S1060、步骤S1070、步骤S1080以及步骤S1090,其中:
步骤S1010:确定第一关系网络中各节点的特征值。
步骤S1020:将特征值大于预设阈值的节点作为目标节点构建第二关系网络。
步骤S1030:对第二关系网络进行中间人社区划分。
步骤S1040:根据社区内目标节点的关联信息确定中间人社区的属性信息。
步骤S1050:比对中间人社区和同事社区的重合度,合并重合度高的同事社区。
步骤S1060:将第一关系网络中各节点作为中心节点进行社区发现。
步骤S1070:确定出同事社区。
步骤S1080:确定出行业关键词。
步骤S1090:模糊匹配得到该行业中间人节点的集合。
具体地,终端设备或服务器可以确定第一关系网络中各节点的特征值,其中,特征值可以用于表示节点连接其他节点的能力;进而,可以将特征值大于预设阈值的节点作为目标节点构建第二关系网络,第二关系网络可以表示目标节点之间的连接关系;进而,对第二关系网络进行中间人社区划分;进而,根据社区内目标节点的关联信息(如,昵称、签名等)确定中间人社区的属性信息(如,节点所属的行业信息);进而,将第一关系网络中各节点作为中心节点进行社区发现,确定出同事社区;进而,比对中间人社区和同事社区的重合度,合并重合度高的同事社区,这样能够在一定程度上解决因少数中间人节点的特征值较低而未被确定为目标节点的问题,通过合并重合度高的同事社区能够将上述这部分的中间人节点召回,一定程度上避免对中间人节点的遗漏,提升了中间人节点的召回率;进而,确定出行业关键词,其中,由于部分行业(如,房产中介行业)的特殊性,确定出行业关键词(如,房地产、中介和房产中介)能够提升对于中间人节点的挖掘效率;进而,通过模糊匹配能够得到该行业中间人节点的集合,可以理解为,根据行业关键词能够确定出不同行业的中间人节点集合。
可见,实施图10所示的另一种属性信息确定方法的流程示意图,能够在一定程度上克服通过不同判定规则确定出每个行业中间人存在着的维护效率较低的问题,进而通过社区划分的方式将同一社区的中间人确定为同一行业,以在一定程度上改善因需要维护多个判定规则而造成的维护效率较低的问题;以及,能够通过社区划分的方式确定出不同行业的中间人提升中间人识别效率、识别准确率以及召回率;以及,能够社区划分的方式将同一社区的中间人确定为同一行业,降低对于不同行业中间人识别规则的维护成本。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
进一步的,本示例实施方式中,还提供了一种属性信息确定装置。该属性信息确定装置可以应用于一服务器或终端设备。参考图11所示,该属性信息确定装置可以包括:特征值确定单元1101、关系网络构建单元1102、社区划分单元1103以及属性信息确定单元1104,其中:
特征值确定单元1101,用于根据第一关系网络中各节点之间的连接关系确定每个节点的特征值,并根据特征值从各节点中确定多个目标节点。
关系网络构建单元1102,用于根据多个目标节点以及多个目标节点之间的连接关系构建第二关系网络。
社区划分单元1103,用于将第二关系网络中的目标节点划分为多个社区,并根据每个社区中各目标节点的关联信息确定该社区的属性信息。
属性信息确定单元1104,用于将每个社区的属性信息确定为该社区内的目标节点的属性信息。
可见,实施图11所示的属性信息确定装置,能够在一定程度上克服通过不同判定规则确定出每个行业中间人存在着的维护效率较低的问题,进而通过社区划分的方式将同一社区的中间人确定为同一行业,以在一定程度上改善因需要维护多个判定规则而造成的维护效率较低的问题;以及,能够通过社区划分的方式确定出不同行业的中间人提升中间人识别效率、识别准确率以及召回率;以及,能够社区划分的方式将同一社区的中间人确定为同一行业,降低对于不同行业中间人识别规则的维护成本。
在本公开的一种示例性实施例中,特征值确定单元1101根据第一关系网络中各节点之间的连接关系确定每个节点的特征值的方式具体为:特征值确定单元1101根据第一关系网络中各节点之间的连接关系确定每个节点的实际连接关系数量与预测连接关系数量之比,作为该节点的社交关系密度;特征值确定单元1101根据社交关系密度确定每个节点的特征值。
可见,实施该示例性实施例,能够根据每个节点之间的连接关系确定出节点的特征值,即,每个节点连接原本不认识的好友的能力,这样能够提升对于中间人节点的识别效率。
在本公开的一种示例性实施例中,属性信息确定装置还可以包括连接关系数量确定单元(未图示),其中:连接关系数量确定单元,用于根据连接关系确定每个节点连接的节点数量,并根据节点数量确定出该节点的预测连接关系数量。
在本公开的一种示例性实施例中,社区划分单元,还用于将第一关系网络中每个节点作为中心进行社区划分,以识别与该节点属于同一社区的待合并节点。
可见,实施该示例性实施例,能够通过将每个节点作为中心节点进行社区划分,以便将因特征值较低而未被确定为目标节点(即,中间人节点)进行召回,提升对于中间人节点的召回率。
在本公开的一种示例性实施例中,属性信息确定装置还可以包括节点合并单元(未图示),其中:节点合并单元,用于将待合并节点合并至该节点在第二关系网络中所属的社区。
可见,实施该示例性实施例,能够将因特征值较低而未被确定为目标节点(即,中间人节点)进行召回,提升对于中间人节点的召回率。
在本公开的一种示例性实施例中,社区划分单元1103将第二关系网络中的目标节点划分为多个社区的方式具体为:社区划分单元1103根据多个目标节点之间的连接关系确定节点之间的结构相关度;社区划分单元1103根据结构相关度和各目标节点的关联信息确定目标节点的聚合度;社区划分单元1103通过聚合度对目标节点进行聚类,并根据聚类结果将第二关系网络中的目标节点划分为多个社区。
可见,实施该示例性实施例,能够通过对目标节点进行社区划分,进而确定出不同行业的中间人节点,以便提升广告推广效率和推广效果。
在本公开的一种示例性实施例中,属性信息确定装置还可以包括检索关键词确定单元(未图示),其中:检索关键词确定单元,用于根据属性信息确定检索关键词,并将检索关键词与属性信息进行关联。
可见,实施该示例性实施例,能够确定出检索关键词,以便属性信息的查询,进而快速确定出需要进行广告投放的属性信息对应的社区,提升广告投放效率。
在本公开的一种示例性实施例中,属性信息确定单元1104将每个社区的属性信息确定为该社区内的目标节点的属性信息的方式具体为:属性信息确定单元1104确定每个社区内与该社区的属性信息不同的目标节点;属性信息确定单元1104将该社区的属性信息确定为与该社区的属性信息不同的目标节点的属性信息。
可见,实施该示例性实施例,能够通过为社区内的不同属性信息的节点赋上与其他节点相同的属性信息,以实现对于不同行业的中间人节点的挖掘,提升中间人节点的挖掘效率。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
由于本公开的示例实施例的属性信息确定装置的各个功能模块与上述属性信息确定方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的属性信息确定方法的实施例。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种属性信息确定方法,其特征在于,包括:
根据第一关系网络中各节点之间的连接关系确定每个所述节点的特征值,根据所述特征值从各所述节点中确定多个目标节点;
根据所述多个目标节点以及所述多个目标节点之间的连接关系构建第二关系网络;
将所述第二关系网络中的所述目标节点划分为多个社区,并根据每个社区中各所述目标节点的关联信息确定该所述社区的属性信息;
将所述每个社区的属性信息确定为该所述社区内的目标节点的属性信息。
2.根据权利要求1所述的方法,其特征在于,根据第一关系网络中各节点之间的连接关系确定每个所述节点的特征值,包括:
根据第一关系网络中各节点之间的连接关系确定每个所述节点的实际连接关系数量与预测连接关系数量之比,作为该所述节点的社交关系密度;
根据所述社交关系密度确定每个所述节点的特征值。
3.根据权利要求2所述的方法,其特征在于,还包括:
根据所述连接关系确定每个所述节点连接的节点数量,并根据所述节点数量确定出该所述节点的所述预测连接关系数量。
4.根据权利要求1所述的方法,其特征在于,还包括:
将所述第一关系网络中每个所述节点作为中心进行社区划分,以识别与该所述节点属于同一社区的待合并节点。
5.根据权利要求4所述的方法,其特征在于,还包括:
将所述待合并节点合并至该所述节点在所述第二关系网络中所属的社区。
6.根据权利要求1所述的方法,其特征在于,将所述第二关系网络中的所述目标节点划分为多个社区,包括:
根据所述多个目标节点之间的连接关系确定节点之间的结构相关度;
根据所述结构相关度和各所述目标节点的关联信息确定所述目标节点的聚合度;
通过所述聚合度对所述目标节点进行聚类,并根据聚类结果将所述第二关系网络中的所述目标节点划分为多个社区。
7.根据权利要求1所述的方法,其特征在于,还包括:
根据所述属性信息确定检索关键词,并将所述检索关键词与所述属性信息进行关联。
8.根据权利要求1所述的方法,其特征在于,将所述每个社区的属性信息确定为该所述社区内的目标节点的属性信息,包括:
确定每个所述社区内与该所述社区的属性信息不同的目标节点;
将该所述社区的属性信息确定为与该所述社区的属性信息不同的目标节点的属性信息。
9.一种属性信息确定装置,其特征在于,包括:
特征值确定单元,用于根据第一关系网络中各节点之间的连接关系确定每个所述节点的特征值,并根据所述特征值从各所述节点中确定多个目标节点;
关系网络构建单元,用于根据所述多个目标节点以及所述多个目标节点之间的连接关系构建第二关系网络;
社区划分单元,用于将所述第二关系网络中的所述目标节点划分为多个社区,并根据每个社区中各所述目标节点的关联信息确定该所述社区的属性信息;
属性信息确定单元,用于将所述每个社区的属性信息确定为该所述社区内的目标节点的属性信息。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910454915.2A CN112101390B (zh) | 2019-05-29 | 2019-05-29 | 属性信息确定方法、属性信息确定装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910454915.2A CN112101390B (zh) | 2019-05-29 | 2019-05-29 | 属性信息确定方法、属性信息确定装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101390A true CN112101390A (zh) | 2020-12-18 |
CN112101390B CN112101390B (zh) | 2024-08-27 |
Family
ID=73748309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910454915.2A Active CN112101390B (zh) | 2019-05-29 | 2019-05-29 | 属性信息确定方法、属性信息确定装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101390B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111133A (zh) * | 2021-04-09 | 2021-07-13 | 北京沃东天骏信息技术有限公司 | 用户分类的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102668457A (zh) * | 2009-09-30 | 2012-09-12 | 柯蔼文 | 用于社交图数据分析以确定社区内的连接性的系统和方法 |
CN103024017A (zh) * | 2012-12-04 | 2013-04-03 | 武汉大学 | 一种社交网络重要目标及社区群体识别方法 |
CN105159918A (zh) * | 2015-07-23 | 2015-12-16 | 常州大学 | 一种基于信任关联度的微博网络社区发现方法 |
CN105279187A (zh) * | 2014-07-15 | 2016-01-27 | 天津科技大学 | 一种基于边聚集系数的社会网络群体划分方法 |
CN108304482A (zh) * | 2017-12-29 | 2018-07-20 | 北京城市网邻信息技术有限公司 | 经纪人的识别方法及装置、电子设备和可读存储介质 |
CN108520470A (zh) * | 2017-02-28 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 用于生成用户属性信息的方法和装置 |
-
2019
- 2019-05-29 CN CN201910454915.2A patent/CN112101390B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102668457A (zh) * | 2009-09-30 | 2012-09-12 | 柯蔼文 | 用于社交图数据分析以确定社区内的连接性的系统和方法 |
CN103024017A (zh) * | 2012-12-04 | 2013-04-03 | 武汉大学 | 一种社交网络重要目标及社区群体识别方法 |
CN105279187A (zh) * | 2014-07-15 | 2016-01-27 | 天津科技大学 | 一种基于边聚集系数的社会网络群体划分方法 |
CN105159918A (zh) * | 2015-07-23 | 2015-12-16 | 常州大学 | 一种基于信任关联度的微博网络社区发现方法 |
CN108520470A (zh) * | 2017-02-28 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 用于生成用户属性信息的方法和装置 |
CN108304482A (zh) * | 2017-12-29 | 2018-07-20 | 北京城市网邻信息技术有限公司 | 经纪人的识别方法及装置、电子设备和可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111133A (zh) * | 2021-04-09 | 2021-07-13 | 北京沃东天骏信息技术有限公司 | 用户分类的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112101390B (zh) | 2024-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111932386B (zh) | 用户账号确定方法及装置、信息推送方法及装置、电子设备 | |
WO2020114022A1 (zh) | 一种知识库对齐方法、装置、计算机设备及存储介质 | |
US20190179615A1 (en) | Community discovery method, device, server and computer storage medium | |
CN111400504B (zh) | 企业关键人的识别方法和装置 | |
CN112231592B (zh) | 基于图的网络社团发现方法、装置、设备以及存储介质 | |
CN112989055B (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
US20200117686A1 (en) | Determining identity in an image that has multiple people | |
WO2017181866A1 (en) | Making graph pattern queries bounded in big graphs | |
CN111460234B (zh) | 图查询方法、装置、电子设备及计算机可读存储介质 | |
CN114357105B (zh) | 地理预训练模型的预训练方法及模型微调方法 | |
CN110555172B (zh) | 用户关系挖掘方法及装置、电子设备和存储介质 | |
CN112395487A (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN112231570A (zh) | 推荐系统托攻击检测方法、装置、设备及存储介质 | |
CN112860993A (zh) | 兴趣点的分类方法、装置、设备、存储介质及程序产品 | |
CN114579584A (zh) | 数据表处理方法、装置、计算机设备和存储介质 | |
Li et al. | A new closed frequent itemset mining algorithm based on GPU and improved vertical structure | |
CN113609345A (zh) | 目标对象关联方法和装置、计算设备以及存储介质 | |
CN110019845B (zh) | 一种基于知识图谱的社区演化分析方法及装置 | |
Epasto et al. | Massively parallel and dynamic algorithms for minimum size clustering | |
CN115700548A (zh) | 用户行为预测的方法、设备和计算机程序产品 | |
CN112101390B (zh) | 属性信息确定方法、属性信息确定装置及电子设备 | |
CN111209403B (zh) | 数据处理方法、装置、介质及电子设备 | |
CN116028832A (zh) | 一种样本聚类处理方法、装置、存储介质及电子设备 | |
US20230029312A1 (en) | Similarity-based search for fraud prevention | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |