CN116049438A - 一种基于知识图谱的群体成员关系分析方法 - Google Patents

一种基于知识图谱的群体成员关系分析方法 Download PDF

Info

Publication number
CN116049438A
CN116049438A CN202310030332.3A CN202310030332A CN116049438A CN 116049438 A CN116049438 A CN 116049438A CN 202310030332 A CN202310030332 A CN 202310030332A CN 116049438 A CN116049438 A CN 116049438A
Authority
CN
China
Prior art keywords
members
group
interaction
nodes
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310030332.3A
Other languages
English (en)
Other versions
CN116049438B (zh
Inventor
王青旺
王铭野
沈韬
宋健
汪志锋
陶智敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202310030332.3A priority Critical patent/CN116049438B/zh
Publication of CN116049438A publication Critical patent/CN116049438A/zh
Application granted granted Critical
Publication of CN116049438B publication Critical patent/CN116049438B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于知识图谱的群体成员关系分析方法,属于社交网络分析技术领域。本发明所述方法包括:获取群体成员之间的交互信息,对于不同的交互行为,定义不同的数值用以表示本次交互的强度,根据交互的强度对于重复交互进行重复积分,构建基于群体成员间关系的知识图谱;基于知识图谱得到关键成员;在图中将关键成员节点删除,计算群体平均影响力大小,比较每个关键成员的删除对群体影响力的影响程度,最终得到群体成员中的主要成员和次要成员;该方法能够考虑人物关系的复杂性。

Description

一种基于知识图谱的群体成员关系分析方法
技术领域
本发明涉及一种基于知识图谱的群体成员关系分析方法,属于社交网络分析技术领域。
背景技术
随着网络技术的迅速发展,人们的生活方式也发生了很大的变化。现实社会中人与人之间的关系通过互联网得到了新的延伸。人们通过互联网进行着各种各样的交互也促进了社交网络的蓬勃发展。近年来,用户们通过各种社交网络服务平台进行着互动,这也逐渐形成了社交网络的基本结构。在现实世界中,人们的活动也通常表现出明显的群体性(如:家庭群体,朋友群体等)。在网络社会中,交互紧密的用户们也逐渐形成了网络上的社区;同时,网络社会呈现出的社会群体使得现实世界中的众多活动、事件的产生和发展变得更加容易。然而,群体聚集的形成离不开信息传播的关键成员,这种成员在群体中往往具有较高的影响力,也促进着群体的形成和聚集的速度。通过对关键成员的识别,能够有效地控制整个群体,避免不良事件的发生。因此,开展社交网络中群体内关键成员识别技术研究,对维护社会稳定、抑制不良信息传播有着重要的现实意义。
目前,多数方法对社交网络中关键成员识别研究中只考虑到成员的影响力,未能有效利用成员本身属性特征和节点之间的社会关系,不能保证群体成员关系分析的准确性和有效性。因此,如何使用节点的社会属性信息和节点间的社会关系指导群体内关键成员识别,是目前亟待解决的技术问题。
发明内容
本发明的目的在于提出了一种基于知识图谱的群体成员关系分析方法,使用节点的社会属性信息和节点间的社会关系来识别群体内关键成员,该方法能够考虑人物关系的复杂性。
本发明的技术方案是:一种基于知识图谱的群体成员关系分析方法,具体步骤为:
Step1:将群体中的所有成员都视为一个节点,获取群体成员之间的交互信息,对于不同的交互行为,定义不同的数值用以表示本次交互的强度,根据交互的强度对于重复交互进行重复积分,构建基于群体成员间关系的知识图谱。
Step2:基于知识图谱得到关键成员。
Step3:在图中将关键成员节点删除,计算群体平均影响力大小,比较每个关键成员的删除对群体影响力的影响程度。
Step4:根据影响程度对关键成员进行排序,获得群体成员的主要成员和次要成员。
所述Step1的具体过程为:通过图论表示群体社交关系网络,将其定义为:,其中 V表示群体中的成员, E表示成员间关系;定义交互行为集合,其中 I n 代表不同的交互行为,对于不同的交互行为,定义不同的数值用以表示本次交互的强度值,例如:短信的强度数值为1、通话的强度数值为2......;对于重复交互进行重复积分,不断更新成员间的关系强度。
所述Step2的具体过程为:根据以下公式计算每个成员节点介数
其中, n vk 表示节点 vk之间的最短路径个数; n vk( i)表示节点 vk之间的最短路径中经过节点 i的个数; S u 是该群体网络的成员节点集合。
根据节点介数对成员节点进行降序排列,设置阈值 τ,选取前 τ个成员为群体中的关键成员;本发明中令阈值 τ为群体成员数目的30%。
所述Step3的具体过程为:将得到的关键成员节点删除,得到新的成员关系图;通过以下公式计算群体平均影响力
其中, P v 为成员 v受到周围社交群体环境的影响程度,为成员所述群体环境中成员的数量; S u 是该群体网络的成员节点集合。
根据社会心理学中的邓巴数字理论,在本网络中的群体社交关系网络中,产生影响的成员之间应位于3跳以内的网络中;通过以下公式计算成员的影响程度
其中, E v 表示成员 v与其周围成员之间的交互强度;是包含每一个成员的属性特征(如户籍、年龄、性别、身高、体重、爱好等特征)的向量;是每个成员的平均外生特征,其系数向量代表背景效应;表示成员周围网络的繁荣程度,表示成员的隐性特征,是该群体网络的成员节点集合。
所述Step4的具体过程为:计算删除关键成员前后群体成员平均影响力的差值 Q,根据 Q值对关键成员进行排序, Q值越大的成员越趋近于群体主要成员。
本发明的有益效果:
和现有技术相比,本发明采用构建知识图谱的形式获取每个成员的属性特征,能够最大化利用每个成员的特征信息,通过计算节点介数筛选关键成员,通过设定阈值的方式从关键成员中筛选核心成员,本发明能够综合考虑人物关系的复杂性,对社交网络中关键成员识别研究中考虑成员的影响力,有效利用成员本身属性特征和节点之间的社会关系。
附图说明
图1是本发明的步骤流程图;
图2是本发明的系统架构图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明,但本发明的保护范围并不限于所述内容。
一种基于知识图谱的群体成员关系分析方法,具体步骤为:
Step1:如图2中所示,现有群体含有9个成员:[成员1,成员2,成员3,成员4,成员5,成员6,成员7,成员8,成员9],将群体中的所有成员都视为一个节点,通过图论表示群体社交关系网络,将其定义为:,其中 V表示不同的交互行为,对于不同的交互行为,定义不同的数值用以表示本次交互的强度,例如:短信的强度数值为1、通话的强度数值为2......,该部分可以人为定义;成员间交互越频繁,他们的关系强度也就越强,因此,对于重复交互进行重复积分,不断更新成员间的关系强度,构建基于群体成员间关系的知识图谱,如图2中所示,节点间边的粗细表示关系强度的大小;该步骤能够有效衡量成员间的交互强度,从而构建更加准确的群体成员关系知识图谱。
Step2:根据以下公式计算本群体中每个成员的节点介数:
其中, n vk 表示节点 vk之间的最短路径个数; n vk( i)表示节点 vk之间的最短路径中经过节点 i的个数; S u 是该群体网络的成员节点集合;结合图1,具体计算结果如表1和2所示。
表1 节点 vk之间的最短路径个数
表2表示节点之间的最短路径中经过节点 i的个数和每个节点 i的介数
根据节点介数对成员节点进行降序排列,设置阈值3,选取前3个成员为群体中的关键成员即[成员2,成员5,成员6],该步骤能够对群体中的关键成员进行筛查,通过计算介数能够得到相对核心的关键成员。
Step3:在图中将关键成员节点删除,得到三个子群体:子群体1[成员1,成员3,成员4,成员5,成员6,成员7,成员8,成员9]、子群体2[成员1,成员2,成员3,成员4,成员6,成员7,成员8,成员9]、子群体3[成员1,成员2,成员3,成员4,成员5,成员7,成员8,成员9],得到新的成员关系图;通过以下公式计算群体平均影响力
其中, P v 为成员 v受到周围社交群体环境的影响程度,为成员所述群体环境中成员的数量为8。
根据社会心理学中的邓巴数字理论,在本网络中的群体社交关系网络中,产生影响的成员之间应位于3跳以内的网络中;通过以下公式计算成员的影响程度。
其中, E v 表示成员 v与其周围成员之间的交互强度(短信的强度数值为1、通话的强度数值为2,交互一次进行累积积分一次);是包含每一个成员的属性特征,如户籍、年龄、性别、身高、体重等特征,(普通特征赋值为1,属性特征赋值为2,例如可以假设身高180cm为关键特征,其余均为普通特征,本实施例9个成员中,成员2、成员5和成员6为2,其余均全部为1)的向量;是每个成员的平均外生特征,其系数向量代表背景效应(本实施例将有犯罪史为背景效应,赋值2,没有犯罪史赋值1,成员5和成员6赋值2,其余成员为1);表示成员周围网络的繁荣程度(有一条网络加1,成员5周围有4条网络,成员6周围4条网络,成员2周围3条网络),表示成员的隐性特征(其计算方式为根据已知特征通过人工智能,深度学习等常规方式进行计算出的一个向量,本实施例假设所有成员的隐形特征类似),是该群体网络的成员节点集合;该步骤能够有效判别每个群体关键成员的群体影响力,从而得到最具影响力的关键成员。
Step4:计算群体平均影响力大小,计算删除关键成员前和删除关键成员后群体成员平均影响力的差值 Q,根据 Q值对该关键成员进行排序, Q值越大的成员越趋近于群体主要成员,最终得到子群体3<子群体2<子群体1,选取前2名成员作为核心成员,成员5和成员6的删除对群体影响程度最大,故得到本群体核心成员:[成员5,成员6],得到群体次要核心成员:[成员2],其余成员为次要成员:[成员1,成员3,成员4,成员7,成员8,成员9]。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (6)

1.一种基于知识图谱的群体成员关系分析方法,其特征在于:具体步骤为:
Step1:将群体中的所有成员都视为一个节点,获取群体成员之间的交互信息,对于不同的交互行为,定义不同的数值用以表示本次交互的强度,根据交互的强度对于重复交互进行重复积分,构建基于群体成员间关系的知识图谱;
Step2:基于知识图谱得到关键成员;
Step3:在图中将关键成员节点删除,计算群体平均影响力大小,比较每个关键成员的删除对群体影响力的影响程度;
Step4:根据影响程度对关键成员进行排序,获得群体成员的主要成员和次要成员。
2.根据权利要求1所述的基于知识图谱的群体成员关系分析方法,其特征在于,Step1中,通过图论表示群体社交关系网络,将其定义为:,其中V表示群体中的成员,E表示成员间关系;定义交互行为集合,其中I n 代表不同的交互行为,对于不同的交互行为,定义不同的数值用以表示本次交互的强度值;对于重复交互进行重复积分,不断更新成员间的关系强度。
3.根据权利要求1所述的基于知识图谱的群体成员关系分析方法,其特征在于,在Step2中根据以下公式计算每个成员节点介数
其中,n vk 表示节点vk之间的最短路径个数;n vk(i)表示节点vk之间的最短路径中经过节点i的个数;Su是该群体网络的成员节点集合;
根据节点介数对成员节点进行降序排列,设置阈值τ,选取前τ个成员为群体中的关键成员。
4.根据权利要求1所述的基于知识图谱的群体成员关系分析方法,其特征在于,在Step3中将得到的关键成员节点删除,得到新的成员关系图;通过以下公式计算群体平均影响力
其中,P v 为成员v受到周围社交群体环境的影响程度,为成员所述群体环境中成员的数量;S u 是该群体网络的成员节点集合。
5.根据权利要求4所述的基于知识图谱的群体成员关系分析方法,其特征在于,根据社会心理学中的邓巴数字理论,在本网络中的群体社交关系网络中,产生影响的成员之间应位于3跳以内的网络中;通过以下公式计算成员的影响程度
其中,E v 表示成员v与其周围成员之间的交互强度;是包含每一个成员的属性特征的向量;是每个成员的平均外生特征,其系数向量代表背景效应;表示成员周围网络的繁荣程度,表示成员的隐性特征,是该群体网络的成员节点集合。
6.根据权利要求1所述的基于知识图谱的群体成员关系分析方法,其特征在于,在Step4中,计算删除关键成员前后群体成员平均影响力的差值Q,根据Q值对关键成员进行排序,Q值越大的成员越趋近于群体主要成员。
CN202310030332.3A 2023-01-10 2023-01-10 一种基于知识图谱的群体成员关系分析方法 Active CN116049438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310030332.3A CN116049438B (zh) 2023-01-10 2023-01-10 一种基于知识图谱的群体成员关系分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310030332.3A CN116049438B (zh) 2023-01-10 2023-01-10 一种基于知识图谱的群体成员关系分析方法

Publications (2)

Publication Number Publication Date
CN116049438A true CN116049438A (zh) 2023-05-02
CN116049438B CN116049438B (zh) 2023-06-02

Family

ID=86121537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310030332.3A Active CN116049438B (zh) 2023-01-10 2023-01-10 一种基于知识图谱的群体成员关系分析方法

Country Status (1)

Country Link
CN (1) CN116049438B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992960A (zh) * 2023-09-25 2023-11-03 成都市智慧蓉城研究院有限公司 一种知识图谱可视化交互方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE8515869U1 (zh) * 1985-05-30 1986-11-13 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
EP3432629A1 (en) * 2017-07-20 2019-01-23 Nokia Solutions and Networks Oy Partitioning method and apparatus for partitioning a plurality of wireless access points into management clusters
CN110110093A (zh) * 2019-04-08 2019-08-09 深圳众赢维融科技有限公司 一种基于知识图谱的识别方法、装置、电子设备及存储介质
CN110390039A (zh) * 2019-07-25 2019-10-29 广州汇智通信技术有限公司 基于知识图谱的社交关系分析方法、装置及设备
US20190340294A1 (en) * 2018-05-04 2019-11-07 International Business Machines Corporation Combining semantic relationship information with entities and non-entities for predictive analytics in a cognitive system
CN114218502A (zh) * 2021-12-17 2022-03-22 安徽大学 基于稀疏进化算法的社交网络关键成员检测方法
WO2022078102A1 (zh) * 2020-10-14 2022-04-21 腾讯科技(深圳)有限公司 一种实体识别方法、装置、设备以及存储介质
CN114820139A (zh) * 2022-05-25 2022-07-29 重庆大学 一种基于知识图谱路径推理的多用户推荐系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE8515869U1 (zh) * 1985-05-30 1986-11-13 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
EP3432629A1 (en) * 2017-07-20 2019-01-23 Nokia Solutions and Networks Oy Partitioning method and apparatus for partitioning a plurality of wireless access points into management clusters
US20190340294A1 (en) * 2018-05-04 2019-11-07 International Business Machines Corporation Combining semantic relationship information with entities and non-entities for predictive analytics in a cognitive system
CN110110093A (zh) * 2019-04-08 2019-08-09 深圳众赢维融科技有限公司 一种基于知识图谱的识别方法、装置、电子设备及存储介质
CN110390039A (zh) * 2019-07-25 2019-10-29 广州汇智通信技术有限公司 基于知识图谱的社交关系分析方法、装置及设备
WO2022078102A1 (zh) * 2020-10-14 2022-04-21 腾讯科技(深圳)有限公司 一种实体识别方法、装置、设备以及存储介质
CN114218502A (zh) * 2021-12-17 2022-03-22 安徽大学 基于稀疏进化算法的社交网络关键成员检测方法
CN114820139A (zh) * 2022-05-25 2022-07-29 重庆大学 一种基于知识图谱路径推理的多用户推荐系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
TRAN, Q.M 等: "Measuring the influence and amplification of users on social network with unsupervised behaviors learning and efficient interaction-based knowledge graph", 《JOURNAL OF COMBINATORIAL OPTIMIZATION》, pages 2919 *
TRAN, Q.M. 等: "Measuring the influence and amplification of users on social network with unsupervised behaviors learning and efficient interaction-based knowledge graph", 《JOURNAL OF COMBINATORIAL OPTIMIZATION》, no. 44, pages 2919 *
卢恒 等: "基于知识图谱的网络社区学术资源深度聚合框架研究", 《情报理论与实 践》, vol. 44, no. 1, pages 180 - 187 *
卢恒 等: "基于知识图谱的网络社区学术资源深度聚合框架研究", 《情报理论与实践》, vol. 44, no. 1, pages 180 - 187 *
曹坤宇: "基于亲密度及影响力的微博社交兴趣圈挖掘算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 2015, pages 139 - 209 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992960A (zh) * 2023-09-25 2023-11-03 成都市智慧蓉城研究院有限公司 一种知识图谱可视化交互方法及系统
CN116992960B (zh) * 2023-09-25 2023-12-05 成都市智慧蓉城研究院有限公司 一种知识图谱可视化交互方法及系统

Also Published As

Publication number Publication date
CN116049438B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
Dong et al. Dynamics of public opinions in an online and offline social network
Jiacheng et al. A hybrid genetic algorithm based on information entropy and game theory
CN103678613B (zh) 一种计算影响力数据的方法与装置
CN103605791B (zh) 信息推送系统和信息推送方法
CN109523021A (zh) 一种基于长短时记忆网络的动态网络结构预测方法
CN112364908B (zh) 一种面向决策树的纵向联邦学习方法
CN106372072A (zh) 一种基于位置的移动社会网络用户关系的识别方法
CN104915397A (zh) 一种微博传播趋势预测方法及装置
CN105376223B (zh) 网络身份关系的可靠度计算方法
CN112084373B (zh) 一种基于图嵌入的多源异构网络用户对齐方法
CN109327480B (zh) 一种多步攻击场景挖掘方法
CN110263236B (zh) 基于动态多视图学习模型的社交网络用户多标签分类方法
CN116049438B (zh) 一种基于知识图谱的群体成员关系分析方法
CN110334286A (zh) 一种基于信任关系的个性化推荐方法
CN105956184A (zh) 一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法
CN109960755B (zh) 一种基于动态迭代快速梯度的用户隐私保护方法
CN109754122A (zh) 一种基于随机森林特征提取的bp神经网络的数值预测方法
CN116362329A (zh) 一种融合参数优化的集群联邦学习方法及设备
CN110598129A (zh) 基于两级信息熵的跨社交网络用户身份识别方法
CN107993156B (zh) 一种基于社交网络有向图的社区发现方法
WO2011162662A1 (en) Determining a churn risk
CN108683534B (zh) 一种面向社区发现的网络薄弱节点搜索方法
CN109242294A (zh) 改进模糊神经网络的电力通信性能预警方法及装置
CN110489660B (zh) 一种社交媒体公开数据的用户经济状况画像方法
CN109885797B (zh) 一种基于多身份空间映射的关系网络构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant