CN106600432A - 基于社交属性行为数据的行为间影响力评估方法和装置 - Google Patents
基于社交属性行为数据的行为间影响力评估方法和装置 Download PDFInfo
- Publication number
- CN106600432A CN106600432A CN201611088240.7A CN201611088240A CN106600432A CN 106600432 A CN106600432 A CN 106600432A CN 201611088240 A CN201611088240 A CN 201611088240A CN 106600432 A CN106600432 A CN 106600432A
- Authority
- CN
- China
- Prior art keywords
- user
- group
- packet
- behavior
- behavioral data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 157
- 230000003542 behavioural effect Effects 0.000 claims description 221
- 241001269238 Data Species 0.000 claims description 17
- 230000009467 reduction Effects 0.000 claims description 7
- 238000004891 communication Methods 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 194
- 230000007246 mechanism Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 208000006011 Stroke Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002301 combined effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000009329 sexual behaviour Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010008190 Cerebrovascular accident Diseases 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的实施方式提供了一种基于社交属性行为数据的行为间影响力评估方法。该方法包括:获取每一用户在指定时间段内的行为数据;针对每一用户,根据属性行为数据和交流行为数据确定该用户对应的CWBS值;根据该用户归属的组以及该用户对应的属性行为数据、与其它用户的交流行为数据、对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。通过对用户属性行为和与其他用户之间的交流行为进行度量,结合用户的相关行为数据评估彼此之间的行为对于另外一种相关联行为产生的影响力,提高了评估方法的通用性,为用户带来了更好的体验。此外,本发明的实施方式提供了一种基于社交属性行为数据的行为间影响力评估装置。
Description
技术领域
本发明的实施方式涉及互联网数据处理技术领域,更具体地,本发明的实施方式涉及一种基于社交属性行为数据的行为间影响力评估方法和装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网技术的不断发展,基于互联网技术的各种应用也层出不穷,用于满足人们日常生活的需要。例如,虚拟社区这一基于互联网技术的互联网应用发展迅速,从早期的论坛,到后来的大型网络游戏、网络公开课、社交网站等等。在这样虚拟社会环境中,人物有各种各样的属性也产生各种各样的行为,而且,这些属性和行为之间存在一定的联系,而如何对这些属性和行为之间的联系进行评估也是当下研究的热点问题之一。
发明内容
在信息化大数据时代,常常有大量精确的数据被精确记录,根据这些数据,借鉴一些社会科学方面的模型,可以更好的理解环境中人物的行为,为有关部门进行决策提供精准的数据支持。现有技术中,有利用社交网站上好友数据以及推送广告接收数据对此进行分析的方法;也有利用网络游戏中各种动态属性通过一些数据挖掘方法进行行为分析的方法等等。
但是,现有的评估方法中,有些不适用于较大的数据量,有些只考虑单一属性变化,没有加入所处虚拟社会环境的影响等等,因此,其应用具有一定的局限性。
为此,非常需要一种改进的对虚拟环境中人物的属性和行为之间联系进行评估的评估方法,以提高评估方法的通用性,为相关需求部门提供更加精准的数据支持。
在本上下文中,本发明的实施方式期望提供一种基于社交属性行为数据的行为间影响力评估方法和装置。
在本发明实施方式的第一方面中,提供了一种基于社交属性行为数据的行为间影响力评估方法,包括:
获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据;
针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;以及
根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
优选地,所述属性行为数据包括多个维度的属性行为数据;以及
针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值,具体包括:
针对每一用户,利用预设算法将该用户对应的多个维度的属性行为数据降维为一维指标数据;以及
根据该用户与其它用户的交流行为数据,确定该用户对应的特征向量中心度;
根据为所述一维指标数据和所述特征向量中心度预先分配的权值,确定所述一维指标数据和所述特征向量中心度的加权结果为该用户对应的CWBS值。
优选地,根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估,具体包括:
利用如下公式对该用户受影响行为进行评估:
其中:
表示该用户对应的受影响行为数据;
i表示该用户所属组的组标识;
k表示该用户对应的用户标识;
t表示所述指定时间段;
p表示该用户对应的属性行为数据;
DC表示与其它用户的交流行为对该用户受影响行为的影响;
SI表示环境对该用户受影响行为的影响,其中,环境对该用户受影响行为的影响根据所有用户对应的CWBS值确定;
TC表示三元闭包对该用户受影响行为的影响,其中,三元闭包对该用户受影响行为的影响根据该用户以及与该用户有过交流行为的其他用户拥有的平均共同好友数量确定;
Controls为影响该用户受影响行为的控制变量,所述控制变量根据该用户对应的属性行为数据以及其他用户对应的属性行为数据确定。
优选地,按照以下公式确定DC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β1,β2,j,β3,β4,j表示不同的回归系数。
优选地,按照以下公式确定SI:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β5,β6,j,β7,β8,j表示不同的回归系数。
优选地,按照以下公式确定TC:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β9,β10,j,β11,β12,j表示不同的回归系数。
优选地,按照以下公式确定DC*SI:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β13,β14,j,β15,β16,j表示不同的回归系数。
优选地,按照以下公式确定DC*TC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β17,β18,j,β19,β20,j表示不同的回归系数。
优选地,按照以下公式确定Controls:
其中:
Xsp(i),k为根据组i中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
Xgp(i),k为根据组i中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
Xsp(j),k为根据组j中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
Xgp(j),k为根据组j中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
Xk为根据用户k属性行为数据确定出的、每一属性行为所对应的指标值;
Ck为根据用户k受影响行为数据确定出的、用户k完成指定受影响行为所付出的努力值;
C'k为根据用户k受影响行为数据确定出的、用户k完成除指定受影响行为以外的其它受影响行为所付出的努力值;
Pj表示与用户k有过交流行为的所有用户中完成所述指定受影响行为的用户所占比例;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β21,β22,j,β23,β24,j,β25,β26,j,β27,β28,j,β29,β30,β31,β32表示不同的回归系数。
在本发明实施方式的第二方面中,提供了一种基于社交属性行为数据的行为间影响力评估装置,包括:
获取单元,用于获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据;
确定单元,用于针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;
行为评估单元,用于根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
优选地,所述属性行为数据包括多个维度的属性行为数据;以及
所述确定单元,包括:
降维子单元,用于针对每一用户,利用预设算法将该用户对应的多个维度的属性行为数据降维为一维指标数据;
第一确定子单元,用于根据该用户与其它用户的交流行为数据,确定该用户对应的特征向量中心度;
第二确定子单元,用于根据为所述一维指标数据和所述特征向量中心度预先分配的权值,确定所述一维指标数据和所述特征向量中心度的加权结果为该用户对应的CWBS值。
优选地,所述行为评估单元,具体用于利用如下公式对该用户受影响行为进行评估:其中:
表示该用户对应的受影响行为数据;
i表示该用户所属组的组标识;
k表示该用户对应的用户标识;
t表示所述指定时间段;
p表示该用户对应的属性行为数据;
DC表示与其它用户的交流行为对该用户受影响行为的影响;
SI表示环境对该用户受影响行为的影响,其中,环境对该用户受影响行为的影响根据所有用户对应的CWBS值确定;
TC表示三元闭包对该用户受影响行为的影响,其中,三元闭包对该用户受影响行为的影响根据该用户以及与该用户有过交流行为的其他用户拥有的平均共同好友数量确定;
Controls为影响该用户受影响行为的控制变量,所述控制变量根据该用户对应的属性行为数据以及其他用户对应的属性行为数据确定。
优选地,所述行为评估单元,具体用于按照以下公式确定DC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β1,β2,j,β3,β4,j表示不同的回归系数。
优选地,所述行为评估单元,具体用于,按照以下公式确定SI:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β5,β6,j,β7,β8,j表示不同的回归系数。
优选地,所述行为评估单元,具体用于按照以下公式确定TC:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β9,β10,j,β11,β12,j表示不同的回归系数。
优选地,所述行为评估单元,具体用于按照以下公式确定DC*SI:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β13,β14,j,β15,β16,j表示不同的回归系数。
优选地,所述行为评估单元,具体用于按照以下公式确定DC*TC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β17,β18,j,β19,β20,j表示不同的回归系数。
优选地,所述行为评估单元,具体用于按照以下公式确定Controls:
其中:
Xsp(i),k为根据组i中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
Xgp(i),k为根据组i中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
Xsp(j),k为根据组j中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
Xgp(j),k为根据组j中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
Xk为根据用户k属性行为数据确定出的、每一属性行为所对应的指标值;
Ck为根据用户k受影响行为数据确定出的、用户k完成指定受影响行为所付出的努力值;
C'k为根据用户k受影响行为数据确定出的、用户k完成除指定受影响行为以外的其它受影响行为所付出的努力值;
Pj表示与用户k有过交流行为的所有用户中完成所述指定受影响行为的用户所占比例;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β21,β22,j,β23,β24,j,β25,β26,j,β27,β28,j,β29,β30,β31,β32表示不同的回归系数。
在本发明实施方式的第三方面中,提供了一种基于社交属性行为数据的行为间影响力评估装置,例如,可以包括存储器和处理器,其中,处理器可以用于读取存储器中的程序,执行下列过程:获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据;针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;以及根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
在本发明实施方式的第四方面中,提供了一种程序产品,其包括程序代码,当所述程序产品运行时,所述程序代码用于执行以下过程:获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据;针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;以及根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
根据本发明实施方式的基于社交属性行为数据的行为间影响力评估方法和装置,通过对用户属性行为和与其他用户之间的交流行为进行度量,结合用户属性行为、与其他用户之间的交流行为以及受影响行为评估彼此之间的行为对于另外一种相关联行为产生的影响力,刻画了在社交环境下用户与用户之间交流行为所产生的影响,从而提高了评估方法的通用性,为相关需求部门提供更加精准的数据支持,为用户带来了更好的体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1a示意性地示出了根据本发明实施方式的基于社交属性行为数据间影响力评估方法的实施流程示意图;
图1b示意性地示出了根据本发明实施方式的确定用户对应的CWBS值的实施流程示意图;
图2示意性地示出了根据本发明另一实施例的基于社交属性行为数据间影响力评估装置的结构示意图;
图3描述了根据本发明的实施方式的程序产品。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种基于社交属性行为数据的行为间影响力评估的方法和装置。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,已有的评估用户属性行为之间联系的方法,有些只考虑单一属性变化,没有考虑社交环境的影响,有些不适用于较大的数据量,具有一定的局限性。
有鉴于此,本发明实施例提供了一种基于社交属性行为数据的行为间影响力评估方法,首先从数据中抽取属性行为数据和与其他用户的交流行为数据,对属性行为数据、交流行为数据进行度量,然后依据度量划分出核心人物和普通人物,再计算彼此之间的行为对于另外一种相关联行为产生的影响力,这样,可以刻画在一个社交环境下,用户和用户之间交流行为产生的影响。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
示例性方法
以下参考图1a和图1b来描述根据本发明示例性实施方式的基于社交属性行为数据的行为间影响力评估的方法。
如图1a所示,其为本发明实施例提供的基于社交属性行为数据的行为间影响力评估方法的实施流程示意图,可以包括以下步骤:
S11、获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据。
本步骤中,可以根据服务器记录的用户数据获得。由于服务器记录的用户数据通常包含一些无效数据,因此,本发明实施例中,可以首先对服务器记录的用户数据进行清洗和整理。通常服务器记录的数据记录包含用户的身份标识(ID)、时间戳t,每个用户有自己的分组g(g1,g2,g3,...);随着时间变化的属性行为数据p1,p2,p3,...,例如,在线多人角色扮演类游戏倩女幽魂中的修炼行为数据、修为行为数据、充值记录数据、VIP等级数据以及PVP击杀行为数据(如PVP击杀人数等)等等;每个用户与其他用户的交流行为数据(为了便于描述,本发明实施例中称与其他用户交流的行为为A行为,例如,在在线多人角色扮演类游戏中的聊天等);受到影响的行为(本发明实施例中称为B行为)数据,比如在在线多人游戏角色扮演类中购买商品的行为数据,其中,B行为可以分为并列的集中形式(b1,b2,b3,...,例如,在游戏中对应购买不同种类的商品行为),将这些数据整合为异构的时间序列数据,将数据字段不全、缺失数据字段的值无法推断的、或者其他异常的数据记录剔除,对时间段进行合理划分,按照时间戳和用户ID进行数据的整合,整合后的数据往往是异构数据,可以存储在诸如MongoDB(一种分布式文档存储数据库)这样的数据库中。
S12、针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的CWBS值。
本步骤中,针对每一用户,通过对该用户对应的属性行为数据p1,p2,p3,...进行降维、抽象得到一维指标数据。例如,可以采用主成分分析法(PCA,PCA,Principal ComponentAnalysis)进行降维得到一维指标数据。
再根据该用户与其它用户的交流行为数据,确定该用户对应的特征向量中心度,根据为所述一维指标数据和所述特征向量中心度预先分配的权值,确定所述一维指标数据和所述特征向量中心度的加权结果为该用户对应的CWBS值。具体地,可以利用从该用户与其他用户的交流行为数据中提出的指标数据(可以根据交流行为数据构建网络,用一些网络的属性诸如centrality(中心度)等作为用于加权的指标)对这个综合指标进行加权,称之为“交流行为加权的行为核心度”(Communication-Weighted BehaviorSophistication,CWBS)。根据一定百分比,在每一组中划分出核心人物(sophisticatedpersons)与普通人物(generalpersons)。
基于此,步骤S12中,可以按照图1b所示的流程确定每一用户对应的CWBS值:
S121、针对每一用户,利用预设算法将该用户对应的多个维度的属性行为数据降维为一维指标数据。
S122、根据该用户与其它用户的交流行为数据,确定该用户对应的特征向量中心度。
S123、根据为所述一维指标数据和所述特征向量中心度预先分配的权值,确定所述一维指标数据和所述特征向量中心度的加权结果为该用户对应的CWBS值。
S13、根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
用户的B行为受到的影响可以看成三种社会机制:直接交流(directcommunication,DC),社会影响(social influence,SI)和三元闭包(triadic closure,TC)。所谓三元闭包,描述的是这样一种现象:当B和C有一个共同的朋友A,他们成为朋友的几率就会增加。
基于此,步骤S13中,利用如下公式对该用户受影响行为进行评估:
其中:
表示该用户对应的受影响行为数据;
i表示该用户所属组的组标识;
k表示该用户对应的用户标识;
t表示所述指定时间段;
p表示该用户对应的属性行为数据;
DC表示与其它用户的交流行为对该用户受影响行为的影响;
SI表示环境对该用户受影响行为的影响,其中,环境对该用户受影响行为的影响根据所有用户对应的CWBS值确定;
TC表示三元闭包对该用户受影响行为的影响,其中,三元闭包对该用户受影响行为的影响根据该用户以及与该用户有过交流行为的其他用户拥有的平均共同好友数量确定;
Controls为影响该用户受影响行为的控制变量,所述控制变量根据该用户对应的属性行为数据以及其他用户对应的属性行为数据确定。
在上述公式中,处于时间段t属于分组i(假设一共有ngr组)的ID为k的用户,可能发生行为bp的是由五个因素共同作用的。前三个因素的含义是评估其他组用户通过三种机制对用户k造成的影响,后两个分别用于评估DC和SI的联合影响以及DC和TC的联合影响,最后一个Controls是一系列可能对用户的B行为产生影响的控制变量,该控制变量根据该用户对应的属性行为数据以及其他用户对应的属性行为数据确定。
具体实施时,步骤S13中可以按照以下公式确定DC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β1,β2,j,β3,β4,j表示不同的回归系数。
具体实施时,可以按照以下公式确定SI:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β5,β6,j,β7,β8,j表示不同的回归系数。
根据上述公式可知,用户k和与其有交流的用户差异越大,其月容易受到影响。
具体实施时,可以按照以下公式确定TC:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β9,β10,j,β11,β12,j表示不同的回归系数。
其中,用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值可以采用Jaccard系数计算,例如,用户u和用户v的Jaccard系数可以按照以下公式确定:类似地,可以利用该公式分别确定出用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,以及用户k与其他组j的核心人物分组内和普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值。
具体实施时,可以按照以下公式确定DC*SI:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β13,β14,j,β15,β16,j表示不同的回归系数。
上述三个公式中的第一项和第三项表示用户k受到三种社会机制(直接交流、社会影响和三元闭包)下同组的核心用户分组和普通用户分组的影响项,而第二项和第四项表示用户k受到三种社会机制下其他组别的核心用户组和普通用户组的影响。这种分解可以评估和比较同组、不同组、核心用户组和普通用户组影响的异同对比和分析。
具体实施时,可以按照以下公式确定DC*SI:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β13,β14,j,β15,β16,j表示不同的回归系数。
具体实施时,可以按照以下公式确定DC*TC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β17,β18,j,β19,β20,j表示不同的回归系数。
上述两个公式中,乘积项的部分用于控制社会环境影响力、三元闭包对直接交流影响力的混淆效果,控制重叠效果能够理清三种社会机制交织的关系,从复杂的影响网络中找出和研究每个机制的影响力。
较佳地,上述的评估方法中,本发明实施例还考虑了控制变量的影响,具体实施时,可以按照以下公式确定Contr:
其中:
Xsp(i),k为根据组i中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组,例如,针对修炼行为,提取核心人物分组中每一核心用户对应的修炼行为数据中相应的指标值求平均得到相应的平均值。
Xgp(i),k为根据组i中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
Xsp(j),k为根据组j中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
Xgp(j),k为根据组j中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
Xk为根据用户k属性行为数据确定出的、每一属性行为所对应的指标值;
Ck为根据用户k受影响行为数据确定出的、用户k完成指定受影响行为所付出的努力值,例如,用户完成商品购买行为中,用户完成购买商品所花费的金额即可用于表征用户完成商品购买行为所付出的努力值;
C'k为根据用户k受影响行为数据确定出的、用户k完成除指定受影响行为以外的其它受影响行为所付出的努力值;
Pj表示与用户k有过交流行为的所有用户(包括本组以及其他组)中完成所述指定受影响行为的用户所占比例;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β21,β22,j,β23,β24,j,β25,β26,j,β27,β28,j,β29,β30,β31,β32表示不同的回归系数。
根据上述评估公式,可以细化到不同组的用户完成不同B任务的情况。由此,可以得到一个方程系统,每个方程系统用表面非相关回归((seemingly unrelatedregression,SUR)来进行估计。
为了比较不同组用户的影响力,分离出每个机制产生的影响力,本发明实施例中,可以采用偏相关平方(squared semi-partial correlation,sr2)来度量核心人物和普通人物的影响力sr2具有可加性,正规化性,以及可以在方程系统内与系统间进行比较的特性。
本发明实施例提供的基于社交属性行为数据的行为间影响力评估方法中,利用用户自身的属性行为数据以及用户与其他用户之间估方法和装置中,通过对用户属性行为和与其他用户之间的交流行为进行度量,结合用户属性行为、与其他用户之间的交流行为以及受影响行为评估彼此之间的行为对于另外一种相关联行为产生的影响力,刻画了在社交环境下用户与用户之间交流行为所产生的影响,从而提高了评估方法的通用性,为相关需求部门提供更加精准的数据支持,为用户带来了更好的体验。
示例性设备
在介绍了本发明示例性实施方式的方法之后,接下来,参考图2对本发明示例性实施方式的、基于社交属性行为数据的行为间影响力评估装置进行说明。
如图2所示,其为本发明实施例提供的基于社交属性行为数据的行为间影响力评估装置的结构示意图,可以包括:
获取单元21,用于获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据;
确定单元22,用于针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;
行为评估单元23,用于根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
优选地,所述属性行为数据包括多个维度的属性行为数据。
所述确定单元22,包括:
降维子单元221,用于针对每一用户,利用预设算法将该用户对应的多个维度的属性行为数据降维为一维指标数据;
第一确定子单元222,用于根据该用户与其它用户的交流行为数据,确定该用户对应的特征向量中心度;
第二确定子单元223,用于根据为所述一维指标数据和所述特征向量中心度预先分配的权值,确定所述一维指标数据和所述特征向量中心度的加权结果为该用户对应的CWBS值。
优选地,所述行为评估单元23,具体用于利用如下公式对该用户受影响行为进行评估:其中:
表示该用户对应的受影响行为数据;
i表示该用户所属组的组标识;
k表示该用户对应的用户标识;
t表示所述指定时间段;
p表示该用户对应的属性行为数据;
DC表示与其它用户的交流行为对该用户受影响行为的影响;
SI表示环境对该用户受影响行为的影响,其中,环境对该用户受影响行为的影响根据所有用户对应的CWBS值确定;
TC表示三元闭包对该用户受影响行为的影响,其中,三元闭包对该用户受影响行为的影响根据该用户以及与该用户有过交流行为的其他用户拥有的平均共同好友数量确定;
Controls为影响该用户受影响行为的控制变量,所述控制变量根据该用户对应的属性行为数据以及其他用户对应的属性行为数据确定。
优选地,所述行为评估单元23,具体用于按照以下公式确定DC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β1,β2,j,β3,β4,j表示不同的回归系数。
优选地,所述行为评估单元23,具体用于,按照以下公式确定SI:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β5,β6,j,β7,β8,j表示不同的回归系数。
优选地,所述行为评估单元23,具体用于按照以下公式确定TC:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β9,β10,j,β11,β12,j表示不同的回归系数。
优选地,所述行为评估单元23,具体用于按照以下公式确定DC*SI:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β13,β14,j,β15,β16,j表示不同的回归系数。
优选地,所述行为评估单元23,具体用于按照以下公式确定DC*TC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β17,β18,j,β19,β20,j表示不同的回归系数。
优选地,所述行为评估单元,具体用于按照以下公式确定Controls:
其中:
Xsp(i),k为根据组i中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
Xgp(i),k为根据组i中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
Xsp(j),k为根据组j中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
Xgp(j),k为根据组j中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
Xk为根据用户k属性行为数据确定出的、每一属性行为所对应的指标值;
Ck为根据用户k受影响行为数据确定出的、用户k完成指定受影响行为所付出的努力值;
C'k为根据用户k受影响行为数据确定出的、用户k完成除指定受影响行为以外的其它受影响行为所付出的努力值;
Pj表示与用户k有过交流行为的所有用户中完成所述指定受影响行为的用户所占比例;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β21,β22,j,β23,β24,j,β25,β26,j,β27,β28,j,β29,β30,β31,β32表示不同的回归系数。
在介绍了本发明示例性实施方式的基于社交属性行为数据的行为间影响力评估方法和装置之后,接下来,介绍根据本发明的另一示例性实施方式的基于社交属性行为数据的行为间影响力评估装置。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“单元”或“系统”。
在一些可能的实施方式中,根据本发明的基于社交属性行为数据的行为间影响力评估装置可以包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的基于社交属性行为数据的行为间影响力评估方法中的各种步骤。例如,所述处理单元可以执行如图1a中所示的步骤S11,获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据,步骤S12,针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;以及步骤S13,根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
示例性程序产品
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的基于社交属性行为数据的行为间影响力评估方法中的步骤,例如,所述终端设备可以执行如图1a中所示的步骤S11、获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据,步骤S12、针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;以及步骤S13、根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图3所示,描述了根据本发明的实施方式的用于即时通信应用的程序产品30,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (10)
1.一种基于社交属性行为数据的行为间影响力评估方法,包括:
获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据;
针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;以及
根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
2.根据权利要求1所述的方法,所述属性行为数据包括多个维度的属性行为数据;以及
针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值,具体包括:
针对每一用户,利用预设算法将该用户对应的多个维度的属性行为数据降维为一维指标数据;以及
根据该用户与其它用户的交流行为数据,确定该用户对应的特征向量中心度;
根据为所述一维指标数据和所述特征向量中心度预先分配的权值,确定所述一维指标数据和所述特征向量中心度的加权结果为该用户对应的CWBS值。
3.根据权利要求1所述的方法,根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估,具体包括:
利用如下公式对该用户受影响行为进行评估:
其中:
表示该用户对应的受影响行为数据;
i表示该用户所属组的组标识;
k表示该用户对应的用户标识;
t表示所述指定时间段;
p表示该用户对应的属性行为数据;
DC表示与其它用户的交流行为对该用户受影响行为的影响;
SI表示环境对该用户受影响行为的影响,其中,环境对该用户受影响行为的影响根据所有用户对应的CWBS值确定;
TC表示三元闭包对该用户受影响行为的影响,其中,三元闭包对该用户受影响行为的影响根据该用户以及与该用户有过交流行为的其他用户拥有的平均共同好友数量确定;
Controls为影响该用户受影响行为的控制变量,所述控制变量根据该用户对应的属性行为数据以及其他用户对应的属性行为数据确定。
4.根据权利要求3所述的方法,按照以下公式确定DC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β1,β2,j,β3,β4,j表示不同的回归系数。
5.根据权利要求3所述的方法,按照以下公式确定SI:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β5,β6,j,β7,β8,j表示不同的回归系数。
6.根据权利要求3所述的方法,按照以下公式确定TC:
其中:
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β9,β10,j,β11,β12,j表示不同的回归系数。
7.根据权利要求3所述的方法,按照以下公式确定DC*SI:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户的CWBS差值的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β13,β14,j,β15,β16,j表示不同的回归系数。
8.根据权利要求3所述的方法,按照以下公式确定DC*TC:
其中:
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与本组内的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
表示组i的用户k与组j的核心人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内、与用户k有过交流的用户拥有的共同好友数量的平均值;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β17,β18,j,β19,β20,j表示不同的回归系数。
9.根据权利要求3所述的方法,按照以下公式确定Controls:
其中:
Xsp(i),k为根据组i中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,根据每一用户对应的CWBS值将组i的用户划分为核心人物分组和普通人物分组;
Xgp(i),k为根据组i中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
Xsp(j),k为根据组j中与用户k有过交流的核心人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值,其中,j表示除组i以外的其它组的组标识,根据每一用户对应的CWBS值将组j的用户划分为核心人物分组和普通人物分组;
Xgp(j),k为根据组j中与用户k有过交流的普通人物分组内的用户对应的属性行为数据确定出的、每一属性行为所对应指标值的平均值;
表示组i的用户k与本组内的核心人物分组内的用户的平均交流次数;
表示组i的用户k与本组内的普通人物分组内的用户的平均交流次数;
表示组i的用户k与组j的核心人物分组内的用户的平均交流次数;
表示组i的用户k与组j的普通人物分组内的用户的平均交流次数;
Xk为根据用户k属性行为数据确定出的、每一属性行为所对应的指标值;
Ck为根据用户k受影响行为数据确定出的、用户k完成指定受影响行为所付出的努力值;
C'k为根据用户k受影响行为数据确定出的、用户k完成除指定受影响行为以外的其它受影响行为所付出的努力值;
Pj表示与用户k有过交流行为的所有用户中完成所述指定受影响行为的用户所占比例;
ngr表示指定时间段内获取的行为数据中包含的组的总数量;
β21,β22,j,β23,β24,j,β25,β26,j,β27,β28,j,β29,β30,β31,β32表示不同的回归系数。
10.一种基于社交属性行为数据的行为间影响力评估装置,包括:
获取单元,用于获取每一用户在指定时间段内的行为数据,所述行为数据包括属性行为数据、与其它用户的交流行为数据和受影响行为数据;
确定单元,用于针对每一用户,根据所述属性行为数据和交流行为数据确定该用户对应的交流行为加权的行为核心度CWBS值;
行为评估单元,用于根据该用户归属的组以及该用户对应的属性行为数据、该用户与其它用户的交流行为数据、该用户对应的受影响行为数据和每一用户对应的CWBS值对该用户受影响行为进行评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611088240.7A CN106600432B (zh) | 2016-11-30 | 2016-11-30 | 基于社交属性行为数据的行为间影响力评估方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611088240.7A CN106600432B (zh) | 2016-11-30 | 2016-11-30 | 基于社交属性行为数据的行为间影响力评估方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106600432A true CN106600432A (zh) | 2017-04-26 |
CN106600432B CN106600432B (zh) | 2021-07-30 |
Family
ID=58594275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611088240.7A Active CN106600432B (zh) | 2016-11-30 | 2016-11-30 | 基于社交属性行为数据的行为间影响力评估方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106600432B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108121772A (zh) * | 2017-12-05 | 2018-06-05 | 浙江工业大学 | 一种基于工具变量法的社交网络用户好友影响力度量方法 |
CN110917628A (zh) * | 2018-09-20 | 2020-03-27 | 北京默契破冰科技有限公司 | 确定用户分组的方法、设备和计算机存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150213111A1 (en) * | 2014-01-27 | 2015-07-30 | Alibaba Group Holding Limited | Obtaining social relationship type of network subjects |
CN106540448A (zh) * | 2016-09-30 | 2017-03-29 | 浙江大学 | 一种游戏玩家之间交流对其消费行为影响的可视分析方法 |
-
2016
- 2016-11-30 CN CN201611088240.7A patent/CN106600432B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150213111A1 (en) * | 2014-01-27 | 2015-07-30 | Alibaba Group Holding Limited | Obtaining social relationship type of network subjects |
CN106540448A (zh) * | 2016-09-30 | 2017-03-29 | 浙江大学 | 一种游戏玩家之间交流对其消费行为影响的可视分析方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108121772A (zh) * | 2017-12-05 | 2018-06-05 | 浙江工业大学 | 一种基于工具变量法的社交网络用户好友影响力度量方法 |
CN108121772B (zh) * | 2017-12-05 | 2021-02-26 | 浙江工业大学 | 一种基于工具变量法的社交网络用户好友影响力度量方法 |
CN110917628A (zh) * | 2018-09-20 | 2020-03-27 | 北京默契破冰科技有限公司 | 确定用户分组的方法、设备和计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106600432B (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104436656B (zh) | 游戏应用中用户的匹配方法和装置 | |
Zha et al. | Rlcard: A toolkit for reinforcement learning in card games | |
Drachen et al. | Game analytics–the basics | |
CN104778173B (zh) | 目标用户确定方法、装置及设备 | |
Lee et al. | Using cognitive models to combine probability estimates | |
CN109126140A (zh) | 游戏难度评估方法、装置和系统 | |
CN109299420A (zh) | 社交媒体账号处理方法、装置、设备及可读存储介质 | |
CN108579095A (zh) | 游戏中的社交关系推荐方法、装置和计算机可读存储介质 | |
WO2019085823A1 (zh) | 游戏信息的确定方法和装置、存储介质、电子装置 | |
CN108304853A (zh) | 游戏相关度的获取方法、装置、存储介质和电子装置 | |
CN106600432A (zh) | 基于社交属性行为数据的行为间影响力评估方法和装置 | |
Pfau et al. | Player-driven game analytics: The case of guild wars 2 | |
Wang et al. | A method for evaluating elicitation schemes for probabilistic models | |
Sabahat et al. | A size estimation model for board-based desktop games | |
CN109451332A (zh) | 一种用户属性标记方法、装置、计算机设备及介质 | |
Sabahat et al. | Size estimation of open source board-based software games | |
Son et al. | Applying the noncooperative game model for compensation concept in contractor selection process for large-scale projects | |
Kao et al. | Incentive learning in monte carlo tree search | |
Hanna et al. | Towards quantifying player's involvement in 3D games based-on player types | |
Stankevicius et al. | A factor-based exploration of player's continuation desire in free-to-play mobile games | |
Demeter et al. | Who’s on First?: Probing the Learning and Representation Capabilities of Language Models on Deterministic Closed Domains | |
Félix et al. | Opponent Modelling in Texas Hold'em Poker as the Key for Success | |
Wang et al. | Rating logic puzzle difficulty automatically in a human perspective | |
Powell et al. | Combinatorial prediction markets: An experimental study | |
Martins | Aprendizagem máquina aplicada ao contexto do Poker |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |