CN108470284B - 数据分析方法和装置 - Google Patents

数据分析方法和装置 Download PDF

Info

Publication number
CN108470284B
CN108470284B CN201710099969.2A CN201710099969A CN108470284B CN 108470284 B CN108470284 B CN 108470284B CN 201710099969 A CN201710099969 A CN 201710099969A CN 108470284 B CN108470284 B CN 108470284B
Authority
CN
China
Prior art keywords
user
group
users
activity
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710099969.2A
Other languages
English (en)
Other versions
CN108470284A (zh
Inventor
林佳明
王艳茹
郭少冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710099969.2A priority Critical patent/CN108470284B/zh
Publication of CN108470284A publication Critical patent/CN108470284A/zh
Application granted granted Critical
Publication of CN108470284B publication Critical patent/CN108470284B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种数据分析方法和装置,属于数据处理技术领域。所述方法包括:获取参与活动传播的用户对应的用户关系链,用户关系链包括发送方用户和接收方用户,发送方用户将活动的内容传播给接收方用户;根据用户关系链将参与活动传播的用户构建为至少一个用户群;其中,同一个用户群中的一个用户与至少一个其他用户之间存在用户关系链,一个用户群中的任意一个用户与另一个用户群中的任意一个用户之间不存在用户关系链;基于用户群,对参与活动传播的用户进行分析。本发明通过对参与运营活动传播的用户进行分析,相应的分析结果对于后续需要传播的其它运营活动同样具备参考价值,为其它运营活动的传播提供帮助。

Description

数据分析方法和装置
技术领域
本发明实施例涉及数据处理技术领域,特别涉及一种数据分析方法和装置。
背景技术
一些厂家会通过互联网向用户传播运营活动,利用运营活动来推广他们的产品或服务,而运营活动的传播效果直接影响到产品或服务的推广效果。因此,通过采集运营活动在传播过程中涉及的一些相关数据,并对这些相关数据进行分析,从而可以根据分析结果制定一些有助于提升运营活动的传播效果的策略。
在相关技术中,所获取的运营活动的相关数据是运营活动的各个活动步骤的参与用户数量,由于一个运营活动由多个活动步骤组成,通过对各个活动步骤的参与用户数量进行分析,可以根据分析结果确定该运营活动中有待优化的活动步骤。进一步地,通过对该运营活动中有待优化的活动步骤进行优化,以提升该运营活动的传播效果。以通过网页形式进行传播的运营活动为例,其包括打开活动页面、登录帐号、执行活动内容、分享活动页面等多个活动步骤。通过获取运营活动的各个活动步骤的参与用户数量,对各个活动步骤的参与用户数量进行分析,确定前后步骤间的用户转化率,进而根据前后步骤间的用户转化率确定该运营活动中有待优化的活动步骤。
上述相关技术中,对运营活动的数据分析方法仅局限于对运营活动的各个活动步骤的数据进行分析,相应的分析结果对于后续需要传播的其它运营活动并不具参考价值,对其它运营活动的传播也无法起到帮助作用。
发明内容
为了解决现有技术中针对运营活动的分析方法,仅局限于对运营活动的各个活动步骤的数据进行分析,相应的分析结果对于后续需要传播的其它运营活动并不具参考价值的问题,本发明实施例提供了一种数据分析方法和装置。所述技术方案如下:
第一方面,提供了一种数据分析方法,所述方法包括:
获取参与活动传播的用户对应的用户关系链,所述用户关系链包括发送方用户和接收方用户,所述发送方用户将所述活动的内容传播给所述接收方用户;
根据所述用户关系链将所述参与活动传播的用户构建为至少一个用户群;其中,同一个用户群中的一个用户与至少一个其他用户之间存在所述用户关系链,一个用户群中的任意一个用户与另一个用户群中的任意一个用户之间不存在所述用户关系链;
基于所述用户群,对所述参与活动传播的用户进行分析。
第二方面,提供了一种数据分析装置,所述装置包括:
获取模块,用于获取参与活动传播的用户对应的用户关系链,所述用户关系链包括发送方用户和接收方用户,所述发送方用户将所述活动的内容传播给所述接收方用户;
构建模块,用于根据所述用户关系链将所述参与活动传播的用户构建为至少一个用户群;其中,同一个用户群中的一个用户与至少一个其他用户之间存在所述用户关系链,一个用户群中的任意一个用户与另一个用户群中的任意一个用户之间不存在所述用户关系链;
分析模块,用于基于所述用户群,对所述参与活动传播的用户进行分析。
本发明实施例提供的技术方案带来的有益效果包括:
由于考虑到了用户对运营活动的传播的影响,通过对参与运营活动的用户进行分析,相应的分析结果对于后续需要传播的其它运营活动同样具备参考价值,为其它运营活动的传播提供帮助,从而扩展了数据分析的方式,且分析结果的利用率更高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的数据分析方法的流程图;
图2是示例性示出的一种构建用户群的示意图;
图3是示例性示出的几种不同规模的用户群的示意图;
图4是示例性示出的一种用户群的示意图;
图5是示例性示出的另一种用户群的示意图;
图6是示例性示出的一种跨地域传播效果的示意图;
图7是本发明一个实施例提供的数据处理装置的框图;
图8是本发明一个实施例提供的服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在相关技术中,仅局限于对运营活动的各个活动步骤进行分析,以确定运营活动本身的活动逻辑设计的合理性,通过对运营活动中不够合理的活动步骤进行优化,以提升该运营活动的传播效果。然而,一个运营活动能否广泛传播,除了与运营活动本身的活动逻辑设计的合理性有关之外,还与参与运营活动传播的用户有关。在本发明实施例中,通过对参与运营活动传播的用户进行分析,得到的分析结果为参与运营活动传播的用户的特征,上述分析结果对于后续需要传播的其它运营活动同样具备参考价值,为其它运营活动的传播提供帮助。下面将基于上面所述的本发明实施例涉及的共性方面,对本发明实施例进行进一步详细说明。
本发明实施例提供的方法,各步骤的执行主体可以是服务器。例如,该服务器可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
在本发明实施例中,所涉及的活动是指能够在线上或者线下进行传播的运营活动。例如,该运营活动可以是以网页形式在线上通过即时通信应用或社交应用进行传播的运营活动,称为网页运营活动。
请参考图1,其示出了本发明一个实施例提供的数据分析方法的流程图。该方法可以包括如下几个步骤:
步骤101,获取参与活动传播的用户对应的用户关系链。
活动内容的每一次传播过程均由发送方用户将活动的内容传播给接收方用户。服务器获取参与活动传播的用户对应的至少一个用户关系链,在通常情况下,服务器获取的用户关系链的数量为多个,以提高后续得到的分析结果的准确性。
每一个用户关系链包括发送方用户和接收方用户,发送方用户将活动的内容传播给接收方用户。用户关系链可按照预设格式表示,例如该预设格式可以为“发送方用户:接收方用户”,表示活动的内容通过发送方用户传播给接收方用户。例如,用户A将活动的内容传播给用户B,则相应的用户关系链包括用户A和用户B。服务器存储的用户关系链为“用户A:用户B”。
在一个示例中,当运营活动为上文介绍的网页运营活动时,通过活动页面(例如活动页面中运行的脚本)获取发送方用户的标识和接收方用户的标识,并按照预设格式将上述发送方用户的标识和接收方用户的标识生成一个用户关系链,将该用户关系链发送给服务器。活动页面由发送方用户分享给接收方用户,在接收方用户打开活动页面时,通过活动页面(例如活动页面中运行的脚本)获取发送方用户的标识和接收方用户的标识,生成用户关系链,并向服务器上报该用户关系链。其中,用户的标识可以是用户在即时通信应用或社交应用中的用户帐号。
需要说明的一点是,对于某一个用户来说,与其相关的用户关系链的数量为至少一个。该至少一个用户关系链包括:至少一个第一用户关系链和/或至少一个第二用户关系链;其中,第一用户关系链是指该用户作为发送方用户的用户关系链,第二用户关系链是指该用户作为接收方用户的用户关系链。
步骤102,根据用户关系链将参与活动传播的用户构建为至少一个用户群。
同一个用户群中的一个用户与至少一个其他用户之间存在用户关系链。以用户群A为例,对于用户群A中的任意一个用户a1,该用户a1与用户群A中的至少一个其他用户a2之间存在用户关系链。例如,该用户a1向用户群A中的用户a2发送活动的内容,和/或,该用户a1从用户群A中的用户a2接收活动的内容,因此,该用户a1与用户群A中的用户a2之间存在用户关系链。
一个用户群中的任意一个用户与另一个用户群中的任意一个用户之间不存在用户关系链。例如,用户群A中的任意一个用户既不会向用户群B中的任意一个用户发送活动的内容,也不会从用户群B中的任意一个用户接收活动的内容。
示例性地,假设服务器获取到的用户关系链如下表-1所示:
序号 用户关系链
1 用户A:用户B
2 用户A:用户C
3 用户A:用户D
4 用户B:用户E
5 用户F:用户G
6 用户F:用户H
7 用户H:用户I
表-1
结合参考图2,服务器根据表-1所示的用户关系链构建2个用户群,图2(a)部分示出了第一个用户群,图2(b)部分示出了第二个用户群。
在本发明实施例中,对构建用户群所采用的方式不作限定。在一种可能的实现方式中,服务器根据用户关系链将参与活动传播的用户构建为至少一个图结构,每一个图结构对应于一个用户群。采用构图的方式将用户关系链转换为用户群,能够直观地体现用户群,且便于后续对用户群进行分析。
可选地,采用构图的方式将用户关系链转换为用户群的具体流程如下:服务器从获取的所有用户关系链中选取一个用户关系链;判断剩余未被选取的用户关系链中是否存在符合预设条件的用户关系链,该符合预设条件的用户关系链是指存在与选取的任意一个用户关系链具有相同用户的用户关系链;如果剩余未被选取的用户关系链中存在符合预设条件的用户关系链,则从剩余未被选取的用户关系链中选取上述符合预设条件的用户关系链,并将选取的所有用户关系链按照收发关系确定用户之间的连接关系,形成图结构,之后再次从上述判断剩余未被选取的用户关系链中是否存在符合预设条件的用户关系链的步骤开始执行;如果剩余未被选取的用户关系链中不存在符合预设条件的用户关系链,则结束本轮构图。在一轮构图结束之后,服务器检测是否还有剩余未被选取的用户关系链;如果有,则采用上述流程进行下一轮构图;如果没有,则结束整个构图流程。
可选地,上述步骤101之后,还包括如下步骤:服务器将不符合预设规范的用户关系链进行清理,得到符合预设规范的用户关系链;根据符合预设规范的用户关系链构建为至少一个用户群。实际应用中,由于服务器获取到的所有用户关系链中,可能存在一些不符合预设规范的用户关系链,例如存在表达格式不符合预设格式、数据缺损等问题的用户关系链,服务器在构建用户群之前首先进行数据清理,保留符合预设规范的用户关系链,从而确保后续构建的用户群的准确性。
步骤103,基于用户群,对参与活动传播的用户进行分析。
服务器基于用户群,对参与活动传播的用户进行分析得到用户特征。用户特征用于指示参与活动传播的用户的特征。具体实现时,用户特征包括但不限于用户个人特征和/或用户整体特征。
用户个人特征用于指示参与活动传播的单个用户的特征。例如,某一用户的用户个人特征可以是该用户是否为核心用户、该用户是否为非法用户,等等。其中,有关核心用户和非法用户的介绍说明可参见下文。
用户整体特征用于指示参与活动传播的多个用户的特征。例如,某一用户群对应的用户整体特征是指该用户群中的全部或部分用户的整体特征,比如该用户群中的全部用户呈现男多女少的特征、该用户群中的部分用户呈现年龄大多在20至30岁的特征,等等。
在本发明实施例中,通过对参与运营活动传播的用户进行分析,得到的分析结果为参与运营活动传播的用户的特征,上述分析结果对于后续需要传播的其它运营活动同样具备参考价值,为其它运营活动的传播提供帮助。
可选地,步骤103包括如下两个子步骤:
步骤103a,获取每一个用户对应的群组特征;
用户对应的群组特征是指用户所属用户群的特征以及用户在所属用户群中的特征。用户对应的群组特征包括但不限于以下至少一种:用户所属用户群的人数、用户所属用户群的层级数、用户在所属用户群中的层级、用户对应的内容传播次数、用户的下属层级数。其中,用户对应的内容传播次数是指用户将活动的内容发送至的所有用户的数量,例如某一用户向10个用户发送了活动的内容,则该用户对应的内容传播次数即为10。用户的下属层级数是指用户在所属用户群中的层级以下所包含的层级数量。
以图2(a)部分所示的第一个用户群为例,用户A所属用户群的人数为5、用户A所属用户群的层级数为3、用户A在所属用户群中的层级为1、用户A对应的内容传播次数为3、用户A的下属层级数为2。以图2(b)部分所示的第二个用户群为例,用户H所属用户群的人数为4、用户H所属用户群的层级数为3、用户H在所属用户群中的层级为2、用户H对应的内容传播次数为1、用户H的下属层级数为1。
可选地,当用户群采用构图的方式构建时,服务器采用广度优先算法遍历各个用户群,获取每一个用户群中的每一个用户对应的群组特征。
结合参考图3,其示出了几种不同规模的用户群的示意图。如图3(a)部分所示,其示出了若干个小规模的用户群;如图3(b)部分所示,其示出了若干个中规模的用户群;如图3(c)部分所示,其示出了一个大规模的用户群。图3中,每一个小圆点表示一个用户,两个小圆点之间如果存在连线,则表示这两个用户之间存在用户关系链。用户群的规模按照用户群的人数进行划分。用户群的人数越多,用户群的规模则越大。
步骤103b,根据各个用户对应的群组特征,对参与活动传播的用户进行分析。
服务器根据各个用户对应的群组特征,对参与活动传播的用户进行分析得到用户特征。
在一个示例中,用户特征为用户个人特征,该用户个人特征为用户是否为核心用户。上述步骤103b可以由如下步骤替换实现:将用户特征符合第一预设条件的用户确定为核心用户。其中,第一预设条件包括:用户所属的用户群人数大于第一阈值、用户对应的内容传播次数大于第二阈值且用户的下属层级数大于第三阈值。对于每一个用户,服务器检测该用户对应的群组特征是否符合第一预设条件;若该用户对应的群组特征符合第一预设条件,则确定该用户的用户个人特征为核心用户;若该用户对应的群组特征不符合第一预设条件,则确定该用户的用户个人特征不是核心用户。
核心用户是指对于活动内容的传播起到重要助推作用的用户。核心用户向大量用户传播活动的内容,且接收到核心用户所传播的内容的其他用户,会积极主动地向其他用户进一步传播活动的内容。因此,核心用户所属的用户群的规模较大、对应的内容传播次数较多且下属层级数较多。
核心用户也可称为关键意见领袖。在营销学中,关键意见领袖是指拥有更多、更准确的产品信息,且为相关群体所接受或信任,并对该群体的购买行为有较大影响力的人。因此,在活动传播过程中的核心用户可称为关键意见领袖。
在实际应用中,服务器构建核心用户模型,核心用户模型中定义上述第一预设条件。在设计核心用户模型时,各个阈值(例如上述第一阈值、第二阈值和第三阈值)的取值可以是根据历史经验所设定的经验值。结合参考图4,对于图4所示的用户群40,位于该用户群40的第一层级的用户可确定为核心用户。
在本发明实施例中,通过对参与活动传播的用户进行分析,确定活动传播过程中的核心用户,积累核心用户数据库,为后续需要传播的其它运营活动提供帮助。例如,对于后续需要传播的某一运营活动,将该活动的内容首先发送给核心用户数据库中积累的各个核心用户,借助于这些核心用户的广泛影响力,能够推动活动更加广泛地传播。
在另一个示例中,用户特征为用户个人特征,该用户个人特征为用户是否为非法用户。上述步骤103b可以由如下步骤替换实现:将用户特征符合第二预设条件的用户确定为非法用户。其中,第二预设条件包括:用户所属的用户群人数大于第四阈值、用户对应的内容传播次数大于第五阈值且用户的下属层级数小于第六阈值。对于每一个用户,服务器检测该用户对应的群组特征是否符合第二预设条件;若该用户对应的群组特征符合第二预设条件,则确定该用户的用户个人特征为非法用户;若该用户对应的群组特征不符合第二预设条件,则确定该用户的用户个人特征不是非法用户。
非法用户是指虽然向大量用户传播活动的内容,但并不会对活动内容的传播起到重要助推作用的用户。例如,活动发起方为推动活动广泛传播,会给内容传播次数较多的用户提供奖励,某些用户为获取奖励,恶意地向大量用户传播活动的内容,这些用户应当视为非法用户。非法用户与核心用户存在如下相似之处:所属的用户群的规模较大且对应的内容传播次数较多;但是,非法用户的下属层级数较少。由于非法用户并不受其他用户所信任,因此其他用户在接收到非法用户所传播的内容之后,很少会向其他用户进一步传播活动的内容。
在实际应用中,服务器构建非法用户模型,非法用户模型中定义上述第二预设条件。在设计非法用户模型时,各个阈值(例如上述第四阈值、第五阈值和第六阈值)的取值可以是根据历史经验所设定的经验值。结合参考图5,对于图5所示的用户群50,位于该用户群50的第一层级的用户(也即图中心的圆点51所表示的用户)可识别为非法用户。
在本发明实施例中,通过对参与活动传播的用户进行分析,确定活动传播过程中的非法用户,积累非法用户数据库,为后续需要传播的其它运营活动提供帮助。例如,不向这些非法用户提供奖励,维护活动发起方和参与活动的其他用户的利益,且确保活动更加健康有序地传播。
在又一个示例中,服务器基于用户群对参与活动传播的用户进行分析,得到用户整体特征。上述步骤103b可以由如下步骤替换实现:对于每一个用户群,根据用户群中的各个用户对应的群组特征和个人信息,确定用户群对应的用户整体特征。其中,用户的个人信息包括但不限于用户的年龄、性别、地区、职业、爱好等信息。
用户群对应的用户整体特征是指用户群中的全部或部分用户的整体特征。用户群对应的用户整体特征包括但不限于以下至少一种:用户群对应的用户画像、用户群中每一个层级对应的用户画像、每一种内容传播次数对应的用户画像、每一种下属层级数对应的用户画像。用户画像用于描述一类用户的整体特征。用户群对应的用户画像是指用户群中包含的所有用户的整体特征,例如男性用户偏多、90后用户偏多、广东地区用户偏多等等。用户群中每一个层级对应的用户画像是指每一个层级中包含的所有用户的整体特征,例如某一个用户群的某一个层级中女性用户偏多、学生用户偏多等等。每一种内容传播次数对应的用户画像是指用户群中内容传播次数相同的所有用户的整体特征。每一种下属层级数对应的用户画像是指用户群中下属层级数相同的所有用户的整体特征。
可选地,服务器选取包含人数大于预设门限值的用户群(也即规模较大的用户群),根据该用户群中的各个用户对应的群组特征和个人信息,确定该用户群对应的用户整体特征,便能够了解到活动在何种特征的用户群中能够广泛传播。其中,预设门限值是根据实际需求预先设定的经验值。
在本发明实施例中,通过获取上述各种用户画像,据此能够了解到对活动感兴趣的用户群体的特征、对活动内容的传播起到主要作用的用户群体的特征等信息,对于后续需要传播的相类似的其它运营活动,参考上述信息能够提高活动的传播效果。
可选地,为了减少服务器的计算量,服务器在执行上述步骤102之后,可不必对每一个用户群进行分析。服务器选取包含人数大于预设门限值的用户群(也即规模较大的用户群),基于上述选取的用户群,对参与活动传播的用户进行分析,得到用户个人特征和/或用户整体特征。通过上述方式,同样能够获得有效的分析结果,而且能够减少服务器的计算量。
可选地,服务器对参与活动传播的用户进行分析之后,将分析结果进行展示。在本发明实施例中,对展示分析结果所采用的方式或工具不作限定,其可以根据实际需求进行选择。例如,采用表格、图表、图形等不同形式将分析结果进行展示。结合参考图6,其示例性示出了一种将参与活动传播的用户按照地域进行划分,所形成的跨地域传播效果的示意图。
综上所述,本发明实施例提供的方法,解决了现有技术中针对运营活动的分析方法,仅局限于对运营活动的各个活动步骤进行分析,相应的分析结果对于后续需要传播的其它运营活动并不具参考价值的问题;由于考虑到了用户对运营活动的传播的影响,通过对参与运营活动传播的用户进行分析,相应的分析结果对于后续需要传播的其它运营活动同样具备参考价值,为其它运营活动的传播提供帮助,从而扩展了数据分析的方式,且分析结果的利用率更高。
另外,通过对参与活动传播的用户进行分析,确定活动传播过程中的核心用户,借助于这些核心用户的广泛影响力,能够推动后续其它运营活动更加广泛地传播。还通过对参与活动传播的用户进行分析,确定活动传播过程中的非法用户,有助于维护活动发起方和参与活动的其他用户的利益,且确保活动更加健康有序地传播。
另外,还通过获取用户群对应的用户整体特征,据此能够了解到对活动感兴趣的用户群体的特征、对活动内容的传播起到主要作用的用户群体的特征等信息,对于后续需要传播的相类似的其它运营活动,参考上述信息能够提高活动的传播效果。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参考图7,其示出了本发明一个实施例提供的数据处理装置的框图。该装置具有实现上述方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:获取模块710、构建模块720和分析模块730。
获取模块710,用于执行上述步骤101。
构建模块720,用于执行上述步骤102。
分析模块730,用于执行上述步骤103。
可选地,分析模块730,包括:获取单元和分析单元。
获取单元,用于执行上述步骤103a。
分析单元,用于执行上述步骤103b。
在一个示例中,分析单元用于将用户对应的群组特征符合第一预设条件的用户确定为核心用户。其中,第一预设条件包括:用户所属的用户群人数大于第一阈值、用户对应的内容传播次数大于第二阈值且用户的下属层级数大于第三阈值。
在另一个示例中,分析单元用于将用户对应的群组特征符合第二预设条件的用户确定为非法用户。其中,第二预设条件包括:用户所属的用户群人数大于第四阈值、用户对应的内容传播次数大于第五阈值且用户的下属层级数小于第六阈值。
在又一个示例中,分析单元用于对于每一个用户群,根据该用户群中的各个用户对应的群组特征和个人信息,确定用户群对应的用户整体特征。其中,用户群对应的用户整体特征包括:用户群对应的用户画像、用户群中每一个层级对应的用户画像、每一种内容传播次数对应的用户画像、每一种下属层级数对应的用户画像中的至少一种。
可选地,构建模块用于根据用户关系链将参与活动传播的用户构建为至少一个图结构,每一个图结构对应于一个用户群。
相关细节可参考上述方法实施例。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图8,其示出了本发明一个实施例提供的服务器的结构示意图。该服务器用于实施上述实施例中提供的数据分析方法。具体来讲:
所述服务器800包括中央处理单元(CPU)801、包括随机存取存储器(RAM)802和只读存储器(ROM)803的系统存储器804,以及连接系统存储器804和中央处理单元801的系统总线805。所述服务器800还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)806,和用于存储操作系统813、应用程序814和其他程序模块815的大容量存储设备807。
所述基本输入/输出系统806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中所述显示器808和输入设备809都通过连接到系统总线805的输入输出控制器810连接到中央处理单元801。所述基本输入/输出系统806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备807通过连接到系统总线805的大容量存储控制器(未示出)连接到中央处理单元801。所述大容量存储设备807及其相关联的计算机可读介质为服务器800提供非易失性存储。也就是说,所述大容量存储设备807可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器804和大容量存储设备807可以统称为存储器。
根据本发明的各种实施例,所述服务器800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器800可以通过连接在所述系统总线805上的网络接口单元811连接到网络812,或者说,也可以使用网络接口单元811来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述数据分析方法的指令。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由服务器的处理器执行以完成上述方法实施例中的各个步骤。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的示例性实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种数据分析方法,其特征在于,所述方法包括:
获取参与活动传播的用户对应的用户关系链,所述用户关系链包括发送方用户和接收方用户,所述发送方用户将所述活动的内容传播给所述接收方用户;
从获取的所述用户关系链中,清理掉不符合预设规范的用户关系链,得到符合所述预设规范的用户关系链用于构建用户群;
根据所述用户关系链将所述参与活动传播的用户构建为至少一个图结构,每一个图结构对应于一个用户群;其中,采用构图的方式将所述用户关系链转换为所述用户群的流程包括:从所述用户关系链中选取一个用户关系链,从剩余未被选取的用户关系链中选取符合预设条件的用户关系链并形成图结构,直至所述剩余未被选取的用户关系链中不存在符合预设条件的用户关系链时,结束构图流程,所述符合预设条件的用户关系链是指存在与选取的任意一个用户关系链具有相同用户的用户关系链;同一个用户群中的一个用户与至少一个其他用户之间存在所述用户关系链,一个用户群中的每一个用户与另一个用户群中的每一个用户之间均不存在所述用户关系链;
采用广度优先算法遍历各个用户群,获取每一个用户对应的群组特征;其中,所述用户对应的群组特征是指用户所属用户群的特征以及用户在所属用户群中的特征;所述用户对应的群组特征包括以下至少一种:所述用户所属用户群的人数、所述用户所属用户群的层级数、所述用户在所属用户群中的层级、所述用户对应的内容传播次数、所述用户的下属层级数;
选取包含人数大于预设门限值的用户群,对于选取的每一个用户群,根据所述用户群中的各个用户对应的群组特征和个人信息,确定所述用户群对应的用户整体特征;其中,所述用户对应的用户整体特征是指所述用户群中的全部或部分用户的整体特征,包括以下至少一种:所述用户群对应的用户画像、所述用户群中每一个层级对应的用户画像、每一种内容传播次数对应的用户画像、每一种下属层级数对应的用户画像;
对于每一个用户,检测到所述用户对应的群组特征符合第一预设条件时,确定所述用户为核心用户,其中,所述第一预设条件包括:所述用户所属的用户群人数大于第一阈值、所述用户对应的内容传播次数大于第二阈值且所述用户的下属层级数大于第三阈值;
对于每一个用户,检测到所述用户对应的群组特征符合第二预设条件时,确定所述用户为非法用户,其中,所述第二预设条件包括:所述用户所属的用户群人数大于第四阈值、所述用户对应的内容传播次数大于第五阈值且所述用户的下属层级数小于第六阈值。
2.一种数据分析装置,其特征在于,所述装置包括:
获取模块,用于获取参与活动传播的用户对应的用户关系链,所述用户关系链包括发送方用户和接收方用户,所述发送方用户将所述活动的内容传播给所述接收方用户;从获取的所述用户关系链中,清理掉不符合预设规范的用户关系链,得到符合所述预设规范的用户关系链用于构建用户群;
构建模块,用于根据所述用户关系链将所述参与活动传播的用户构建为至少一个图结构,每一个图结构对应于一个用户群;其中,采用构图的方式将所述用户关系链转换为所述用户群的流程包括:从所述用户关系链中选取一个用户关系链,从剩余未被选取的用户关系链中选取符合预设条件的用户关系链并形成图结构,直至所述剩余未被选取的用户关系链中不存在符合预设条件的用户关系链时,结束构图流程,所述符合预设条件的用户关系链是指存在与选取的任意一个用户关系链具有相同用户的用户关系链;同一个用户群中的一个用户与至少一个其他用户之间存在所述用户关系链,一个用户群中的每一个用户与另一个用户群中的每一个用户之间均不存在所述用户关系链;
分析模块,用于:
采用广度优先算法遍历各个用户群,用于获取每一个用户对应的群组特征;其中,所述用户对应的群组特征是指用户所属用户群的特征以及用户在所属用户群中的特征;所述用户对应的群组特征包括以下至少一种:所述用户所属用户群的人数、所述用户所属用户群的层级数、所述用户在所属用户群中的层级、所述用户对应的内容传播次数、所述用户的下属层级数;选取包含人数大于预设门限值的用户群,对于选取的每一个用户群,根据所述用户群中的各个用户对应的群组特征和个人信息,确定所述用户群对应的用户整体特征;其中,所述用户对应的用户整体特征是指所述用户群中的全部或部分用户的整体特征,包括以下至少一种:所述用户群对应的用户画像、所述用户群中每一个层级对应的用户画像、每一种内容传播次数对应的用户画像、每一种下属层级数对应的用户画像;
对于每一个用户,检测到所述用户对应的群组特征符合第一预设条件时,确定所述用户为核心用户,其中,所述第一预设条件包括:所述用户所属的用户群人数大于第一阈值、所述用户对应的内容传播次数大于第二阈值且所述用户的下属层级数大于第三阈值;
对于每一个用户,检测到所述用户对应的群组特征符合第二预设条件时,确定所述用户为非法用户,其中,所述第二预设条件包括:所述用户所属的用户群人数大于第四阈值、所述用户对应的内容传播次数大于第五阈值且所述用户的下属层级数小于第六阈值。
3.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序,以实现如权利要求1所述的方法。
4.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序用于被处理器执行,以实现如权利要求1所述的方法。
CN201710099969.2A 2017-02-23 2017-02-23 数据分析方法和装置 Active CN108470284B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710099969.2A CN108470284B (zh) 2017-02-23 2017-02-23 数据分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710099969.2A CN108470284B (zh) 2017-02-23 2017-02-23 数据分析方法和装置

Publications (2)

Publication Number Publication Date
CN108470284A CN108470284A (zh) 2018-08-31
CN108470284B true CN108470284B (zh) 2023-04-07

Family

ID=63266713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710099969.2A Active CN108470284B (zh) 2017-02-23 2017-02-23 数据分析方法和装置

Country Status (1)

Country Link
CN (1) CN108470284B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612527A (zh) * 2020-04-28 2020-09-01 杭州沃朴物联科技有限公司 裂变红包发放方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409730A (zh) * 2008-11-22 2009-04-15 梁福鹏 一种基于需求关系而实现的随机性网络通讯方法
CN102664744A (zh) * 2012-03-19 2012-09-12 西安电子科技大学 网络消息通信中群发推荐的方法
CN103136303A (zh) * 2011-11-24 2013-06-05 北京千橡网景科技发展有限公司 在社交网络服务网站中划分用户群组的方法和设备
CN103914493A (zh) * 2013-01-09 2014-07-09 北大方正集团有限公司 一种微博用户群体结构发现分析方法及系统
CN104144106A (zh) * 2013-09-26 2014-11-12 腾讯科技(深圳)有限公司 一种消息转发方法、装置及系统
CN106204297A (zh) * 2016-07-11 2016-12-07 深圳市中北明夷科技有限公司 一种封闭社交传播意见领袖的识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999507B (zh) * 2011-09-13 2017-04-05 腾讯科技(北京)有限公司 网络微博名人信息的推荐处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409730A (zh) * 2008-11-22 2009-04-15 梁福鹏 一种基于需求关系而实现的随机性网络通讯方法
CN103136303A (zh) * 2011-11-24 2013-06-05 北京千橡网景科技发展有限公司 在社交网络服务网站中划分用户群组的方法和设备
CN102664744A (zh) * 2012-03-19 2012-09-12 西安电子科技大学 网络消息通信中群发推荐的方法
CN103914493A (zh) * 2013-01-09 2014-07-09 北大方正集团有限公司 一种微博用户群体结构发现分析方法及系统
CN104144106A (zh) * 2013-09-26 2014-11-12 腾讯科技(深圳)有限公司 一种消息转发方法、装置及系统
CN106204297A (zh) * 2016-07-11 2016-12-07 深圳市中北明夷科技有限公司 一种封闭社交传播意见领袖的识别方法及装置

Also Published As

Publication number Publication date
CN108470284A (zh) 2018-08-31

Similar Documents

Publication Publication Date Title
US10614077B2 (en) Computer system for automated assessment at scale of topic-specific social media impact
US11521221B2 (en) Predictive modeling with entity representations computed from neural network models simultaneously trained on multiple tasks
Acemoglu et al. Dynamics of information exchange in endogenous social networks
US11200592B2 (en) Simulation-based evaluation of a marketing channel attribution model
US10535041B2 (en) System and method of predicting community member responsiveness
WO2018126953A1 (zh) 种子人群扩散方法、装置、信息投放系统以及存储介质
US20160098735A1 (en) Marketing channel attribution
CN111489026A (zh) 一种排队时间预估方法、系统及装置
CN102567477A (zh) 网站价值评估方法及装置
CN109189935B (zh) 一种基于知识图谱的app传播分析方法及系统
CN102281290A (zh) 一种PaaS云平台的仿真系统及方法
CN110991789B (zh) 置信区间的确定方法和装置、存储介质及电子装置
CN104008182A (zh) 社交网络交流影响力的测定方法及系统
Hu et al. Identifying top persuaders in mixed trust networks for electronic marketing based on word-of-mouth
CN113470836A (zh) 一种传染病趋势预测方法、系统、装置及存储介质
CN114065864A (zh) 联邦学习方法、联邦学习装置、电子设备以及存储介质
CN112182399A (zh) 一种联邦学习的多方安全计算方法及装置
CN108470284B (zh) 数据分析方法和装置
CN116384502B (zh) 联邦学习中参与方价值贡献计算方法、装置、设备及介质
JP2023025147A (ja) ラベル推奨モデルのトレーニング方法及び装置、ラベル取得方法及び装置
CN105408928A (zh) 用于确定装置的广告类别的相关性的方法和系统
Koyama Multivariate epidemic count time series model
CN107451255B (zh) 一种基于关注关系的用户兴趣处理方法和装置
Rehman et al. Investigating Information Diffusion Potential of Social Media Networks for Effective Community Engagement
JP6887648B1 (ja) ウェブページ処理装置、ウェブページ処理方法、およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant