CN107220745B - 一种意图行为数据的识别方法、系统及设备 - Google Patents
一种意图行为数据的识别方法、系统及设备 Download PDFInfo
- Publication number
- CN107220745B CN107220745B CN201710273565.0A CN201710273565A CN107220745B CN 107220745 B CN107220745 B CN 107220745B CN 201710273565 A CN201710273565 A CN 201710273565A CN 107220745 B CN107220745 B CN 107220745B
- Authority
- CN
- China
- Prior art keywords
- data
- behavior
- behavior data
- same
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种意图行为数据的识别方法、系统及设备,方法包括:采集行为数据,形成行为基础信息库;提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据。本发明能够有效的为产品优化提供依据,很好的解决了在渠道推广优化过程中的效果跟踪统计问题,让每一个推广计划目的性更佳明确。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种意图行为数据的识别方法、系统及设备。
背景技术
企业自身的产品会随着互联网、移动互联网等网络技术从萌芽期、成长期、再到成熟期的发展的不同阶段产生的不同需求,企业根据产生的不同需求,对产品不断增多和完善,在完善的过程中,将自身产品进行迭代优化,满足大多数用户的需求。用户的需求度,是产品进行更新换代的主要因素,在互联网以及移动互联网中存在几大类内容和人群的平台,其中包括搜索引擎、论坛、SNS社区、网络通讯软件、博客、百科、微博客等。在每一大类中都存在不同备受欢迎的平台,比如:百度、百度贴吧、猫扑、人人网、QQ群、新浪博客、百度百科、新浪微博等等;每一个平台都同样承载着不同用户的社交、知识等需求。由此正是因为每一个平台所承载的需求有所不同,企业在对于用户的获取和品牌宣传也在通过这些平台进行品牌广告推广或活动推广。使用大数据分析互联网数据中用户的意图,更倾向用户需求的真实性和大众性,因此,企业对于数据的重视度也在不断加强,无论是从数据的存储和运用角度,都投入较多的人力和物力进行尝试探索。
由于企业所属领域的不同,在需求和实现中角色分工不同,如,产品类型就包括B2C产品、B2B产品、B2B2C产品、O2O产品等等多种类型;产品的使用者对于每一类平台或平台中的产品的功能、使用习惯和行为都有着强烈的需求,如平台或平台中产品的颜色风格、布局格调等的喜好程度,或者某个功能是不是用户需求的功能,或者用户来访的真正的意图是什么等等,对于产品的诞生或改进有着重大的意义,但是,现有的数据分析仅针对特定领域或企业自有的数据库中的数据进行分析,数据采集和整合的领域过窄,没有一套通用的可进行多领域多类别的分类和存储的用户意图识别模式,数据真实性和大众性的参考性较低。
单一领域的数据分析,让产品在诞生的过程中存在过多复制和错误的尝试,因此,若企业在拥有了用户行为数据采集能力时,可以对每一位用户的行为进行全面的分类分析,从分析的结果中对用户的需求进行挖掘探索,找到大多数用户对某一产品的特定行为习惯和该产品本身不完善的部分,对产品的改善和创新有着重大的意义。
发明内容
本领域中,将众多的平台称之为不同的渠道,通过不同渠道到达企业产品中的每一个路径会被数据的埋点技术所记录。其中包括基于搜索引擎渠道的一次来访收集到用户的来路渠道的域名,来路关键词;也包括通过URL来访的渠道自身的域名;这些都是作为标识每一个来源渠道的唯一标识。为了解决上述技术问题,本发明提供了一种意图行为数据的识别方法、系统及设备,通过基于数据的埋点技术提供了一套通用的意图行为数据识别技术,区分不同类型用户对于产品功能的使用偏好等,从而更清晰的了解用户的需求。
为达到上述目的,本发明一方面提供了一种意图行为数据的识别方法,包括:
采集行为数据,形成行为基础信息库;
提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;
将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;
将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据。
进一步的,所述采集行为数据,包括:通过埋点技术采集行为数据。
进一步的,所述通过埋点技术采集行为数据,包括:
在至少一个需要采集的行为数据环节部署数据埋点;
将采集的同一ID的行为数据进行定义。
进一步的,所述行为数据,包括但不限于:注册行为数据、登录行为数据、浏览行为数据、收藏行为数据、分享行为数据、按钮点击行为数据、搜索行为数据和/或支付行为数据中的一种或多种行为数据。
进一步的,所述将行为基础信息库中的数据按类别抽取数据集后分类存储之后,还包括:
同时将同一ID的同一个行为数据去重。
进一步的,所述统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径,包括:
通过数据集之间交叉统计的方式统计出相同类别行为数据与不同类别行为数据之间的重合度;
按照行为数据出现的时间顺序将重合度数据组合;
将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
进一步的,所述重合度包括:
相同的唯一ID标识存在于当前行为的前一个行为或者后一个行为的行为数据集中。
本发明另一方面还提供了一种意图行为数据的识别系统,其包括:
采集模块,用于采集行为数据,形成行为基础信息库;
提取模块,用于提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;
抽取模块,用于将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;
关联模块,用于将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据。
进一步的,所述采集模块,包括:采集单元,用于通过埋点技术采集行为数据。
进一步的,所述采集单元,包括:
埋点单元,用于在至少一个需要采集的行为数据环节部署数据埋点;
定义单元,用于将采集的同一ID的行为数据进行定义。
进一步的,所述行为数据,包括但不限于:注册行为数据、登录行为数据、浏览行为数据、收藏行为数据、分享行为数据、按钮点击行为数据、搜索行为数据和/或支付行为数据中的一种或多种行为数据。
进一步的,所述抽取模块,包括:
去重单元,用于将同一ID的同一个行为数据去重。
统计单元,用于通过数据集之间交叉统计的方式统计出相同类别行为数据与不同类别行为数据之间的重合度;
组合单元,用于按照行为数据出现的时间顺序将重合度数据组合;
存储单元,用于将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
进一步的,所述重合度包括:
相同的唯一ID标识存在于当前行为的前一个行为或者后一个行为的行为数据集中。
本发明另一方面还提供了一种意图行为数据的识别设备,包括如前述任一项所述的系统。
本发明通过采集行为数据,形成行为基础信息库;提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据的技术方案,能够有效的为产品优化过程中对于用户的行为意图提供依据。很好的解决了在渠道推广优化过程中的效果跟踪统计问题,让每一个推广计划目的性更佳明确,更佳细化,通过识别到的行为路径与渠道之间的关系可以很明显的观察到效果的成败;同时很好的透视了不同意图的用户在产品当中的行为路径,通过对路径结合业务需求进行分析,经过反复的优化,更好的支撑了业务实现,让每一次优化更贴近用户真实需求。
附图说明
图1为根据本发明的一种意图行为数据的识别方法的实施例一的流程图;
图2为根据本发明的一种意图行为数据的识别系统的实施例二的示意图;
图3为根据本发明的采集模块的实施例二的示意图;
图4为根据本发明的采集单元的实施例二的示意图;
图5为根据本发明的抽取模块的实施例二的示意图;
图6为根据本发明的一种意图行为数据的识别设备的实施例三的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
参照图1,图1示出了本发明提供的一种意图行为数据的识别方法的流程图。包括:步骤S110至步骤S140。
在步骤S110中,采集行为数据,形成行为基础信息库。
其中,采集行为数据,包括:通过埋点技术采集行为数据。
具体包括:在至少一个需要采集的行为数据环节部署数据埋点;将采集的同一ID的行为数据进行定义。
如,通过埋点技术在产品的各个需要捕获的行为环节进行数据的部署代码埋点,同时基于同一个用户的唯一ID标识来标记同一用户的一系列行为,将产生的数据进行定义(如:登陆按钮点击时采集到的行为数据定义为登陆行为)。
其中,数据埋点分为初级、中级、高级三种方式,分别为:在产品、服务转化关键点植入统计代码,据其独立ID确保数据采集不重复(如购买按钮点击率);植入多段代码,追踪用户在平台每个界面上的系列行为,事件之间相互独立(如打开商品详情页——选择商品型号——加入购物车——下订单——购买完成);联合公司工程、ELT采集分析用户全量行为,建立用户画像,还原用户行为模型,作为产品分析、优化的基础。无疑,数据埋点是一种良好的私有化部署数据采集方式。数据采集准确,满足了企业去粗取精,实现产品、服务快速优化迭代的需求。
进一步的,所述行为数据,包括但不限于:注册行为数据、登录行为数据、浏览行为数据、收藏行为数据、分享行为数据、按钮点击行为数据、搜索行为数据和/或支付行为数据中的一种或多种行为数据。其中浏览又包括对于不同功能页面的浏览,按钮点击包括对于不同功能按钮的点击。以下是对于不同的行为进行定义提取:
1、“注册”行为数据的定义:
通过手机号、邮箱地址、用户名和密码为组合的方式进行账号的申请。
2、“登录”行为数据的定义:
①、通过手机号、邮箱地址、用户名和密码的组合的方式进行账号的登陆。
②、通过第三方平台授权登陆,如:微信、微博、QQ等等。
3、“浏览”行为数据的定义:
通过对不同内容的页面进行跳转或者加载,定义为一次页面的浏览。
4、“收藏”行为数据的定义:
通过对B2C电商中的某件商品进行如收藏、喜欢、关注等功能的触发,标志为特别关注,将此情感告诉电商平台,从而享受一系列的消息通知服务或记录功能服务。
5、“分享”行为数据的定义:
通过第三方工具将产品中的某类信息,如某个商品进行发布到第三方平台的行为。
6、“按钮点击”行为数据的定义:
对产品中的功能按钮进行点击的行为,定义为按钮点击。如:登陆按钮、搜索按钮、购买按钮等等。
7、“搜索”行为数据的定义:
通过在输入框中输入想要了解的关键词,在触发搜索按钮的点击行为,定义为一次搜索行为。
8、“支付”行为数据的定义:
对所购买的商品通过第三方支付平台或者网银进行在线支付的行为,定义为支付行为。
在步骤S120中,提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储。
对于企业而言,众多的平台称之为不同的渠道,通过不同渠道到达产品中的每一个ID的路径会被数据的埋点技术所记录。其中包括基于搜索引擎渠道的一次来访收集到用户的来路渠道的域名,来路关键词;也包括通过URL来访的渠道自身的域名;这些都是作为标识每一个来源渠道的唯一标识。
从行为基础信息库中提取的数据来源进行聚类统计,取出topN的来路渠道,从来访的次数进行从高到底的排序。其中,topN为按照某一个指标进行倒序或正序排列,并取其中的N项。
例如:各个渠道来源来访次数排名TOP10,表示从高分到低分排列,取前10名显示。
从行为基础信息库中提取出用户的来路渠道信息,可区分出不同渠道来源的用户。
企业应用场景
场景1:企业品牌广告推广
企业在做品牌广告推广时会调研和考虑不同渠道之间的人群受众。无论是在搜索引擎中关键词的选取,还是不同渠道的人群拥有某种共同需求,企业都会在寻找渠道的过程中选择与企业品牌和企业产品本身相关性较强的一种,通过在各个渠道对于相似性较强的人群进行投放来实现更精准的效果,其中通过统计来源渠道的人员数量来评估投放效果的好坏,同时有的企业会通过来源渠道的ROI模型来评价投放效果的好坏。(ROI意思为投资回报率,是指通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报)
场景2:活动推广
由于企业对于产品营销过程中,会通过活动、优惠等方式进行推广,为企业的产品赢得更多的注册用户或者带来某个活动的参与人数,实现企业产品推广提升销量的目的。他们在选择投放渠道时会考虑到不同渠道的特性,例如渠道是否有较多的受众人群,通过对不同渠道的受众人群的对比,选择与其活动主题相关和目标受众人群较多的那一个渠道。这样他们可以在活动推广过程中获得较好的推广效果,为活动带来可观的人员参与数量,实现更好的活动效果。
在步骤S130中,将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
进一步的,所述将行为基础信息库中的数据按类别抽取数据集后分类存储之后,还包括:同时将同一ID的同一个行为数据去重。该操作的目的是为了区分出行为数据集,同时将由于数据采集过程中由于技术问题或产品设计缺陷所导致重复的数据。
进一步的,所述统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径,包括:通过数据集之间交叉统计的方式统计出相同类别行为数据与不同类别行为数据之间的重合度;优选的,可将重合度按先后时间顺序和等级进行划分,便于归类分析和查询,作为优选的,可分为四级。(四级:≥80%三级:≥50%二级:≥20%一级:≥5%)。按照行为数据出现的时间顺序将重合度数据组合;将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
按照行为数据之间的重合度和先后时间顺序进行组合,在此过程中会出现同一个行为数据的在先时间行为数据或在后时间行为数据相同的情况,将其视为一个新的行为路径,通过反复的迭代进行先后关系组合,截止到此步骤就完成了生成多种用户意图的行为路径。其中,先后关系指的是基于行为数据发生时间的先后。
其中,所述重合度包括:相同的唯一ID标识存在于当前行为的前一个行为或者后一个行为的行为数据集中。
在步骤S140中,将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据。
将行为路径与存储的渠道来源关联,统计出每一类用户意图的来路渠道,通过渠道的统计,可以得到同一个渠道的不同用户行为路径,也可以得到不同来路渠道的用户拥有同样的行为路径;然后通过对识别出来的多种意图的用户行为路径和多种来路渠道结合业务进行相关分析,从而得到不同意图用户的行为差异,以及来路渠道的用户质量。
本发明实施例一通过采集行为数据,形成行为基础信息库;提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据的技术方案,能够有效的为产品优化过程中对于用户的行为意图提供依据。很好的解决了在渠道推广优化过程中的效果跟踪统计问题,让每一个推广计划目的性更佳明确,更佳细化,通过识别到的行为路径与渠道之间的关系可以很明显的观察到效果的成败;同时很好的透视了不同意图的用户在产品当中的行为路径,通过对路径结合业务需求进行分析,经过反复的优化,更好的支撑了业务实现,让每一次优化更贴近用户真实需求。
实施例二
参照图2,图2示出了本发明提供的一种意图行为数据的识别系统200一实施例的结构图,包括:
采集模块21,用于采集行为数据,形成行为基础信息库。
提取模块22,用于提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储。
抽取模块23,用于将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
关联模块24,用于将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据。
进一步的,参照图3,所述采集模块21,包括:采集单元211,用于通过埋点技术采集行为数据。
进一步的,参照图4,所述采集单元211,包括:
埋点单元2111,用于在至少一个需要采集的行为数据环节部署数据埋点;
定义单元2112,用于将采集的同一ID的行为数据进行定义。
如,通过埋点技术在产品的各个需要捕获的行为环节进行数据的部署代码埋点,同时基于同一个用户的唯一ID标识来标记同一用户的一系列行为,将产生的数据进行定义(如:登陆按钮点击时采集到的行为数据定义为登陆行为)。
其中,数据埋点分为初级、中级、高级三种方式,分别为:在产品、服务转化关键点植入统计代码,据其独立ID确保数据采集不重复(如购买按钮点击率);植入多段代码,追踪用户在平台每个界面上的系列行为,事件之间相互独立(如打开商品详情页——选择商品型号——加入购物车——下订单——购买完成);联合公司工程、ELT采集分析用户全量行为,建立用户画像,还原用户行为模型,作为产品分析、优化的基础。无疑,数据埋点是一种良好的私有化部署数据采集方式。数据采集准确,满足了企业去粗取精,实现产品、服务快速优化迭代的需求。
进一步的,所述行为数据,包括但不限于:注册行为数据、登录行为数据、浏览行为数据、收藏行为数据、分享行为数据、按钮点击行为数据、搜索行为数据和/或支付行为数据中的一种或多种行为数据。其中浏览又包括对于不同功能页面的浏览,按钮点击包括对于不同功能按钮的点击。以下是对于不同的行为进行定义提取:
1、“注册”行为数据的定义:
通过手机号、邮箱地址、用户名和密码为组合的方式进行账号的申请。
2、“登录”行为数据的定义:
①、通过手机号、邮箱地址、用户名和密码的组合的方式进行账号的登陆。
②、通过第三方平台授权登陆,如:微信、微博、QQ等等。
3、“浏览”行为数据的定义:
通过对不同内容的页面进行跳转或者加载,定义为一次页面的浏览。
4、“收藏”行为数据的定义:
通过对B2C电商中的某件商品进行如收藏、喜欢、关注等功能的触发,标志为特别关注,将此情感告诉电商平台,从而享受一系列的消息通知服务或记录功能服务。
5、“分享”行为数据的定义:
通过第三方工具将产品中的某类信息,如某个商品进行发布到第三方平台的行为。
6、“按钮点击”行为数据的定义:
对产品中的功能按钮进行点击的行为,定义为按钮点击。如:登陆按钮、搜索按钮、购买按钮等等。
7、“搜索”行为数据的定义:
通过在输入框中输入想要了解的关键词,在触发搜索按钮的点击行为,定义为一次搜索行为。
8、“支付”行为数据的定义:
对所购买的商品通过第三方支付平台或者网银进行在线支付的行为,定义为支付行为。
进一步的,参照图5,所述抽取模块23,包括:
去重单元231,用于将同一ID的同一个行为数据去重。该去重单元231的作用是为了区分出行为数据集,同时将由于数据采集过程中由于技术问题或产品设计缺陷所导致重复的数据。
统计单元232,用于通过数据集之间交叉统计的方式统计出相同类别行为数据与不同类别行为数据之间的重合度。优选的,可将重合度按先后时间顺序和等级进行划分,便于归类分析和查询,作为优选的,可分为四级。(四级:≥80%三级:≥50%二级:≥20%一级:≥5%)。按照行为数据出现的时间顺序将重合度数据组合;将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
组合单元233,用于按照行为数据出现的时间顺序将重合度数据组合。在此过程中会出现同一个行为数据的在先时间行为数据或在后时间行为数据相同的情况,将其视为一个新的行为路径,通过反复的迭代进行先后关系组合,截止到此步骤就完成了生成多种用户意图的行为路径。其中,先后关系指的是基于行为数据发生时间的先后。
存储单元234,用于将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
进一步的,所述重合度包括:
相同的唯一ID标识存在于当前行为的前一个行为或者后一个行为的行为数据集中。
将行为路径与存储的渠道来源关联,统计出每一类用户意图的来路渠道,通过渠道的统计,可以得到同一个渠道的不同用户行为路径,也可以得到不同来路渠道的用户拥有同样的行为路径;然后通过对识别出来的多种意图的用户行为路径和多种来路渠道结合业务进行相关分析,从而得到不同意图用户的行为差异,以及来路渠道的用户质量。
由于本实施例二的系统所实现的处理及功能基本相应于前述图1所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
本发明实施例二通过采集模块采集行为数据,形成行为基础信息库;通过提取模块提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;抽取模块将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;关联模块将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据的技术方案,能够有效的为产品优化过程中对于用户的行为意图提供依据。很好的解决了在渠道推广优化过程中的效果跟踪统计问题,让每一个推广计划目的性更佳明确,更佳细化,通过识别到的行为路径与渠道之间的关系可以很明显的观察到效果的成败;同时很好的透视了不同意图的用户在产品当中的行为路径,通过对路径结合业务需求进行分析,经过反复的优化,更好的支撑了业务实现,让每一次优化更贴近用户真实需求。
实施例三
参照图6,图6示出了本发明提供的一种意图行为数据的识别设备300,包括实施例二中的任一项所述的系统200。
本发明实施例三通过采集行为数据,形成行为基础信息库;提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据的技术方案,能够有效的为产品优化过程中对于用户的行为意图提供依据。很好的解决了在渠道推广优化过程中的效果跟踪统计问题,让每一个推广计划目的性更佳明确,更佳细化,通过识别到的行为路径与渠道之间的关系可以很明显的观察到效果的成败;同时很好的透视了不同意图的用户在产品当中的行为路径,通过对路径结合业务需求进行分析,经过反复的优化,更好的支撑了业务实现,让每一次优化更贴近用户真实需求。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
需要指出,根据实施的需要,可将本申请中描述的各个步骤/部件拆分为更多步骤/部件,也可将两个或多个步骤/部件或者步骤/部件的部分操作组合成新的步骤/部件,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (11)
1.一种意图行为数据的识别方法,其特征在于,包括:
采集行为数据,形成行为基础信息库;
提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;
将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;所述重合度包括:相同的唯一ID标识存在于当前行为的前一个行为或者后一个行为的行为数据集中;
将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据;
对识别出来的多种意图的行为路径和多种渠道来源结合业务进行分析。
2.如权利要求1所述的方法,其特征在于,所述采集行为数据,包括:通过埋点技术采集行为数据。
3.如权利要求2所述的方法,其特征在于,所述通过埋点技术采集行为数据,包括:
在至少一个需要采集的行为数据环节部署数据埋点;
将采集的同一ID的行为数据进行定义。
4.如权利要求1-3之一所述的方法,其特征在于,所述行为数据,包括但不限于:注册行为数据、登录行为数据、浏览行为数据、收藏行为数据、分享行为数据、按钮点击行为数据、搜索行为数据和/或支付行为数据中的一种或多种行为数据。
5.如权利要求1所述的方法,其特征在于,所述将行为基础信息库中的数据按类别抽取数据集后分类存储之后,还包括:
同时将同一ID的同一个行为数据去重。
6.如权利要求1所述的方法,其特征在于,所述统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径,包括:
通过数据集之间交叉统计的方式统计出相同类别行为数据与不同类别行为数据之间的重合度;
按照行为数据出现的时间顺序将重合度数据组合;
将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
7.一种意图行为数据的识别系统,其特征在于,包括:
采集模块,用于采集行为数据,形成行为基础信息库;
提取模块,用于提取行为基础信息库中数据的渠道来源;并将不同的渠道来源的数据进行聚类统计,根据每个渠道来源的来访次数排序后存储;
抽取模块,用于将行为基础信息库中的数据按类别抽取数据集后分类存储;统计出相同类别行为数据与不同类别行为数据之间的重合度,按照时间顺序将重合度数据组合,将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径;所述重合度包括:相同的唯一ID标识存在于当前行为的前一个行为或者后一个行为的行为数据集中;
关联模块,用于将行为路径与存储的渠道来源关联,识别出每一类行为数据的意图行为数据;以及,对识别出来的多种意图的行为路径和多种渠道来源结合业务进行分析。
8.如权利要求7所述的系统,其特征在于,所述采集模块,包括:采集单元,用于通过埋点技术采集行为数据。
9.如权利要求8所述的系统,其特征在于,所述采集单元,包括:
埋点单元,用于在至少一个需要采集的行为数据环节部署数据埋点;
定义单元,用于将采集的同一ID的行为数据进行定义。
10.如权利要求7所述的系统,其特征在于,所述抽取模块,包括:
去重单元,用于将同一ID的同一个行为数据去重;
统计单元,用于通过数据集之间交叉统计的方式统计出相同类别行为数据与不同类别行为数据之间的重合度;
组合单元,用于按照行为数据出现的时间顺序将重合度数据组合;
存储单元,用于将组合后的数据在连续时间段内出现相同行为的数据存储为行为路径。
11.一种意图行为数据的识别设备,其特征在于,包括如权利要求7-10任一项所述的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710273565.0A CN107220745B (zh) | 2017-04-24 | 2017-04-24 | 一种意图行为数据的识别方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710273565.0A CN107220745B (zh) | 2017-04-24 | 2017-04-24 | 一种意图行为数据的识别方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107220745A CN107220745A (zh) | 2017-09-29 |
CN107220745B true CN107220745B (zh) | 2021-03-09 |
Family
ID=59943919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710273565.0A Active CN107220745B (zh) | 2017-04-24 | 2017-04-24 | 一种意图行为数据的识别方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107220745B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108521439B (zh) * | 2018-03-08 | 2022-01-21 | 北京三快在线科技有限公司 | 一种消息推送的方法和装置 |
CN108492135B (zh) * | 2018-03-08 | 2020-03-10 | 深圳萨摩耶互联网金融服务有限公司 | 渠道端口成本的跟踪优化方法及跟踪优化系统 |
CN108595314A (zh) * | 2018-03-12 | 2018-09-28 | 中国平安人寿保险股份有限公司 | 用户设备月活跃数计算方法、装置、终端设备及存储介质 |
CN108874641A (zh) * | 2018-06-01 | 2018-11-23 | 平安科技(深圳)有限公司 | 一种埋点数据的分析方法及装置 |
CN111539768B (zh) * | 2020-04-26 | 2022-05-20 | 支付宝(杭州)信息技术有限公司 | 基于行为路径的调研方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向系统 |
CN102946319A (zh) * | 2012-09-29 | 2013-02-27 | 焦点科技股份有限公司 | 网络用户行为信息分析系统及其分析方法 |
CN104090888A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 一种用户行为数据的分析方法和装置 |
CN105447186A (zh) * | 2015-12-16 | 2016-03-30 | 汉鼎信息科技股份有限公司 | 一种基于大数据平台的用户行为分析系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8027975B2 (en) * | 2007-01-31 | 2011-09-27 | Reputation.Com, Inc. | Identifying and changing personal information |
-
2017
- 2017-04-24 CN CN201710273565.0A patent/CN107220745B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向系统 |
CN102946319A (zh) * | 2012-09-29 | 2013-02-27 | 焦点科技股份有限公司 | 网络用户行为信息分析系统及其分析方法 |
CN104090888A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 一种用户行为数据的分析方法和装置 |
CN105447186A (zh) * | 2015-12-16 | 2016-03-30 | 汉鼎信息科技股份有限公司 | 一种基于大数据平台的用户行为分析系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107220745A (zh) | 2017-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107220745B (zh) | 一种意图行为数据的识别方法、系统及设备 | |
CN107944913B (zh) | 基于大数据用户行为分析的高潜在用户购买意向预测方法 | |
CN109685631B (zh) | 一种基于大数据用户行为分析的个性化推荐方法 | |
CN108876526B (zh) | 商品推荐方法、装置和计算机可读存储介质 | |
CN104090888B (zh) | 一种用户行为数据的分析方法和装置 | |
Zhang et al. | Large-scale network analysis for online social brand advertising | |
CN105447186B (zh) | 一种基于大数据平台的用户行为分析系统 | |
CN107146089B (zh) | 一种刷单识别方法及装置,电子设备 | |
US8190621B2 (en) | Method, system, and computer readable recording medium for filtering obscene contents | |
CN104394118B (zh) | 一种用户身份识别方法及系统 | |
CN102737333B (zh) | 用于计算用户和要约到微小细分的匹配的顺序引擎 | |
CN102236663B (zh) | 一种基于垂直搜索的查询方法、系统和装置 | |
CN105069654A (zh) | 一种基于用户识别的网站实时/非实时营销投放方法及系统 | |
CN107332910B (zh) | 信息推送方法和装置 | |
WO2019056661A1 (zh) | 一种搜索词推送方法、装置及终端 | |
CN103177384A (zh) | 基于用户兴趣图谱的网络广告投放方法 | |
CN105893526A (zh) | 多源数据融合系统和方法 | |
CN104504159B (zh) | 多支持度的正负序列模式在客户购买行为分析中的应用 | |
CN105095187A (zh) | 一种搜索意图识别方法及装置 | |
CN107004203A (zh) | 信息处理系统以及方法 | |
CN107360246A (zh) | 一种消息推送方法及装置、一种终端及存储介质 | |
CN112632405B (zh) | 一种推荐方法、装置、设备及存储介质 | |
CN111447575A (zh) | 短信息推送方法、装置、设备及存储介质 | |
CN108776857A (zh) | Nps短信调研方法、系统、计算机设备和存储介质 | |
CN115577172A (zh) | 物品推荐方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |