CN110851666A - 用户流量切分方法、装置、服务器及存储介质 - Google Patents

用户流量切分方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110851666A
CN110851666A CN201911115060.7A CN201911115060A CN110851666A CN 110851666 A CN110851666 A CN 110851666A CN 201911115060 A CN201911115060 A CN 201911115060A CN 110851666 A CN110851666 A CN 110851666A
Authority
CN
China
Prior art keywords
experiment
user
flow
experimental
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911115060.7A
Other languages
English (en)
Inventor
王豪
费伦宙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN201911115060.7A priority Critical patent/CN110851666A/zh
Publication of CN110851666A publication Critical patent/CN110851666A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06313Resource planning in a project environment

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种用户流量切分方法、装置、服务器及存储介质,其中方法包括:确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中;为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示。本申请实施例能够显著提升实验的效率和实验结果的准确性,降低实验的成本,帮助实验工作人员进行实验和辅助决策。

Description

用户流量切分方法、装置、服务器及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户流量切分方法、装置、服务器及存储介质。
背景技术
目前对线上用户进行产品策略实验,主要是对用户账号尾号进行划分,来实现将流量用户进行划分,从而下发不同的实验策略,并对用户的行为进行简单的数据统计后实施数据统计上报,通过后台统计上报的结果来对不同实验策略的效果进行分析和处理,但是这种方式无法对线上流量用户进行均等的分配,同时,也无法对收集到的实验数据进行可视化展示以及多维分析处理,如何对用户流量切换进行优化,是当前需要进行研究的热点问题。
发明内容
本发明实施例提供了一种用户流量切分方法、装置、服务器及存储介质,能够显著提升实验的效率和实验结果的准确性,降低实验的成本,帮助实验工作人员进行实验和辅助决策。
第一方面,本发明实施例提供了一种用户流量切分方法,所述方法包括:
确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支;
为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;
获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
第二方面,本发明实施例提供了一种用户流量切分装置,所述装置包括:
确定单元,用于确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支;
配置单元,用于为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;
处理单元,用于获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
第三方面,本发明实施例提供一种服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如下步骤:
确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支;
为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;
获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
第四方面,本发明实施例提供一种计算机存储介质,该计算机存储介质存储有计算机程序指令,该计算机程序指令被执行时用于实现上述的用户流量切分方法。
本发明实施例中,服务器先确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支,再为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略,最后获取流量用户在实验策略中的用户行为数据,根据用户行为数据得到每个实验策略对应的实验结果,并将实验结果进行可视化展示,实验结果用于指示流量用户在不同实验策略下对目标网站的使用习惯。从而可以有效解决现有实验中对不同实验策略分配的流量用户不均匀,无法同时进行多个实验的问题,并且可以根据用户的热证信息进行针对性的实验,同时对收集到的用户行为数据进行可视化展示和多维分析,显著提升实验的效率和实验结果的准确性,降低实验成本。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的一种流量用户切分系统的架构示意图;
图1b是本申请实施例提供的一种实验管理平台界面的参考示意图;
图1c是本申请实施例提供的另一种实验管理平台界面的参考示意图;
图1d是本申请实施例提供的另一种实验管理平台界面的参考示意图;
图2是本申请实施例提供的一种用户流量切分方法的流程示意图;
图3是本申请实施例提供的一种计算流量用户特征值尾号的流程示意图;
图4是本申请另一实施例提供的一种用户流量切分方法的流程示意图;
图5是本发明实施例提供的一种流量用户切分装置的结构示意图;
图6是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
本申请的提供的用户流量切分方法主要由服务器来实现,服务器基于由实验管理平台、流量切分后台、用户行为统计上报后台、数据可视化平台组成的实验系统可以实现完整方法。如图1a所示,为实现本申请提供的用户流量切分系统的架构图,其中,实验管理平台主要用于将实验信息发送给流量切分平台,实验信息包括用户特征信息、实验策略等信息,实验管理平台已经对这些信息进行了配置,实验工作人员根据需要选择要进行实验的流量用户,并为其配置实验策略,流量切分后台主要用于根据流量用户的特征信息确定流量用户命中哪个实验,即命中哪个实验分支,从而可以进一步为其下发对应的实验策略,用户行为统计上报后台会根据流量用户在命中的实验策略下,对目标网站的操作行为(例如点击、选取、删除等)进行用户行为数据上报,并将收集到的上报数据经过处理后通过数据可视化平台进行可视化展示。
实验管理平台主要的功能是对各个实验分支和实验策略进行管理,同时还包括对流量用户权限管理,实验流量分层管理,实验操作日志记录等功能。实验工作人员可以在实验管理平台查看实验列表,可以看到已完成的实验,正在进行的实验,即将开始的实验等等,并且还可以通过实验管理平台新增、删除。修改实验,为实验策略配置流量用户的比例,设定实验触发时间以及对实验策略进行修改,查看实验的操作日志、修改实验分支信息,填写实验总结等等。如图1b所示,实验工作人员可以通过实验管理平台查看实验信息,例如实验名称,实验状态,实验开始时间和时间结束时间等等,当实验工作人员要新增一个实验时,可以配置新增实验的实验信息,如图1c所示,输入新增实验的实验名称、该实验是否为隐私实验,实验责任人,实验开始时间,实验结束时间等信息,即可新建一个实验,图1b和图1c仅作为一种参考,此时不作任何限定。
流量切分后台将每个业务作为一个实验分支,不同业务在不同的业务层,通过正交的哈希函数保证各个实验分支层互补干扰,正交的Hash函数是指同一个流量用户的账号,两个Hash函数算出来的结果毫不相关,完全独立,主要通过传入不同质数的Hash种子来实现。在流量用户访问目标网站时,将流量用户的特征信息,例如账号做哈希计算,然后用得到的哈希值做尾号划分,得到流量用户处于哪个流量区间,由于各个哈希函数之间是互相正交的,因此计算来的结果无相关性,流量用户在每个实验分支层都均匀分布,保证了各层之间互不干扰,例如图1d所示,根据目标网站的四个业务配置四个实验分支,分别是音乐馆UI分支,歌单分支,音乐电台分支,音乐排行榜分支,每个实验分支分别对应哈希函数hash1、hash2、hash3和hash4,四个哈希函数之间互相正交,且每个实验分支的尾号包括0-99,根据流量用户的账号信息,使用每个实验分支对应的哈希函数可以计算出流量用户在每个实验分支的哈希值的尾号,从而根据尾号确定为用户分配对应的实验策略。
目前对网站线上的流量用户进行产品的实验策略,主要是通过根据流量用户的尾号来下发不同的实验策略,并对流量用户的行为数据进行简单的数据统计,无法实现对线上的流量用户进行均等的分配,并没没有对收集到的实验数据进行可视化的战术和多为分析处理,通过本申请提供的用户流量切分方法,可以对目标网站线上的流量用户进行均等分配,并且对获取到的用户行为数据进行多维度的统计分析后得到可视化模型,从而可视化展示。
使用配置尾号的方式来对线上的流量用户进行简单的划分,并对用户行为数据进行简单的数据上报和统计,主要以下几个缺点:无法对进行实验的流量用户进行均等的分配,因为各尾号的线上流量大小存在差异,导致实验样本的基数不同,最终实验结果也因此存在差异;可同时进行的实验数量存在限制,由于可配置的尾号的数量存在限制,导致可同时在线的实验数量收到号码数量的限制;无法在同一个用户端同时进行多个实验,由于配置号码包的方式无法对流量进行分层处理,为了避免实验干扰,一个号码包通常只会配置一个实验,无法在同一个用户端同时进行多个实验;无法进行定制化实验,通过配置号码的方式无法对流量用户的特点(例如性别、年龄、地区)进行区分,无法进行指定特点用户的定制化实验;无法对数据进行可视化展示和多维分析,目前配置号码包进行实验的方式只对用户行为进行简单的采集和分析,无法进行数据的可视化展示和多维分析。
采用本发明实施例所提供的用户流量切分方法,可以通过哈希正交流量切分算法,根据流量用户的特征信息,例如账号信息进行运算,产生出分布均匀的数值,从而是每个流量用户被选中的概率均等,实现流量用户的均等分配,用户账号的尾号一般在0-9之间,因此,配置尾号进行实验的数量只能限制在10以内,即同一个实验分支下,最多只能配置10个实验策略,因此实验数量受到很大的限制,根据哈希值的尾号进行计算,尾号可以在0-99之间,可以极大减轻了对实验数量的限制,此外,通过哈希正交流量切分算法,计算时采用不同的哈希种子,同一个流量用户的账号信息可以产生互不干扰的独立结果,根据产生的互不干扰的独立结果可以分别进行不同类型或不同功能的实验,因此,一个流量用户可以别分配到多个实验分支中。根据流量用户的一些特征信息,例如账号信息,设备信息,性别信息,年龄信息等多个因素,可以为流量用户进行定制化实验,从而,得到更准确,更具参考性的实验结果。
基于上述用户流量切分系统的实施例的描述,本发明实施例提供一种用户流量切分方法,具体可以由智能终端执行。请参见图2,该用户流量切分过程可包括以下步骤S201-S203:
S201、确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支。
对访问目标网站的线上流量用户进行用户实验时,可先确认访问目标网站的流量用户标识的数目,从而根据数据将各个流量用户分配到各个实验分支的不同实验策略中,流量用户标识,可以是只要用户上线目标网站即可获取流量标识,获取是在流量用户上线目标网站后,目标网站输出提示该流量用户是否进行实验测评的通知消息,在流量用户选择是之后,即可获取流量用户标识。按照预设的流量切分策略,将流量用户分配到不用的实验分支中,通过哈希正交流量切分算法,对用户的一些特征信息进行运算,产生出分布均匀的数据,从而每个流量用户被选中到任何实验分支中的概率是相同的,可以实现对流量用户的均等分配,同一流量用户可能仅仅被分配到一个实验分支,也可能被分配到多个实验分支,以实施不同功能或类型的实验。
本申请提供的用户流量切分方法主要由服务器通过特定程序实现对访问的目标网站线上的流量用户进行切分,目标网站可以是以网页的形式或者以应用程序的应用界面的形式,将访问目标网站的流量用户切换到不同的实验分支后,在为流量用户配置对应实验分支下不同的实验策略,在服务器进一步获取用户端上报的用户行为数据后,将用户行为数据作为实验数据进行统计分析,得出可视化模型,从而可以帮助公司对于不同的产品迭代和修改策略进行决策。
用户流量切分方法主要基于Nodejs、Canvas、通用行为上报技术、Hash流量切分技术实现,还可以使用Web页面方式对实验结果进行展示和数据的可视化,并支持对流量进行抽象分层。通过Nodejs进行Web端的管理平台搭建和对实验相关数据的增删改查,在服务端通过Hash流量切分算法将线上的访问流量进行切分分层,并针对不同的用户流量下发不同的实验策略。在对用户端的实验数据进行统计分析后,利用Canvas的绘图特性对收集到的实验数据进行数据的可视化展示。
实验分支用于表示目标网站可以进行的不同功能或者不同类型的实验,例如,目标网站为音乐网站,音乐网站有歌单使用功能,音乐电台功能,音乐排行榜使用功能,音乐直播等功能,可以对功能进行实验,从而进一步了解流量用户对这些功能的使用情况,进而可以对这些功能可以进行改进,例如,为音乐网站配置的四个实验分支,每个实验分支分别用于进行歌单使用实验、音乐电台使用实验,音乐排行榜使用实验和音乐直播使用实验。其中,在同一实验分支下,可以为该实验分支配置不同的实验策略,从而,获取用户在不同实验策略下的用户行为数据。其中,实验策略可以是为同一功能或同一类型的实验实施配置不同的实现方法,从而,得到的实验结果是多维度的,而不是在单一环境下得到的,例如,在歌单使用实验的每个实验分支中,配置了多个实验策略,预先设定每个实验策略分别对应歌单一、歌单二、歌单三和歌单四,不同的歌单里面有不同风格或来自不同歌手的歌曲,不同的实验策略对应不同的歌单,在获取到用户在不同实验策略下的用户行为数据并进行统计分析后,有利于多维度的确定用户对歌单功能的使用习惯和使用需求,进而可以对歌单进行改良和优化。其中,用户行为数据例如可以是点击、选取、访问、增加、删除等在歌单使用过程中,用户常用的一些操作。
S202、为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略。
每个实验分支根据分配到的流量用户,为每个流量用户配置对应的实验策略,对流量用户进行进一步的划分,如图3所示,在歌单使用实验分支中,有实验策略1、实验策略2和实验策略3,实验策略1对应歌单1的使用,实验策略2对应歌单2的使用,实验策略3对应歌单3的使用,歌单1、歌单2、歌单3中分别为不同类型或不同的曲目,例如歌单1中为适合午饭伴奏的,舒缓日系轻音,歌单2中未适合学习工作的,效率加速旋律合集,歌单3中为适合睡前的舒缓入梦私享歌单。在实验进行时,将歌单1推送给对应实验分支中30%的流量用户,将歌单2推送给对应实验分支中30%的流量用户,将歌单3推送给对应实验分支中30%的流量用户,每个实验策略中的30%的流量用户都是随机选取的,每个实验策略会在指定的时间上线,可以是3个实验策略同时执行,也可以是分开执行,每个实验策略的执行互不影响。
在一种实现方式中,所述为所述多个实验分支中每个实验分支的流量用户配置对应的实验策略,包括:获取所述流量用户的特征信息,其中,所述特征信息包括账号信息、设备信息、性别信息和年龄信息中的至少一个;根据所述特征信息,将所述每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中。在为实验分支中的多个流量用户配置对应的实验策略时,先获取流量用户的特征信息,特征信息例如可以包括用户使用目标网站时的账号信息,设备信息,用户的性别信息,用户的年龄信息等等,根据用户的特征信息,确定用户在实验分支中最适合的实验策略,从而,可以按照预设分配规则将实验分支的流量用户分配的多个实验策略中,预设分配规则可以是均等分配,也可以是按照各个实验策略的优先级或者重要程度,分别为每个实验策略分配不同数量的流量用户。
在一种实现方式中,所述根据所述特征信息,将每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中,包括:在检测到第一流量用户被分配到第一实验分支时,查找预设的实验分支和特征函数之间的映射关系,以确定所述第一实验分支对应的第一特征函数;根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略。第一流量用户可以是目标网站在线的任何一个流量用户,在检测到第一流量用户被分配到第一实验分支时,通过查找预设的实验分支和特征函数之间的映射关系,以确定第一实验分支对应的第一特征函数,从而,可以根据第一流量用户的特征信息和第一特征函数,计算得到第一特征值,根据第一特征值来查找第一流量用户在第一实验分支中对应的实验策略,从而,安排第一流量用户在第一实验策略下进行实验,得到可以用户改进或优化目标网站的实验结果。
在一种实现方式中,所述根据所述特征信息,将每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中,包括:在检测到第一流量用户被分配到第一实验分支时,查找预设的实验分支和特征函数之间的映射关系,以确定所述第一实验分支对应的第一特征函数;根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略。在第一特征信息为第一流量用户的账号信息时,根据第一流量用户的账号信息,以及第一流量用户所在第一实验分支对应的第一哈希函数,计算得到第一哈希值,根据第一哈希值的尾号,确定第一哈希值所在的目标流量区域,从而,根据目标流量区域即可确定和第一流量用户对应的第一实验策略。
S203、获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
在一种实现方式中,所述每个实验分支对应一个特征函数,所述每个实验分支对应的特征函数为互相正交的哈希函数,互相正交的多个哈希函数之间的计算结果互不干扰,且所述计算结果的尾号在预设的流量区间内。本申请主要是基于DJB、BKDR、AP三种哈希算法,通过不同的哈希种子实现各实验分支层之间的正交,通过计算每一层的总体方差值来计算出正交指数,从而可以在1000以内找到正交指数最大的168个哈希种子。如图3所示,例如,引流3000万线上流量用户请求的计算服务,先计算不同流量用户账号在每个哈希下命中的桶,再统计两层中任意两个桶组合情况的流量用户数量,计算0-99两两组合的方差值用于两层正交的量化指标,最后得出两层之间的正交指数。
用户行为统计上报后台主要是在检测到当用户触发对应的行为时,通过通用的ABT对进行对应实验的用户行为数据上报,通过查询命中实验的入口表和后台下发的标记来区分当前是按行为和普通的用户行为,并且,在上报的数据统计后台后,对一些异常的用户行为数据进行过滤和清洗,放置异常数据干扰实验结果。数据可视化平台在得到对应指标的统计数据后,将统计分析结果根据需要展示出不同的图表和模型,方便系统使用者极性数据分析和对应的产品策略进行决策。
本发明实施例中,服务器先确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支,再为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略,最后获取流量用户在实验策略中的用户行为数据,根据用户行为数据得到每个实验策略对应的实验结果,并将实验结果进行可视化展示,实验结果用于指示流量用户在不同实验策略下对目标网站的使用习惯。从而可以有效解决现有实验中对不同实验策略分配的流量用户不均匀,无法同时进行多个实验的问题,并且可以根据用户的热证信息进行针对性的实验,同时对收集到的用户行为数据进行可视化展示和多维分析,显著提升实验的效率和实验结果的准确性,降低实验成本。
基于上述用户流量切分系统的实施例的描述,本发明实施例提供了另一种用户流量切分方法,具体可以由服务器执行。请参见图4,该用户流量切分过程可包括以下步骤S401-S406:
S401、确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支。
通过Hash正交流量切分算法,计算时采用不同的Hash种子,同一个账号可产生互不干扰的独立结果,根据产生的互不干扰的独立结果可以分别进行不同的实验。通过Hash正交流量切分算法,对用户的账号进行运算,产生出分布均匀的数值,从而使每个用户被选中的概率均等,实现流量均等分配,流量切分的依据为用户的账号算法过程大致为:获取用户的特征信息,例如账号,将账号数值进行加减乘除、取余、次方等复杂运算,将运算结果解析为0-100的数字,分配不同的数字到不同的实验,从而实现对用户访问是的流量进行切分。
S402、为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略。
主要应用于对互联网产品进行迭代和维护时,对不同的产品或技术策略进行对比实验和数据分析,从而帮助产品经理或技术人员进行相关的决策。产品侧在管理平台上配置想要进行的实验,并选择为每个实验分支分配的流量大小,实验配置完成后实验会在指定的时间上线,在不同实验分支流量中的用户会看到不同的实验策略。在对用户数据进行统计分析后,可以在管理平台的数据查看页面看到对应用户行为的可视化模型。系统使用者在配置了相应的实验信息后,实验管理平台将实验信息传给流量切分后台。用户使用网站或App时,流量切分后台根据用户的基本信息判断是否命中相应的实验,若命中实验,则下发对应得实验策略数据。App会对用户的行为(如:收藏、歌曲播放等)进行相应的数据上报,收集到的上报数据经过处理后在可视化平台进行展示。
S403、在所述实验策略的触发时间检测到实验触发后,获取上报的用户行为数据。
实验策略的出发时间已经预先进行的设定,当实验策略出发后,通过通用的ABT标记进行对应实验流量用户的用户行为数据上报,通过查询命中实验的入口和后台下发对应的标记来区分当前实验的用户行为和普通的用户行为。在上报数据统计到后台后,对一些异常的用户行为数据进行过滤和清洗,放置异常数据干扰实验结果,之后进行统计分析。
S404、过滤所述用户行为数据中的异常数据。
S405、对所述过滤后的用户行为数据进行统计分析后得到可视化模型,并生成和所述可视化模型对应的所述目标网站的优化策略。
根据用户在实验策略下的用户行为数据作为统计数据得到统计分析结果后,数据可视化平台根据需要展示出不同的图标和模型,方便实验工作人员进行数据分析,对相应的产品策略极性决策,可视化展示主要宝库实验过程中各个用户行为数据指标随时间变化的趋势,总体统计的比例,总体数量对比等,并且可以根据制定时间进行筛选。
S406、显示所述可视化模型和所述目标网站的优化策略。
客户端在预先埋点之后,当用户触发对应的行为时,通过通用的ABT标记进行对应实验的用户行为上报,通过查询命中实验的入口表和后台下发对应的标记来区分当前实验的用户行为和普通的用户行为,在上报到数据统计后台后,对一些异常的用户行为和数据进行过滤和清洗,防止异常数据干扰实验结果,之后进行统计分析。在得到对应指标的统计数据后,数据可视化部分会根据需要展示出不同的图表和模型,方便系统使用者进行数据分析,和对相应的产品策略进行决策。主要包括实验过程中各个数据指标随时间变化的趋势,总体统计的比例,总体数量对比等,并且可以根据指定时间段进行筛选。
本申请提供的用户流量切分方法主要由服务器通过特定程序实现对访问的目标网站线上的流量用户进行切分,目标网站可以是以网页的形式或者以应用程序的应用界面的形式,将访问目标网站的流量用户切换到不同的实验分支后,在为流量用户配置对应实验分支下不同的实验策略,在服务器进一步获取用户端上报的用户行为数据后,将用户行为数据作为实验数据进行统计分析,得出可视化模型,从而可以帮助公司对于不同的产品迭代和修改策略进行决策。
本发明实施例中,服务器先确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支,再为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略,最后获取流量用户在实验策略中的用户行为数据,根据用户行为数据得到每个实验策略对应的实验结果,并将实验结果进行可视化展示,实验结果用于指示流量用户在不同实验策略下对目标网站的使用习惯。从而可以有效解决现有实验中对不同实验策略分配的流量用户不均匀,无法同时进行多个实验的问题,并且可以根据用户的热证信息进行针对性的实验,同时对收集到的用户行为数据进行可视化展示和多维分析,显著提升实验的效率和实验结果的准确性,降低实验成本。
基于上述方法实施例的描述,在一个实施例中,本发明实施例还提供了一种如图5所示的用户流量切分装置的结构示意图。如图5所示,本发明实施例中的用户流量切分装置可包括:
确定单元501,用于确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支;
配置单元502,用于为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;
处理单元503,用于获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
再一个实施例中,配置单元502在用于所述为所述多个实验分支中每个实验分支的流量用户配置对应的实验策略时,具体用于:获取所述流量用户的特征信息,其中,所述特征信息包括账号信息、设备信息、性别信息和年龄信息中的至少一个;根据所述特征信息,将所述每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中。
再一个实施例中,配置单元502在用于所述根据所述特征信息,将每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中时,具体用于:在检测到第一流量用户被分配到第一实验分支时,查找预设的实验分支和特征函数之间的映射关系,以确定所述第一实验分支对应的第一特征函数;根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略。
再一个实施例中,所述特征信息包括所述第一流量用户的账号信息,所述特征函数为预设的哈希函数;配置单元502在用于所述根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略时,具体用于:根据所述第一流量用户的账号信息,以及所述第一流量用户所在第一实验分支对应的第一哈希函数,计算得到第一哈希值;获取所述第一哈希值的尾号,根据所述尾号确定所述第一哈希值所在的目标流量区间;根据所述目标流量区间,确定和所述第一流量用户对应的第一实验策略。
再一个实施例中,所述每个实验分支对应一个特征函数,所述每个实验分支对应的特征函数为互相正交的哈希函数,互相正交的多个哈希函数之间的计算结果互不干扰,且所述计算结果的尾号在预设的流量区间内。
再一个实施例中,所述目标网站为音乐网站,多个实验分支对应所述音乐网站的多个用户实验,所述用户实验包括一下至少一种:歌单使用实验、音乐电台使用实验,音乐排行榜使用实验、音乐直播使用实验。
再一个实施例中,所述实验策略包括实验的触发时间信息;处理单元503在用于所述获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示时,具体用于:在所述实验策略的触发时间检测到实验触发后,获取上报的用户行为数据;过滤所述用户行为数据中的异常数据;对所述过滤后的用户行为数据进行统计分析后得到可视化模型,并生成和所述可视化模型对应的所述目标网站的优化策略;显示所述可视化模型和所述目标网站的优化策略。
本发明实施例中,服务器先确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支,再为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略,最后获取流量用户在实验策略中的用户行为数据,根据用户行为数据得到每个实验策略对应的实验结果,并将实验结果进行可视化展示,实验结果用于指示流量用户在不同实验策略下对目标网站的使用习惯。从而可以有效解决现有实验中对不同实验策略分配的流量用户不均匀,无法同时进行多个实验的问题,并且可以根据用户的热证信息进行针对性的实验,同时对收集到的用户行为数据进行可视化展示和多维分析,显著提升实验的效率和实验结果的准确性,降低实验成本。
请参见图6,是本发明实施例提供的一种服务器的结构示意图。如图6所示的本实施例中的服务器可以包括:一个或多个处理器601;一个或多个输入设备606,一个或多个输出设备603和存储器604。上述处理器601、输入设备606、输出设备603和存储器604通过总线606连接。存储器604用于存储计算机程序,所述计算机程序包括程序指令,处理器601用于执行所述存储器604存储的程序指令以执行上述的用户流量切分方法。
在一个实施例中,该处理器601可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器,即微处理器或者任何常规的处理器。该存储器604可以包括只读存储器和随机存取存储器,并向处理器601提供指令和数据。因此,在此对于处理器601和存储器604不作限定。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,由处理器601加载并执行计算机存储介质中存放的一条或一条以上计算机程序指令,以实现上述相应实施例中的方法的相应步骤;具体实现中,计算机存储介质中的至少一条计算机程序指令由处理器601加载并执行如下步骤:
确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支;
为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;
获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
在一个实施例中,在所述为所述多个实验分支中每个实验分支的流量用户配置对应的实验策略时,该至少一条计算机程序指令可由该处理器601加载并具体用于执行:获取所述流量用户的特征信息,其中,所述特征信息包括账号信息、设备信息、性别信息和年龄信息中的至少一个;根据所述特征信息,将所述每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中。
再一个实施例中,在所述根据所述特征信息,将每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中时,该至少一条计算机程序指令可由该处理器601加载并具体用于执行:在检测到第一流量用户被分配到第一实验分支时,查找预设的实验分支和特征函数之间的映射关系,以确定所述第一实验分支对应的第一特征函数;根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略。
再一个实施例中,所述特征信息包括所述第一流量用户的账号信息,所述特征函数为预设的哈希函数;在所述根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略时,该至少一条计算机程序指令可由该处理器601加载并具体用于执行:根据所述第一流量用户的账号信息,以及所述第一流量用户所在第一实验分支对应的第一哈希函数,计算得到第一哈希值;获取所述第一哈希值的尾号,根据所述尾号确定所述第一哈希值所在的目标流量区间;根据所述目标流量区间,确定和所述第一流量用户对应的第一实验策略。
再一个实施例中,所述每个实验分支对应一个特征函数,所述每个实验分支对应的特征函数为互相正交的哈希函数,互相正交的多个哈希函数之间的计算结果互不干扰,且所述计算结果的尾号在预设的流量区间内。
再一个实施例中,所述目标网站为音乐网站,多个实验分支对应所述音乐网站的多个用户实验,所述用户实验包括一下至少一种:歌单使用实验、音乐电台使用实验,音乐排行榜使用实验、音乐直播使用实验。
再一个实施例中,所述实验策略包括实验的触发时间信息;在所述获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示时,该至少一条计算机程序指令可由该处理器601加载并具体用于执行:在所述实验策略的触发时间检测到实验触发后,获取上报的用户行为数据;过滤所述用户行为数据中的异常数据;对所述过滤后的用户行为数据进行统计分析后得到可视化模型,并生成和所述可视化模型对应的所述目标网站的优化策略;显示所述可视化模型和所述目标网站的优化策略。
本发明实施例中,服务器先确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支,再为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略,最后获取流量用户在实验策略中的用户行为数据,根据用户行为数据得到每个实验策略对应的实验结果,并将实验结果进行可视化展示,实验结果用于指示流量用户在不同实验策略下对目标网站的使用习惯。从而可以有效解决现有实验中对不同实验策略分配的流量用户不均匀,无法同时进行多个实验的问题,并且可以根据用户的热证信息进行针对性的实验,同时对收集到的用户行为数据进行可视化展示和多维分析,显著提升实验的效率和实验结果的准确性,降低实验成本。
需要说明的是,上述描述的服务器和单元的具体工作过程,可以参考前述各个实施例中的相关描述,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明的部分实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (10)

1.一种用户流量切分,其特征在于,所述方法包括:
确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支;
为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;
获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
2.根据权利要求1所述的方法,其特征在于,所述为所述多个实验分支中每个实验分支的流量用户配置对应的实验策略,包括:
获取所述流量用户的特征信息,其中,所述特征信息包括账号信息、设备信息、性别信息和年龄信息中的至少一个;
根据所述特征信息,将所述每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征信息,将每个实验分支对应的流量用户按照预设分配规则分配到对应实验分支的多个实验策略中,包括:
在检测到第一流量用户被分配到第一实验分支时,查找预设的实验分支和特征函数之间的映射关系,以确定所述第一实验分支对应的第一特征函数;
根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略。
4.根据权利要求3所述的方法,其特征在于,所述特征信息包括所述第一流量用户的账号信息,所述特征函数为预设的哈希函数;所述根据所述第一流量用户的特征信息和所述第一特征函数,计算得到第一特征值,并根据所述第一特征值确定所述第一流量用户对应的第一实验策略,包括:
根据所述第一流量用户的账号信息,以及所述第一流量用户所在第一实验分支对应的第一哈希函数,计算得到第一哈希值;
获取所述第一哈希值的尾号,根据所述尾号确定所述第一哈希值所在的目标流量区间;
根据所述目标流量区间,确定和所述第一流量用户对应的第一实验策略。
5.根据权利要求1所述的方法,其特征在于,所述每个实验分支对应一个特征函数,所述每个实验分支对应的特征函数为互相正交的哈希函数,互相正交的多个哈希函数之间的计算结果互不干扰,且所述计算结果的尾号在预设的流量区间内。
6.根据权利要求1所述的方法,其特征在于,所述目标网站为音乐网站,多个实验分支对应所述音乐网站的多个用户实验,所述用户实验包括一下至少一种:歌单使用实验、音乐电台使用实验,音乐排行榜使用实验、音乐直播使用实验。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述实验策略包括实验的触发时间信息;所述获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,包括:
在所述实验策略的触发时间检测到实验触发后,获取上报的用户行为数据;
过滤所述用户行为数据中的异常数据;
对所述过滤后的用户行为数据进行统计分析后得到可视化模型,并生成和所述可视化模型对应的所述目标网站的优化策略;
显示所述可视化模型和所述目标网站的优化策略。
8.一种用户流量切分装置,其特征在于,包括:
确定单元,用于确定访问目标网站的流量用户标识的数目,并按照预置的流量切分策略将所述流量用户标识所对应的流量用户分配到多个实验分支中,其中,每个流量用户对应至少一个实验分支;
配置单元,用于为所述多个实验分支中每个实验分支中的流量用户配置对应的实验策略;
处理单元,用于获取所述流量用户在实验策略中的用户行为数据,根据所述用户行为数据得到每个实验策略对应的实验结果,并将所述实验结果进行可视化展示,所述实验结果用于指示所述流量用户在不同实验策略下对所述目标网站的使用习惯。
9.一种服务器,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的用户流量切分方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令适于由处理器加载并执行如权利要求1-7任一项所述的用户流量切分方法。
CN201911115060.7A 2019-11-14 2019-11-14 用户流量切分方法、装置、服务器及存储介质 Pending CN110851666A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911115060.7A CN110851666A (zh) 2019-11-14 2019-11-14 用户流量切分方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911115060.7A CN110851666A (zh) 2019-11-14 2019-11-14 用户流量切分方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN110851666A true CN110851666A (zh) 2020-02-28

Family

ID=69600940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911115060.7A Pending CN110851666A (zh) 2019-11-14 2019-11-14 用户流量切分方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110851666A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000570A (zh) * 2020-07-29 2020-11-27 北京达佳互联信息技术有限公司 应用测试方法、装置、服务器及存储介质
CN112087335A (zh) * 2020-09-10 2020-12-15 广州酷狗计算机科技有限公司 流量实验方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281611A (zh) * 2013-07-08 2015-01-14 阿里巴巴集团控股有限公司 网站测试系统中的用户流量分配方法及装置
CN109039800A (zh) * 2018-06-28 2018-12-18 腾讯科技(深圳)有限公司 在流量实验中进行流量分配的方法、装置和计算机设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281611A (zh) * 2013-07-08 2015-01-14 阿里巴巴集团控股有限公司 网站测试系统中的用户流量分配方法及装置
CN109039800A (zh) * 2018-06-28 2018-12-18 腾讯科技(深圳)有限公司 在流量实验中进行流量分配的方法、装置和计算机设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000570A (zh) * 2020-07-29 2020-11-27 北京达佳互联信息技术有限公司 应用测试方法、装置、服务器及存储介质
CN112087335A (zh) * 2020-09-10 2020-12-15 广州酷狗计算机科技有限公司 流量实验方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN108234168B (zh) 一种基于业务拓扑的数据展示方法及系统
US8938489B2 (en) Monitoring system performance changes based on configuration modification
CN111614690B (zh) 一种异常行为检测方法及装置
CN108874640A (zh) 一种集群性能的评估方法和装置
US10230601B1 (en) Systems and methods for integrated modeling and performance measurements of monitored virtual desktop infrastructure systems
CN110162976B (zh) 风险评估方法、装置及终端
US8261278B2 (en) Automatic baselining of resource consumption for transactions
US20170277582A1 (en) Identification of distinguishable anomalies extracted from real time data streams
CN103346912B (zh) 告警相关性分析的方法、装置及系统
WO2011134086A1 (en) Systems and methods for conducting reliable assessments with connectivity information
CN113051147A (zh) 一种数据库集群的监控方法、装置、系统、以及设备
CN108764332A (zh) 一种渠道质量分析方法、计算设备及存储介质
US11456932B2 (en) System capacity heatmap
CN114791846B (zh) 一种针对云原生混沌工程实验实现可观测性的方法
WO2014206131A1 (en) Method and apparatus for report generation
CN110851666A (zh) 用户流量切分方法、装置、服务器及存储介质
JP7255636B2 (ja) 端末管理装置、端末管理方法、およびプログラム
CN104272327B (zh) 作业管理方法以及管理系统
CN114741396B (zh) 一种数据服务的处理方法、装置、电子设备及存储介质
US20100179927A1 (en) Rating risk of proposed system changes
CN114153688A (zh) 基于云平台的分布式监控方法及装置
CN110943887B (zh) 探针调度方法、装置、设备和存储介质
CN109491733A (zh) 基于可视化的界面显示方法及相关设备
WO2020119627A1 (zh) 应用于分布式容器云平台的异常检测与定位方法及装置
US20130304547A1 (en) Investment valuation projections in an on-demand system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200228