CN111352978B - 确定产品的观测量的控制量的方法、装置、电子设备及介质 - Google Patents

确定产品的观测量的控制量的方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN111352978B
CN111352978B CN202010160121.8A CN202010160121A CN111352978B CN 111352978 B CN111352978 B CN 111352978B CN 202010160121 A CN202010160121 A CN 202010160121A CN 111352978 B CN111352978 B CN 111352978B
Authority
CN
China
Prior art keywords
user
behavior feature
user behavior
observed quantity
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010160121.8A
Other languages
English (en)
Other versions
CN111352978A (zh
Inventor
门聪
王轶凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010160121.8A priority Critical patent/CN111352978B/zh
Publication of CN111352978A publication Critical patent/CN111352978A/zh
Application granted granted Critical
Publication of CN111352978B publication Critical patent/CN111352978B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例公开了确定产品的观测量的控制量的方法和装置,该方法的一具体实施方式包括:分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的观测量、隐变量和多维用户行为特征向量;将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组;将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组;分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集;针对多维用户行为特征向量中的各维用户行为特征向量,确定比值;基于比值,确定与观测量正向关联的用户行为特征向量作为调节产品的观测量的控制量。

Description

确定产品的观测量的控制量的方法、装置、电子设备及介质
技术领域
本公开的实施例涉及计算机技术领域,具体涉及数据处理技术领域,尤其涉及确定产品的观测量的控制量的方法和装置。
背景技术
随着大数据的发展,传统的关联关系挖掘分析方法,仅通过相关分析就直接对产品和或策略产出建议,是数据分析领域常见的陷阱。
尤其对于应用程序(APP)的数据分析来说,决定一个产品体验感的因素非常多,比如各种功能模块,各种交互行为,各种分发内容的类别、质量和多样性等,通过分析用户行为探索提升用户的留存率和活跃度,非常具有挑战性。
发明内容
本公开的实施例提出了确定产品的观测量的控制量的方法和装置。
第一方面,本公开的实施例提供了一种确定产品的观测量的控制量的方法,该方法包括:针对预设产品,分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量;将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组;将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组;基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集;针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值;基于比值,确定与观测量正向关联的用户行为特征向量作为调节产品的观测量的控制量。
在一些实施例中,分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量,包括:对相邻时间周期内的用户行为数据进行解析,得到每个用户的用户ID;基于每个用户的用户ID,确定每个用户的用户索引;在数据库中查找每个用户的用户索引,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
在一些实施例中,方法还包括:基于控制量与产品的相关性,优化产品的结构和/或产品策略。
在一些实施例中,针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值,包括:针对多维用户行为特征向量中的各维用户行为特征向量,对各用户组中各用户集的该维用户行为特征向量的平均值和该用户集在所有用户中的权重进行加权运算,并基于第二用户组的加权运算结果与第一用户组的加权运算结果的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将比值作为该维用户行为特征向量的关联系数。
在一些实施例中,基于比值,确定与观测量正向关联的用户行为特征向量作为调节产品的观测量的控制量,包括:基于比值,判定该维用户行为特征向量与观测量的关联关系;响应于判定该维用户行为特征向量与观测量正向关联,确定该维用户行为特征向量作为调节产品的观测量的控制量。
第二方面,本公开的实施例提供了一种确定产品的观测量的控制量的装置,装置包括:分析单元,被配置成针对预设产品,分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量;分组单元,被配置成将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组;将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组;分类单元,被配置成基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集;第一运算单元,被配置成针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值;确定单元,被配置成基于比值,确定与观测量正向关联的用户行为特征向量作为调节产品的观测量的控制量。
在一些实施中,分析单元包括:解析模块,被配置成对相邻时间周期内的用户行为数据进行解析,得到每个用户的用户ID;运算模块,被配置成基于每个用户的用户ID,确定每个用户的用户索引;查找模块,被配置成在数据库中查找每个用户的用户索引,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
在一些实施例中,该装置还包括:优化单元,被配置成基于控制量与产品的相关性,优化产品的结构和/或产品策略。
在一些实施例中,装置还包括:第二运算单元,被配置成针对多维用户行为特征向量中的各维用户行为特征向量,对各用户组中各用户集的该维用户行为特征向量的平均值和该用户集在所有用户中的权重进行加权运算,并基于第二用户组的加权运算结果与第一用户组的加权运算结果的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将比值作为该维用户行为特征向量的关联系数。
在一些实施例中,确定单元包括:判定模块,被配置成基于比值,判定该维用户行为特征向量与观测量的关联关系;确定模块,被配置成响应于判定该维用户行为特征向量与观测量正向关联,确定该维用户行为特征向量作为调节产品的观测量的控制量。
第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的实施例提供的确定产品的观测量的控制量的方法和装置,采用对相邻时间周期内的用户行为数据进行分析与处理,对变化的用户行为数据进行研究,通过排除一些固有因素更容易定位对观测量产生影响的原因,避免了现有技术只注重研究不同用户群体固有行为特征的问题,提高了分析的准确性;通过将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组,将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组,再基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集,然后针对多维用户行为特征向量中的各维用户行为特征向量,进行该维用户行为特征向量的关联系数的运算,消减了隐变量对观测量的影响,避免了传统方法在对业务目标指标进行提升时容易受除用户行为特征以外的其他因素影响的问题,对在先周期不活跃而在后周期活跃的用户与在先周期不活跃且在后周期也不活跃的用户进行比较,找到对观测量有帮助的用户行为特征,为产品优化提供数据支持。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一些实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的确定产品的观测量的控制量的方法的一个实施例的流程图;
图3是根据本公开的实施例的确定产品的观测量的控制量的方法的一个应用场景的示意图;
图4是根据本公开的确定产品的观测量的控制量的方法的另一个实施例的流程图;
图5是根据本公开的日志采集装置的一个实施例的结构示意图;
图6是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的实施例的确定产品的观测量的控制量的方法和装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和中台服务器105。网络104用以在终端设备101、102、103和中台服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与中台服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
中台服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103的用户行为数据提供支持的服务器。服务器可以对获取的用户行为等数据进行分析,并将分析结果(例如关联程度)反馈给后台服务器,用以对产品进行优化。通过由中台服务器作为执行主体来进行数据分析,节省了后台服务器的工作量,通过单独对中台服务器进行建设并通过平台交互和可视化展现,提升了数据分析的效率。
需要说明的是,本公开的实施例所提供的确定产品的观测量的控制量的方法一般由中台服务器105执行。相应地,确定产品的观测量的控制量的装置一般设置于中台服务器105中。在此不做具体限定。
需要说明的是,服务器可以是硬件,也可以是软件。当中台服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当中台服务器为软件时,可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和中台服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和中台服务器。
继续参考图2,示出了根据本公开的确定产品的观测量的控制量的方法的一个实施例的流程200。该确定产品的观测量的控制量的方法,包括以下步骤:
步骤201,针对预设产品,分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
在本实施例中,该方法的执行主体(例如图1所示的中台服务器)针对预设产品,可以对两个相邻时间周期内的用户行为数据进行分析,得到每个用户不同时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
通常,用户行为数据为所有用户行为数据,是更优的选择。观测量即可以是业务目标所要提升的指标,例如用户周活跃天数,也可以是一个待分析的数据,例如搜索得到的文章标题长度。用户特征向量可以包括产品各功能模块的点击、玩游戏、评论、转发、点赞,多维的用户行为特征向量可以从用户行为的不同维度来划分,例如从用户粒度的性别、年龄、教育水平、兴趣点及用户所属类型。隐变量是指对观测量和/或用户行为特征有影响的隐含的变量,可以是基于用户对各模块的使用量来确定,例如使用时长,也可以是基于观测量本身的特征来确定,例如文章题材、文章作者水平。
步骤202,将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组,并将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组。
在本实施例中,上述执行主体可以根据预设阈值对观测量进行分组,将在不同时间周期内的观测量均小于预设阈值的用户划分至第一用户组,将在不同时间周期内在后时间周期的观测量大于预设阈值、而在先时间周期的观测量小于预设阈值的用户划分至第二用户组。通过分组,使第二用户组组中的所有用户为在先时间周期的活跃度低而在后时间周期的活跃度升高的用户,第一用户组中的所有用户为相邻时间周期内活跃度都不高的用户。
步骤203,基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集。
在本实施例中,上述执行主体可以对第一用户组和第二用户组中的每个用户的隐变量具体属于隐变量的分桶阈值的哪个区间进行判断,依据判定结果对各组用户中的所有用户再进行划分,得到第一用户组的多个用户集和第二用户组的多个用户集。
步骤204,针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值。
在本实施例中,上述执行主体可以针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组(在先时间周期的活跃度低而在后时间周期的活跃度升高的用户)中各用户集的该维用户行为特征向量的加权值与第一用户组(相邻时间周期内活跃度都不高的用户)中各用户集的该维用户行为特征向量的加权值的比值。利用加权计算的方法,降低了隐变量对观测量的影响,进一步使得关联系数仅表示为用户行为特征与观测量之间的关联关系。
步骤205,基于比值,确定与观测量正向关联的用户行为特征向量作为调节产品的观测量的控制量。
在本实施例中,执行主体可以按照预先定义的关联规则,对各维用户行为特征向量的关联关系进行判定,选择判定结果为正向关联的用户行为特征向量作为调节产品的观测量的控制量。
需要说明的是,上述加权计算方法是目前广泛研究和应用的公知技术,在此不再赘述。
继续参见图3,图3是根据本实施例的确定产品的观测量的控制量的方法的应用场景的一个示意图300。当中台服务器302接收到终端设备301发来的请求数据包303,服务器302首先对相邻时间周期内的用户行为数据进行分析,得到每个用户各个时间周期的以下数据:周活跃天数、用户时长和多维用户行为特征向量,比如各功能模块的点击数等,然后将在不同时间周期内周活跃天数均小于预设阈值(3天)的用户划分至第一用户组并将在不同时间周期内在后时间周期的周活跃天数大于3天、在先时间周期的周活跃天数小于3天的用户划分至第二用户组,接着基于第一用户组和第二用户组中每个用户的用户时长所属的用户时长的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集,最后针对多维用户行为特征向量中的各维用户行为特征向量,针对多维用户行为特征向量中的各维用户行为特征向量,计算第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值,基于比值,确定与观测量正向关联的用户行为特征向量作为调节产品的观测量的控制量。
本公开的上述实施例提供的确定产品的观测量的控制量的方法,采用对相邻时间周期内的用户行为数据进行分析与处理,对变化的用户行为数据进行研究,通过排除一些固有因素更容易定位对观测量产生影响的原因,避免了现有技术只注重研究不同用户群体固有行为特征的问题,提高了分析的准确性;通过将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组,将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组,再基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集,然后针对多维用户行为特征向量中的各维用户行为特征向量,进行该维用户行为特征向量的关联系数的运算,消减了隐变量对观测量的影响,避免了传统方法在对业务目标指标进行提升时容易受除用户行为特征以外的其他因素影响的问题,对在先周期不活跃而在后周期活跃的用户与在先周期不活跃且在后周期也不活跃的用户进行比较,找到对观测量有帮助的用户行为特征,为产品优化提供数据支持。
进一步参考图4,其示出了确定产品的观测量的控制量的方法的另一个实施例的流程。该监测方法的流程400,包括以下步骤:
步骤401,针对预设产品,分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
在本实施例的一些可选的实现方式中,分析相邻时间周期内的所有用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量,包括:对相邻时间周期内的用户行为数据进行解析,得到每个用户的用户ID;基于每个用户的用户ID,确定每个用户的用户索引;在数据库中查找每个用户的用户索引,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量,数据库可以是本地数据库也可以是后台服务器的数据库。利用哈希运算,可以更快地得到查询结果,提高了查询速度,进一步提高了系统的数据处理效率。
步骤402,将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组;将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组。
步骤403,基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集。
在本实施例中,步骤401~403的具体操作与图2所示的实施例中的步骤201~203的操作基本相同,在此不再赘述。
步骤404,针对多维用户行为特征向量中的各维用户行为特征向量,对各用户组中各用户集的该维用户行为特征向量的平均值和该用户集在所有用户中的权重进行加权运算,并基于第二用户组的加权运算结果与第一用户组的加权运算结果的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将比值作为该维用户行为特征向量的关联系数。
在本实施例中,上述执行主体可以针对多维用户行为特征向量中的各维用户行为特征向量,对各用户组中各用户集的该维用户行为特征向量的平均值和该用户集在所有用户中的权重进行加权运算,并基于第二用户组的加权运算结果与第一用户组的加权运算结果的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将比值作为该维用户行为特征向量的关联系数。从不同的维度进行产品的观测量的控制量的分析,找到对观测量有帮助的用户行为特征,为产品优化提供数据支持。
步骤405,基于比值,判定该维用户行为特征向量与观测量的关联关系。
在本实施例中,上述执行主体可以对基于比值确定的关联系数进行检测,当关联系数接近于1说明该维用户行为特征与观测量关联较弱。当关联系数大于1说明该维用户行为特征与观测量正向关联,反之该维用户行为特征与观测量负向关联。通过对关联系数的判断将用户行为特征与观测量的关联关系进行分类,方便且有针对性的对关联关系进行判断与分析。
步骤406,响应于判定该维用户行为特征向量与观测量正向关联,确定该维用户行为特征向量作为调节产品的观测量的控制量。
在本实施例中,上述执行主体可以响应于该维用户行为特征向量与观测量正向关联,将该维用户行为特征向量作为调节产品的观测量的控制量。
步骤407,基于控制量与产品的相关性,优化产品的结构和/或产品策略。
在本实施例中,执行主体可以根据控制量与产品的相关性,对控制量进行排序,根据排序结果选择正向关联性最强的用户行为特征进行产品结构优化和产品策略的提升。
从图4中可以看出,与图2对应的实施例相比,本实施例中的确定产品的观测量的控制量的方法的流程400通过基于多维用户行为特征向量中的各维用户行为特征向量的关联系数,确定与观测量具有正向关联的用户行为特征向量作为控制量,基于控制量与产品的相关性,优化产品的结构和/或产品策略,准确地得到产品优化的方向或方法,避免了因分析方向的错误而导致产品迭代成本增加、收益降低的问题。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种确定产品的观测量的控制量的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的确定产品的观测量的控制量的装置500包括:分析单元501、分组单元502、分类单元503、第一运算单元504和确定单元505。其中,分析单元501被配置成分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量;分组单元502被配置成将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组,将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组;分类单元503被配置成基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集;第一运算单元504,被配置成针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值;确定单元505,被配置成基于比值,确定与观测量正向关联的用户行为特征向量作为调节产品的观测量的控制量。
在本实施例中,确定产品的观测量的控制量的装置500的分析单元501、分组单元502、分类单元503、第一运算单元504和确定单元505的具体处理及其所带来的技术效果可分别参考图2对应的实施例中的步骤201到步骤205的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,分析单元包括:解析模块,被配置成对相邻时间周期内的用户行为数据进行解析,得到每个用户的用户ID;运算模块,被配置成基于每个用户的用户ID,确定每个用户的用户索引;查找模块,被配置成在数据库中查找每个用户的用户索引,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
在本实施例的一些可选的实现方式中,该装置还包括:优化单元,被配置成基于控制量与产品的相关性,优化产品的结构和/或产品策略。
在本实施例的一些可选的实现方式中,装置还包括:第二运算单元,被配置成针对多维用户行为特征向量中的各维用户行为特征向量,对各用户组中各用户集的该维用户行为特征向量的平均值和该用户集在所有用户中的权重进行加权运算,并基于第二用户组的加权运算结果与第一用户组的加权运算结果的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将比值作为该维用户行为特征向量的关联系数。
在本实施例的一些可选的实现方式中,确定单元包括:判定模块,被配置成基于比值,判定该维用户行为特征向量与观测量的关联关系;确定模块,被配置成响应判定于该维用户行为特征向量与观测量正向关联,确定该维用户行为特征向量作为调节产品的观测量的控制量。
下面参考图6,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的中台服务器)600的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的中台服务器仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。
需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量;将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组;将在不同时间周期内在后时间周期的观测量大于预设阈值、在先时间周期的观测量小于预设阈值的用户划分至第二用户组;基于第一用户组和第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对第一用户组和第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集;针对多维用户行为特征向量中的各维用户行为特征向量,基于第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将比值作为该维用户行为特征向量的关联系数。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括分析单元、分组单元、分类单元和第一运算单元。这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,分析单元还可以被描述为“分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种确定产品的观测量的控制量的方法,包括:
针对预设产品,分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量,其中,所述观测量包括业务目标所要提升的指标和待分析数据中的至少一个;所述隐变量包括对所述观测量和/或所述多维用户行为特征向量有影响的隐含的变量;
将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组;将在不同时间周期内在后时间周期的观测量大于所述预设阈值、在先时间周期的观测量小于所述预设阈值的用户划分至第二用户组;
基于所述第一用户组和所述第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对所述第一用户组和所述第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集;
针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值;
基于所述比值,确定与所述观测量正向关联的用户行为特征向量作为调节所述产品的观测量的控制量。
2.根据权利要求1所述的确定产品的观测量的控制量的方法,其中,所述分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量,包括:
对相邻时间周期内的用户行为数据进行解析,得到每个用户的用户ID;
基于每个用户的用户ID,确定每个用户的用户索引;
在数据库中查找每个用户的用户索引,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
3.根据权利要求1所述的确定产品的观测量的控制量的方法,其中,所述方法还包括:
基于所述控制量与产品的相关性,优化产品的结构和/或产品策略。
4.根据权利要求1所述的确定产品的观测量的控制量的方法,其中,所述针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值,包括:
针对多维用户行为特征向量中的各维用户行为特征向量,对各用户组中各用户集的该维用户行为特征向量的平均值和该用户集在所有用户中的权重进行加权运算,并基于第二用户组的加权运算结果与第一用户组的加权运算结果的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将所述比值作为该维用户行为特征向量的关联系数。
5.根据权利要求1所述的确定产品的观测量的控制量的方法,其中,所述基于所述比值,确定与所述观测量正向关联的用户行为特征向量作为调节所述产品的观测量的控制量,包括:
基于所述比值,判定该维用户行为特征向量与所述观测量的关联关系;
响应于判定该维用户行为特征向量与所述观测量正向关联,确定该维用户行为特征向量作为调节所述产品的观测量的控制量。
6.一种确定产品的观测量的控制量的装置,所述装置包括:
分析单元,被配置成针对预设产品,分析相邻时间周期内的用户行为数据,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量,其中,所述观测量包括业务目标所要提升的指标和待分析数据中的至少一个;所述隐变量包括对所述观测量和/或所述多维用户行为特征向量有影响的隐含的变量;
分组单元,被配置成将在不同时间周期内观测量均小于预设阈值的用户划分至第一用户组;将在不同时间周期内在后时间周期的观测量大于所述预设阈值、在先时间周期的观测量小于所述预设阈值的用户划分至第二用户组;
分类单元,被配置成基于所述第一用户组和所述第二用户组中每个用户的隐变量所属的隐变量的分桶阈值区间,分别对所述第一用户组和所述第二用户组中的所有用户进行划分,得到第一用户组、第二用户组每组的多个用户集;
第一运算单元,被配置成针对多维用户行为特征向量中的各维用户行为特征向量,确定第二用户组中各用户集的该维用户行为特征向量的加权值与第一用户组中各用户集的该维用户行为特征向量的加权值的比值;
确定单元,被配置成基于所述比值,确定与所述观测量正向关联的用户行为特征向量作为调节所述产品的观测量的控制量。
7.根据权利要求6所述的确定产品的观测量的控制量的装置,其中,所述分析单元,包括:
解析模块,被配置成对相邻时间周期内的用户行为数据进行解析,得到每个用户的用户ID;
运算模块,被配置成基于每个用户的用户ID,确定每个用户的用户索引;
查找模块,被配置成在数据库中查找每个用户的用户索引,得到每个用户各个时间周期的以下数据:观测量、隐变量和多维用户行为特征向量。
8.根据权利要求6所述的确定产品的观测量的控制量的装置,还包括:
优化单元,被配置成基于所述控制量与产品的相关性,优化产品的结构和/或产品策略。
9.根据权利要求6所述的确定产品的观测量的控制量的装置,还包括:
第二运算单元,被配置成针对多维用户行为特征向量中的各维用户行为特征向量,对各用户组中各用户集的该维用户行为特征向量的平均值和该用户集在所有用户中的权重进行加权运算,并基于第二用户组的加权运算结果与第一用户组的加权运算结果的比值,确定第二用户组的该维用户行为特征向量与第一用户组的该维用户行为特征向量的比值,并将所述比值作为该维用户行为特征向量的关联系数。
10.根据权利要求6所述的确定产品的观测量的控制量的装置,所述确定单元,包括:
判定模块,被配置成基于所述比值,判定该维用户行为特征向量与所述观测量的关联关系;
确定模块,被配置成响应于判定该维用户行为特征向量与所述观测量正向关联,确定该维用户行为特征向量作为调节所述产品的观测量的控制量。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN202010160121.8A 2020-03-10 2020-03-10 确定产品的观测量的控制量的方法、装置、电子设备及介质 Active CN111352978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010160121.8A CN111352978B (zh) 2020-03-10 2020-03-10 确定产品的观测量的控制量的方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010160121.8A CN111352978B (zh) 2020-03-10 2020-03-10 确定产品的观测量的控制量的方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN111352978A CN111352978A (zh) 2020-06-30
CN111352978B true CN111352978B (zh) 2023-05-05

Family

ID=71196190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010160121.8A Active CN111352978B (zh) 2020-03-10 2020-03-10 确定产品的观测量的控制量的方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN111352978B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101263523A (zh) * 2005-09-12 2008-09-10 微软公司 使用观察到的顾客行为证据来调整产品策略
US8938463B1 (en) * 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
CN106599191A (zh) * 2016-12-14 2017-04-26 合网络技术(北京)有限公司 用户属性分析方法及装置
CN107609958A (zh) * 2017-10-16 2018-01-19 泰康保险集团股份有限公司 行为引导策略确定方法以及装置、存储介质以及电子设备
CN110741439A (zh) * 2017-06-14 2020-01-31 微软技术许可有限责任公司 针对相关性提供建议的行为修改

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7380262B2 (en) * 2001-06-12 2008-05-27 Thomson Licensing Method and apparatus for generating a list of suggested scheduled television programs
US20150161549A1 (en) * 2013-12-05 2015-06-11 Adobe Systems Incorporated Predicting outcomes of a modeled system using dynamic features adjustment

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101263523A (zh) * 2005-09-12 2008-09-10 微软公司 使用观察到的顾客行为证据来调整产品策略
US8938463B1 (en) * 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
CN106599191A (zh) * 2016-12-14 2017-04-26 合网络技术(北京)有限公司 用户属性分析方法及装置
CN110741439A (zh) * 2017-06-14 2020-01-31 微软技术许可有限责任公司 针对相关性提供建议的行为修改
CN107609958A (zh) * 2017-10-16 2018-01-19 泰康保险集团股份有限公司 行为引导策略确定方法以及装置、存储介质以及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
信息资源质量评价框架下价值感知的作用机理实证研究;王剑等;《现代情报》;20170715(第07期);全文 *

Also Published As

Publication number Publication date
CN111352978A (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN110263938B (zh) 用于生成信息的方法和装置
US11474926B2 (en) Method and system for measuring user engagement with content items
WO2022121801A1 (zh) 信息处理方法、装置和电子设备
CN111209347B (zh) 一种混合属性数据聚类的方法和装置
CN110362750B (zh) 目标用户确定方法、装置、电子设备和计算机可读介质
CN115841366B (zh) 物品推荐模型训练方法、装置、电子设备及存储介质
US10891514B2 (en) Image classification pipeline
CN107291835B (zh) 一种搜索词的推荐方法和装置
CN109992719B (zh) 用于确定推送优先级信息的方法和装置
CN112965916B (zh) 页面测试方法、页面测试装置、电子设备及可读存储介质
CN111352978B (zh) 确定产品的观测量的控制量的方法、装置、电子设备及介质
CN112449217B (zh) 一种推送视频的方法、装置、电子设备和计算机可读介质
CN111367778B (zh) 评估搜索策略的数据分析方法和装置
CN115203564A (zh) 信息流推荐方法、装置及计算机程序产品
CN112148865B (zh) 信息推送方法和装置
CN113722593A (zh) 事件数据处理方法、装置、电子设备和介质
CN112395510A (zh) 基于活跃度确定目标用户的方法和装置
CN113743604A (zh) 神经网络结构搜索和目标识别的方法和装置
CN109218411B (zh) 数据处理方法及装置、计算机可读存储介质、电子设备
CN111782933A (zh) 用于推荐书单的方法和装置
US8949249B2 (en) Techniques to find percentiles in a distributed computing environment
CN112906723A (zh) 一种特征选择的方法和装置
CN112311842A (zh) 用于信息交互的方法和装置
CN112348587B (zh) 信息推送方法、装置和电子设备
CN109240878B (zh) 数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant