发明内容
本发明的主要目的在于提供一种数据处理方法和装置,以解决现有技术中生成新的归因模型需重新实现所有数据的计算逻辑,导致开发成本高的问题。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理方法。
根据本发明的数据处理方法包括:获取查询第一参数的查询请求和预先保存的参数集合;读取参数集合中预存的与第一参数存在关联关系的多个第二参数、及多个第二参数与第一参数的第一关系式;从数据库中查询各个第二参数的第二参数值;使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。
进一步地,在从数据库中查询各个第二参数的第二参数值之后,数据处理方法还包括:将第二参数值按照查询请求中的查询维度合并得到数据表,其中,查询维度为第一参数的属性。
进一步地,使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值包括:从数据表中查询各个查询维度的第二参数值;按照查询维度计算第二参数值对应第一关系式的值,得到多个第一参数值。
进一步地,读取参数集合中预存的与第一参数存在关联关系的多个第二参数、及多个第二参数与第一参数的第一关系式包括:读取与第一参数存在关联关系的多个第二参数;基于关联关系确定多个第二参数之间的算术关系;保存关联关系和算术关系生成第一关系式。
进一步地,使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值包括:解析第一关系式得到第二关系式,其中,第二关系式包括各个第二参数值的第一节点和第一参数值的第二节点,各个第一节点之间具有算术关系,第二节点与各个第一节点之间具有关联关系;将各个第二参数值输入至对应的第一节点;计算第二参数值对应算术关系的值,得到第二节点的第一参数值。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种数据处理装置。
根据本发明的数据处理装置包括:获取模块,用于获取查询第一参数的查询请求和预先保存的参数集合;读取模块,用于读取参数集合中预存的与第一参数存在关联关系的多个第二参数、及多个第二参数与第一参数的第一关系式;查询模块,用于从数据库中查询各个第二参数的第二参数值;计算模块,用于使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。
进一步地,数据处理装置还包括:合并模块,用于在从数据库中查询各个第二参数的第二参数值之后,将第二参数值按照查询请求中的查询维度合并得到数据表,其中,查询维度为第一参数的属性。
进一步地,计算模块包括:查询子模块,用于从数据表中查询各个查询维度的第二参数值;第一计算子模块,用于按照查询维度计算第二参数值对应第一关系式的值,得到多个第一参数值。
进一步地,读取模块包括:读取子模块,用于读取与第一参数存在关联关系的多个第二参数;确定模块,用于基于关联关系确定多个第二参数之间的算术关系;保存模块,用于保存关联关系和算术关系生成第一关系式。
进一步地,计算模块包括:解析模块,用于解析第一关系式得到第二关系式,其中,第二关系式包括各个第二参数值的第一节点和第一参数值的第二节点,各个第一节点之间具有算术关系,第二节点与各个第一节点之间具有关联关系;输入模块,用于将各个第二参数值输入至对应的第一节点;第二计算子模块,用于计算第二参数值对应算术关系的值,得到第二节点的第一参数值。
采用本发明实施例,在获取查询第一参数的查询请求和预先保存的参数集合之后,读取参数集合中预存的与第一参数存在关联关系的多个第二参数及多个第二参数与第一参数的第一关系式,从数据库中查询各个第二参数的第二参数值,然后使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。在本发明上述实施例中,基于与第一参数(如新生成的归因模型)存在关联关系的多个第二参数(如已有的基础归因模型),使用第二参数与第一参数的第一关系式计算第一参数的参数值,无需重新设计归因模型并按照新设计的归因模型计算历史数据,避免了现有技术中开发额外的归因模型的问题,降低了归因模型的开发成本。通过本发明实施例,解决了现有技术中生成新的归因模型需重新实现所有数据的计算逻辑,导致开发成本高的问题,实现了降低归因模型的开发成本的效果。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种数据处理方法。
图1是根据本发明实施例的数据处理方法的流程图。如图1所示,该数据处理方法可以包括步骤如下:
步骤S102,获取查询第一参数的查询请求和预先保存的参数集合。
步骤S104,读取参数集合中预存的与第一参数存在关联关系的多个第二参数、及多个第二参数与第一参数的第一关系式。
步骤S106,从数据库中查询各个第二参数的第二参数值。
步骤S108,使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。
采用本发明实施例,在获取查询第一参数的查询请求和预先保存的参数集合之后,读取参数集合中预存的与第一参数存在关联关系的多个第二参数及多个第二参数与第一参数的第一关系式,从数据库中查询各个第二参数的第二参数值,然后使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。在本发明上述实施例中,基于与第一参数(如新生成的归因模型)存在关联关系的多个第二参数(如已有的基础归因模型),使用第二参数与第一参数的第一关系式计算第一参数的参数值,无需重新设计归因模型并按照新设计的归因模型计算历史数据,避免了现有技术中开发额外的归因模型的问题,降低了归因模型的开发成本。通过本发明实施例,解决了现有技术中生成新的归因模型需重新实现所有数据的计算逻辑,导致开发成本高的问题,实现了降低归因模型的开发成本的效果。
在上述的实施例中,第一参数可以是新生成的归因模型,第一参数值可以为新的归因模型的值;第二参数可以是基础归因模型,第二参数值可以为基础归因模型的值,其中,第一参数与第二参数存在关联关系;预先保存的参数集合(即保存有多个基础归因模型的集合)中保存有预先获取的第二参数的基础归因模型。
根据本发明上述实施例,在从数据库中查询各个第二参数的第二参数值之后,该数据处理方法还可以包括:将第二参数值按照查询请求中的查询维度合并得到数据表,其中,查询维度为第一参数的属性。可选地,第一参数的属性可以为:网页的点击率、和点击时间等。
具体地,参数集合中保存有各个第二参数及其参数值,第二参数及其参数值可以为基础归因模型及对应的模型的值。
图2是根据本发明实施例的一种可选的通过第二参数计算第一参数的示意图。下面结合图2详细介绍本发明上述实施例。
如图2所示,一个第二参数为计算周一的网页点击率的基础归因模型(即图2所示的FirstClick),该基础归因模型的第二参数值为按三个时段记录的周一的网页点击率,即8:00-16:00的网页点击率为200(即第二参数值),16:00-24:00的网页点击率为300(即第二参数值),00:00-8:00的网页点击率为100(即第二参数值);另一个第二参数为计算周二的网页点击率的基础归因模型(即图2所示的LastClick),该基础归因模型的第二参数值为按三个时段记录的周二的网页点击率,即8:00-16:00的网页点击率为150(即第二参数值),16:00-24:00的网页点击率为200(即第二参数值),00:00-8:00的网页点击率为50(即第二参数值),那么在将第二参数合并为数据表时,将相同时段的网页点击率放在同一行中,具体如图2的数据表所示。
在本发明的上述实施例中,使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值可以包括:从数据表中查询各个查询维度的第二参数值;按照查询维度计算第二参数值对应第一关系式的值,得到多个第一参数值。
具体地,从数据表中查询各个查询维度的第二参数值,使用第二参数值按照查询维度和第一关系式计算第一参数值,即从保存有各个第二参数及其参数值的数据表中读取各个查询维度对应的第二参数值,然后使用第二参数值,根据查询维度与第一关系式计算第一参数值。
根据本发明上述实施例,读取参数集合中预存的与第一参数存在关联关系的多个第二参数、及多个第二参数与第一参数的第一关系式可以包括:读取与第一参数存在关联关系的多个第二参数;基于关联关系确定多个第二参数之间的算术关系;保存关联关系和算术关系生成第一关系式。
具体地,读取与第一参数存在关联关系的多个第二参数,基于第一参数与第二参数的关联关系确定多个第二参数之间的算术关系,并保存该关联关系和算术关系生成第一关系式。
在上述的实施例中,基于第一参数与第二参数的关联关系,确定多个第二参数之间通过四则运算组合得到第一参数的计算方法即多个第二参数之间的算术关系。
在如图2所示的实施例中,若查询请求为获取周二与周一的网页点击率的差别的请求,参数集合中的两个基础归因模型(即上述实施例中的第二参数)分别为:FirstClick和LastClick,那么根据本发明上述实施例,若要获取周二与周一的网页点击率的差别,首先按照记录网页点击率的时间段将周一与周二的网页点击率合并到数据表中,根据第一参数与第二参数的关联关系可以得到,若要计算第一参数,计算FirstClick的第二参数值与LastClick的第二参数值之差即可,即确定多个第二参数之间的算术关系为FirstClick的第二参数值减去LastClick的第二参数值,保存该关联关系与算术关系生成第一关系式,即第一参数=FirstClick的第二参数值-LastClick的第二参数值。
进一步地,使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值可以包括:解析第一关系式得到第二关系式,其中,第二关系式包括各个第二参数值的第一节点和第一参数值的第二节点,各个第一节点之间具有算术关系,第二节点与各个第一节点之间具有关联关系;将各个第二参数值输入至对应的第一节点;计算第二参数值对应算术关系的值,得到第二节点的第一参数值。
具体地,将算术关系的第一关系式解析为计算机程序可以识别的计算公式,即将第一关系式解析为输入第二参数值即可通过程序计算得到第一参数值的第二关系式,其中,第二关系式中包括两个节点,各个第二参数值对应的第一节点之间具有与第一公式的算术关系的计算逻辑相同的关联关系。
通过本发明上述实施例,基于现有的基础归因模型的第二参数及其参数值,通过计算机程序使用简单的四则运算组合计算第一参数值,无需重新开发额外的归因模型,节省了开发归因模型的开发成本;并且通过计算机程序使用简单的四则运算组合计算第一参数值,无需现有技术中基于额外开发的归因模型,通过回溯用户的整个生命周期以获得第一参数值,降低了计算机的系统运行负荷。
在本发明的一个可选的实施例中,可以通过如下的数据处理方法实现本发明。
具体地,该数据处理方法可以包括如下步骤:
步骤S1,根据用户需求,使用四则运算组合基础归因模型,形成新派生模型的计算公式。
在该实施例中,用户需求通过上述实施例中的查询请求实现;新派生模型的计算公式即本发明上述实施例中的第一关系式。
步骤S2,根据计算公式中的基础归因模型,分别进行贡献查询得到各个数据。
具体地,根据计算公式中的基础归因模型,按照查询请求中的查询维度在数据库中进行贡献查询并得到各个数据,对应上述实施例中的从数据库中查询参数集合得到第二参数值。
其中,数据即为发明上述实施例中的第二参数值。
步骤S3,将查询到的数据按查询维度进行合并,得到数据表。
具体地,将查询到的数据按照查询请求中的查询维度合并,得到数据表。
步骤S4,使用解析器解析新派生模型的计算公式,生成表达式树。
其中,解析器为将新派生模型的计算公式解析为计算机可以识别的计算公式的程序,表达式树即为本发明上述实施例中的第二关系式。
步骤S5,基于表达式树和数据表,计算用户请求查询的数据。
具体地,将数据表中的各个行作为数据输入值,按照表达式树计算各个行对应的数据(即本发明上述实施例中的第二参数值),从而快速地计算出每一行的维度值(即数据)所对应的新派生模型的贡献值(即本发明上述实施例中的第一参数值)。
通过本发明上述实施例,在现有的基础归因模型的基础上,进行基础模型的组合搭配,通过四则运算和加权等方式形成新的归因模型,以达到加强和修正现有模型的目的。在上述实施例中,无需额外的模型开发成本和计算成本,直接在现有基础归因模型的查询结果上进行运算得出结果,灵活度高,成本小;并且,由于本发明实施例采用了简单的四则运算和加权的形式生成计算公式,计算简单快速,可以支持公式参数的实时调整。
在上述的实施例中,使用一个或多个已有归因模型及其查询数据,使用四则运算将已有归因模型及其查询数据组合成派生归因模型,按照派生归因模型进行计算后所得出的贡献值即为派生模型下该维度的维度值。
本发明实施例还提供了一种数据处理装置。该装置可以通过本发明上述实施例中的数据处理方法实现其功能。
图3是根据本发明实施例的数据处理装置的示意图。如图3所示,该数据处理装置可以包括:获取模块10、读取模块30、查询模块50以及计算模块70。
其中,获取模块10用于获取查询第一参数的查询请求和预先保存的参数集合;读取模块30用于读取参数集合中预存的与第一参数存在关联关系的多个第二参数、及多个第二参数与第一参数的第一关系式;查询模块50用于从数据库中查询各个第二参数的第二参数值;计算模块70用于使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。
采用本发明实施例,在获取查询第一参数的查询请求和预先保存的参数集合之后,读取参数集合中预存的与第一参数存在关联关系的多个第二参数及多个第二参数与第一参数的第一关系式,从数据库中查询各个第二参数的第二参数值,然后使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。在本发明上述实施例中,基于与第一参数(如新生成的归因模型)存在关联关系的多个第二参数(如已有的基础归因模型),使用第二参数与第一参数的第一关系式计算第一参数的参数值,无需重新设计归因模型并按照新设计的归因模型计算历史数据,避免了现有技术中开发额外的归因模型的问题,降低了归因模型的开发成本。通过本发明实施例,解决了现有技术中生成新的归因模型需重新实现所有数据的计算逻辑,导致开发成本高的问题,实现了降低归因模型的开发成本的效果。
在上述的实施例中,第一参数可以是新生成的归因模型,第一参数值可以为新的归因模型的值;第二参数可以是基础归因模型,第二参数值可以为基础归因模型的值,其中,第一参数与第二参数存在关联关系;预先保存的参数集合(即保存有多个基础归因模型的集合)中保存有预先获取的第二参数的基础归因模型。
根据本发明上述实施例,数据处理装置还可以包括:合并模块,用于在从数据库中查询各个第二参数的第二参数值之后,将第二参数值按照查询请求中的查询维度合并得到数据表,其中,查询维度为第一参数的属性。可选地,第一参数的属性可以为:网页的点击率、和点击时间等。
具体地,参数集合中保存有各个第二参数及其参数值,第二参数及其参数值可以为基础归因模型及对应的模型的值。
在上述实施例中,从数据表中读取各个第二参数及其参数值,并将各个第二参数及其参数值保存在一个数据表中,以便在按照第一关系式计算第一参数时使用。
在本发明的上述实施例中,计算模块可以包括:查询子模块,用于从数据表中查询各个查询维度的第二参数值;第一计算子模块,用于按照查询维度计算第二参数值对应第一关系式的值,得到多个第一参数值。
具体地,从数据表中查询各个查询维度的第二参数值,使用第二参数值按照查询维度和第一关系式计算第一参数值,即从保存有各个第二参数及其参数值的数据表中读取各个查询维度对应的第二参数值,然后使用第二参数值,根据查询维度与第一关系式计算第一参数值。
根据本发明上述实施例,读取模块可以包括:读取子模块,用于读取与第一参数存在关联关系的多个第二参数;确定模块,用于基于关联关系确定多个第二参数之间的算术关系;保存模块,用于保存关联关系和算术关系生成第一关系式。
具体地,读取与第一参数存在关联关系的多个第二参数,基于第一参数与第二参数的关联关系确定多个第二参数之间的算术关系,并保存该关联关系和算术关系生成第一关系式。
在上述的实施例中,基于第一参数与第二参数的关联关系,确定多个第二参数之间通过四则运算组合得到第一参数的计算方法即多个第二参数之间的算术关系。
进一步地,计算模块可以包括:解析模块,用于解析第一关系式得到第二关系式,其中,第二关系式包括各个第二参数值的第一节点和第一参数值的第二节点,各个第一节点之间具有算术关系,第二节点与各个第一节点之间具有关联关系;输入模块,用于将各个第二参数值输入至对应的第一节点;第二计算子模块,用于计算第二参数值对应算术关系的值,得到第二节点的第一参数值。
具体地,将算术关系的第一关系式解析为计算机程序可以识别的计算公式,即将第一关系式解析为输入第二参数值即可通过程序计算得到第一参数值的第二关系式,其中,第二关系式中包括两个节点,各个第二参数值对应的第一节点之间具有与第一公式的算术关系的计算逻辑相同的关联关系。
通过本发明上述实施例,基于现有的基础归因模型的第二参数及其参数值,通过计算机程序使用简单的四则运算组合计算第一参数值,无需重新开发额外的归因模型,节省了开发归因模型的开发成本;并且通过计算机程序使用简单的四则运算组合计算第一参数值,无需现有技术中基于额外开发的归因模型,通过回溯用户的整个生命周期以获得第一参数值,降低了计算机的系统运行负荷。
本实施例中所提供的各个模块与方法实施例对应步骤所提供的使用方法相同、应用场景也可以相同。当然,需要注意的是,上述模块涉及的方案可以不限于上述实施例中的内容和场景,且上述模块可以运行在计算机终端或移动终端,可以通过软件或硬件实现。
从以上的描述中,可以看出,本发明实现了如下技术效果:
采用本发明实施例,在获取查询第一参数的查询请求和预先保存的参数集合之后,读取参数集合中预存的与第一参数存在关联关系的多个第二参数及多个第二参数与第一参数的第一关系式,从数据库中查询各个第二参数的第二参数值,然后使用第一关系式对多个第二参数的第二参数值进行计算,得到第一参数的第一参数值。在本发明上述实施例中,基于与第一参数(如新生成的归因模型)存在关联关系的多个第二参数(如已有的基础归因模型),使用第二参数与第一参数的第一关系式计算第一参数的参数值,无需重新设计归因模型并按照新设计的归因模型计算历史数据,避免了现有技术中开发额外的归因模型的问题,降低了归因模型的开发成本。通过本发明实施例,解决了现有技术中生成新的归因模型需重新实现所有数据的计算逻辑,导致开发成本高的问题,实现了降低归因模型的开发成本的效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。