CN109241486A - 数据分析方法、装置、设备及计算机存储介质 - Google Patents

数据分析方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN109241486A
CN109241486A CN201811076627.XA CN201811076627A CN109241486A CN 109241486 A CN109241486 A CN 109241486A CN 201811076627 A CN201811076627 A CN 201811076627A CN 109241486 A CN109241486 A CN 109241486A
Authority
CN
China
Prior art keywords
searches
volumes
time period
target search
preset time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811076627.XA
Other languages
English (en)
Inventor
王雨卉
李哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rajax Network Technology Co Ltd
Lazhasi Network Technology Shanghai Co Ltd
Original Assignee
Lazhasi Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lazhasi Network Technology Shanghai Co Ltd filed Critical Lazhasi Network Technology Shanghai Co Ltd
Priority to CN201811076627.XA priority Critical patent/CN109241486A/zh
Publication of CN109241486A publication Critical patent/CN109241486A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例提供数据分析方法、装置、设备及计算机存储介质。数据分析方法包括:获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;呈现所述增长指标。上述方法可以了解每个特定预设时间段内每个目标搜索对象的增长指标,并且判断每个目标搜索对象的搜索量在一个较长的时间维度内的增长趋势,有助于捕捉那些搜索量涨势明显的目标搜索对象,给平台运营提前提供预警和数据支持。

Description

数据分析方法、装置、设备及计算机存储介质
技术领域
本公开实施例涉及互联网技术领域,尤其涉及数据分析方法、装置、设备及计算机存储介质。
背景技术
在当前的用户目标搜索对象监控中,只能看到每天每个目标搜索对象的搜索量以及所有目标搜索对象的搜索量排序,而无法了解每个目标搜索对象的搜索量在一个更长的时间维度内(比如14天、21天等内)是什么样的增长趋势等,从而难以给平台运营、市场等提供数据支持。
发明内容
在实际应用中,发明人发现:相关技术中的数据分析分析方法在存在如下问题:难以在较长时间内对目标搜索对象的搜索量增长趋势进行分析。
为了解决上述技术问题,本公开第一方面提供了一种数据分析方法,包括:
获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;
呈现所述增长指标。
结合第一方面,本公开在第一方面的第一种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性;
根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标。
结合第一方面的第一种实现方式,本公开在第一方面的第二种实现方式中,所述多个增长特性包括:表示所述预设时间段内针对所述目标搜索对象的搜索量趋势的第一增长特性、表示所述预设时间段内针对所述目标搜索对象的搜索量趋势波动性的第二增长特性、和表示所述预设时间段内针对所述目标搜索对象的搜索量短期趋势第三增长特性。
结合第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述增长指标包括搜索量增长指数,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
根据所述多个增长特性确定所述目标搜索对象在所述预设时间段内的搜索量增长指数。
结合第一方面的第二种实现方式,本公开在第一方面的第四种实现方式中,所述增长指标包括搜索量增长类型,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
对预设时间段内针对所述目标搜索对象计算的所述多个增长特性进行排序,以确定所述目标搜索对象在所述预设时间段内的搜索量增长类型。
结合第一方面的第一种实现方式至第四种实现方式中的任一种,本公开在第一方面的第五种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程,其中,所述一元线性回归方程的自变量为时间,因变量为与特定时间对应的针对所述目标搜索对象的搜索量;
计算所述一元线性回归方程所表示的趋势线的斜率以获得所述第一增长特性。
结合第一方面的第一种实现方式至第四种实现方式中的任一种,本公开在第一方面的第六种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据构成曲线;
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程以及所述一元线性回归方程所表示的趋势线;
利用所述曲线和所述趋势线相交区域的面积计算出面积差以获得所述第二增长特性。
结合第一方面的第一种实现方式至第四种实现方式中的任一种,本公开在第一方面的第七种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算出当前时间向前特定时间段内的搜索量增长作为所述第三增长特性。
本公开第二方面提供了一种数据分析装置,包括:
获取模块,被配置为获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;
确定模块,被配置为利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;
呈现模块,被配置为呈现所述增长指数。
本公开第三方面提供了一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现以下步骤:
获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;
利用所述预设时间段内对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;
呈现所述增长指标。
结合第三方面,本公开在第三方面的第一种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性;
根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标。
结合第三方面的第一种实现方式,本公开在第三方面的第二种实现方式中,所述多个增长特性包括:表示所述预设时间段内针对所述目标搜索对象的搜索量趋势的第一增长特性、表示所述预设时间段内针对所述目标搜索对象的搜索量趋势波动性的第二增长特性、和表示所述预设时间段内针对所述目标搜索对象的搜索量短期趋势第三增长特性。
结合第三方面的第二种实现方式,本公开在第三方面的第三种实现方式中,所述增长指标包括搜索量增长指数,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
根据所述多个增长特性确定所述目标搜索对象在所述预设时间段内的搜索量增长指数。
结合第三方面的第二种实现方式,本公开在第三方面的第四种实现方式中,所述增长指标包括搜索量增长类型,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
对预设时间段内针对所述目标搜索对象计算的所述多个增长特性进行排序,以确定所述目标搜索对象在所述预设时间段内的搜索量增长类型。
结合第三方面的第一种实现方式至第四种实现方式中的任一种,本公开在第三方面的第五种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程,其中,所述一元线性回归方程的自变量为时间,因变量为与特定时间对应的针对所述目标搜索对象的搜索量;
计算所述一元线性回归方程所表示的趋势线的斜率以获得所述第一增长特性。
结合第三方面的第一种实现方式至第四种实现方式中的任一种,本公开在第三方面的第六种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据构成曲线;
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程以及所述一元线性回归方程所表示的趋势线;
利用所述曲线和所述趋势线相交区域的面积计算出面积差以获得所述第二增长特性。
结合第三方面的第一种实现方式至第四种实现方式中的任一种,本公开在第三方面的第七种实现方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算出当前时间向前特定时间段内的搜索量增长作为所述第三增长特性。
本公开第四方面提供了一种计算机存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面、第一方面的第一种实现方式至第七种实现方式中的任一项所述的方法。
在本公开实施方式中,通过获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;呈现所述增长指标,可以了解每个特定预设时间段内每个目标搜索对象的增长指标,并且判断每个目标搜索对象的搜索量在一个较长的时间维度内的增长趋势,有助于捕捉那些搜索量涨势明显的目标搜索对象,给平台运营提前提供预警和数据支持。针对某个目标搜索对象的搜索量的涨势,平台运营可以采取诸如线下推广、线上流量倾斜、加大补贴等措施。
本公开的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本公开实施例或相关技术中的技术方案,下面将对示例性实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些示例性实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出根据本公开一实施方式的数据分析方法的流程图;
图2示出根据本公开一实施方式的数据分析方法中的步骤S102的一个示例的流程图;
图3示出根据图2所示的本公开另一实施方式的数据分析方法中的步骤S201的一个示例的流程图;
图4示出根据图2所示的本公开另一实施方式的数据分析方法中的步骤S201的另一个示例的流程图;
图5示出根据本公开一实施方式的数据分析装置的结构框图;
图6示出根据本公开一实施方式数据分析方法的应用场景中的搜索量趋势的示例;
图7示出根据本公开另一实施方式数据分析方法的应用场景中的搜索量趋势波动性的示例;
图8示出根据本公开另一实施方式数据分析方法的应用场景中的搜索量短期趋势的示例;
图9示出根据本公开另一实施方式数据分析方法的应用场景中的搜索量的第一增长特性的确定方法的一个示例;
图10示出根据本公开另一实施方式数据分析方法的应用场景中的搜索量的第二增长特性的确定方法的一个示例;
图11示出根据本公开一实施方式的设备的结构框图;
图12是适于用来实现根据本公开一实施方式的数据分析方法的计算机系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开方案,下面将结合本公开示例性实施例中的附图,对本公开示例性实施例中的技术方案进行清楚、完整地描述。
在本公开的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本公开示例性实施例中的附图,对本公开示例性实施例中的技术方案进行清楚、完整地描述,显然,所描述的示例性实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
图1示出根据本公开一实施方式的数据分析方法的流程图。该方法可以包括步骤S101、S102和S103。
在步骤S101中,获取搜索量数据,其中,搜索量数据包括预设时间段内的针对目标搜索对象的搜索量的时间序列数据;
在步骤S102中,利用预设时间段内针对目标搜索对象的搜索量的时间序列数据,确定表示目标搜索对象在预设时间段内的搜索量增长趋势的增长指标;
在步骤S103中,呈现增长指标。
在本公开的一个实施方式中,时间序列数据可以指的是指将同一统计标准的数值按其发生的时间先后顺序排列而成的数列。因此,预设时间段内的针对目标搜索对象的搜索量的时间序列数据可以指的是将针对一个或多个目标搜索对象的搜索量按照在预设时间段内的时间先后顺序排列而成的序列数据。在本公开的一个实施方式中,获取的搜索量数据可以是每日的搜索量数据,也可以是每几日的搜索量数据或每几小时的搜索量数据。在本公开的一个实施方式中,目标搜索对象可以被实现为搜索词、搜索字和搜索句子。
在本公开的一个实施方式中,增长指标可以包括增长指数、增长类型等指标。例如,增长指数越大表示目标搜索对象在预设时间段内的搜索量增长趋势越明显,增长类型表示目标搜索对象在所述预设时间段内的搜索量以何种方式增长。在本公开的一个实施方式中,可以存在多个目标搜索对象,从而可以通过增长指标确定不同的目标搜索对象在预设时间段内各自的搜索量增长趋势。在本公开的一个实施方式中,可以在预设时间段内在多个地域对多个目标搜索对象进行搜索,从而可以通过增长指标确定不同的目标搜索对象在不同的地域在预设时间段内各自的搜索量增长趋势。
在本公开的一个实施方式中,可以通过数字、图形、文字等方式呈现增长指标。
在本公开实施方式中,通过获取搜索量数据,其中,搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;利用预设时间段内针对目标搜索对象的搜索量的时间序列数据,确定表示目标搜索对象在预设时间段内的搜索量增长趋势的增长指标;呈现增长指标,可以了解每个特定预设时间段内每个目标搜索对象的增长指标,并且判断每个目标搜索对象的搜索量在一个较长的时间维度内的增长趋势,有助于捕捉那些搜索量涨势明显的目标搜索对象,给平台运营提前提供预警和数据支持。针对某个目标搜索对象的搜索量的涨势,平台运营可以采取诸如线下推广、线上流量倾斜、加大补贴等措施。
图2示出根据本公开一实施方式的数据分析方法中的步骤S102的一个示例的流程图。该实施方式中示出了步骤S102的实施例所包括的步骤S201和S202。
在步骤S201中,利用预设时间段内针对目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对目标搜索对象的搜索量的多个增长特性。
在步骤S202中,根据多个增长特性确定表示目标搜索对象在预设时间段内的搜索量增长趋势的增长指标。
在本公开的一个实施方式中,多个增长特性包括:表示预设时间段内针对目标搜索对象的搜索量趋势的第一增长特性、表示预设时间段内针对目标搜索对象的搜索量趋势波动性的第二增长特性、和表示预设时间段内针对目标搜索对象的搜索量短期趋势第三增长特性。
在本公开的一个示例中,预设时间段内针对目标搜索对象的搜索量趋势如图6所示,其中,横坐标是时间,纵坐标是搜索量,直线601是利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算得到的一元线性回归方程的趋势线,线602是针对目标搜索对象的搜索量的时间序列数据的移动平均值,线603是针对目标搜索对象的搜索量的时间序列数据。从图6中可见,预设时间段内针对目标搜索对象的搜索量趋势是逐渐增长类型,即,呈现逐渐增长的态势。在本公开的实施例中,逐渐增长态势指的是搜索量在保持相对平缓却一直持续增长的态势。
在本公开的一个示例中,预设时间段内针对目标搜索对象的搜索量趋势波动性如图7所示,其中,横坐标是时间,纵坐标是搜索量,直线701是利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算得到的一元线性回归方程的趋势线,线702是针对目标搜索对象的搜索量的时间序列数据的移动平均值,线703是针对目标搜索对象的搜索量的时间序列数据。从图7中可见,预设时间段内针对目标搜索对象的搜索量趋势波动性是增长且持续类型,即,呈现增长且持续的态势。在本公开的实施例中,增长且持续的态势表示搜索量增长到一定水平后即保持在该水平附近的态势。
在本公开的一个示例中,预设时间段内针对目标搜索对象的搜索量短期趋势如图8所示,其中,横坐标是时间,纵坐标是搜索量,直线801是利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算得到的一元线性回归方程的趋势线,线802是针对目标搜索对象的搜索量的时间序列数据的移动平均值,线803是针对目标搜索对象的搜索量的时间序列数据。从图8中可见,预设时间段内针对目标搜索对象的搜索量短期趋势是激增类型,即,呈现激增的态势。在本公开的实施例中,激增的态势表示搜索量一直平缓,直到某一时间突然开始急速增长的态势。
在本公开的一个实施方式中,增长指标包括搜索量增长指数,步骤S202包括:根据多个增长特性确定目标搜索对象在预设时间段内的搜索量增长指数。在本公开的一个实施方式中,根据多个增长特性确定目标搜索对象在预设时间段内的搜索量增长指数包括:通过将三个增长特性标准化后求和来计算搜索量增长指数。
在本公开的一个实施方式中,对增长特性进行标准化指的是当存在多个目标搜索对象时,对预设时间段内对每一目标搜索对象的搜索量的每一增长特性进行标准化。对增长特性标准化可以使得对增长特性进行比较、识别以及计算增长指数等进一步处理变得方便。
在本公开的一个实施方式中,可以按照如下公式将三个增长特性标准化:
标准化后的增长特性=(预设时间段内针对目标搜索对象的搜索量的增长特性-预设时间段内的对全部目标搜索对象的搜索量的对应增长特性中的最小值)/(预设时间段内的对全部目标搜索对象的搜索量的对应增长特性中的最大值-预设时间段内的对全部目标搜索对象的搜索量的对应增长特性中的最小值)。
例如,标准化后的第一增长特性=(预设时间段内针对目标搜索对象的搜索量的第一增长特性-预设时间段内的对全部目标搜索对象的搜索量的第一增长特性中的最小值)/(预设时间段内的对全部目标搜索对象的搜索量的第一增长特性中的最大值-预设时间段内的对全部目标搜索对象的搜索量的第一增长特性中的最小值)。与对第一增长特性进行标准化的计算方式类似,可以对第二增长特性和第三增长特性进行标准化。
在本公开的一个实施方式中,在呈现增长指标时可以呈现目标搜索对象在预设时间段内的搜索量增长指数。
在本公开的一个实施方式中,增长指标包括搜索量增长类型,步骤S202包括:对预设时间段内针对目标搜索对象计算的多个增长特性进行排序,以确定目标搜索对象在预设时间段内的搜索量增长类型。
在本公开的一个实施方式中,当一个目标搜索对象的一个增长特性在全部目标搜索对象的对应增长特性中排名比该目标搜索对象的另外两个增长特性在全部目标搜索对象的对应的两个增长特性中排名更高时,则将目标搜索对象的三个增长特性中排名最高的增长特性所表示的增长类型确定为预设时间段内对目标搜索对象的搜索量的增长类型。
在本公开的一个实施方式中,在呈现增长指标时可以呈现目标搜索对象在预设时间段内的搜索量增长类型。
图3示出根据图2所示的本公开另一实施方式的数据分析方法中的步骤S201的一个示例的流程图。如图3所示,步骤S201包括步骤S301和步骤S302。
在步骤S301中,利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程,其中,一元线性回归方程的自变量为时间,因变量为与特定时间对应的针对目标搜索对象的搜索量。
在步骤S302中,计算一元线性回归方程所表示的趋势线的斜率以获得第一增长特性。
在本公开的一个实施方式中,一元线性回归方程所表示的趋势线的斜率计算公式如下:
斜率=Δy/Δx
其中,Δx为时间增长量,Δy为在Δx所表示的时间增长量期间针对目标搜索对象的搜索量的增长量,其中,当斜率在目标搜索对象的三个增长特性中排名最高时,表示预设时间段内针对目标搜索对象的搜索量增长类型为搜索量趋势,例如逐渐增长类型。
图9示出根据本公开另一实施方式数据分析方法的应用场景中的搜索量的第一增长特性的确定方法的一个示例。
如图9所示,X轴表示时间,Y轴表示搜索量,趋势线901的斜率θ如图所示,斜率θ=Δy/Δx,Δy=y2-y1,Δx=x2-x1。在一个实施例中,斜率表示了搜索量增长的中长期趋势。
图4示出根据图2所示的本公开另一实施方式的数据分析方法中的步骤S201的另一个示例的流程图。如图3所示,步骤S201包括步骤S401、步骤S402和步骤S403。
在步骤S401中,利用预设时间段内针对目标搜索对象的搜索量的时间序列数据构成曲线。
在步骤S402中,利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程以及一元线性回归方程所表示的趋势线。
在步骤S403中,利用曲线和趋势线相交区域的面积计算出面积差以获得第二增长特性。
在本公开的一个实施方式中,面积差计算公式如下:
面积差=Δw1–Δw2
其中,Δw1的计算公式为:Δw1=距当前时间最近的第一时间段的趋势线上的曲线面积-距当前时间最近的第一时间段的趋势线下的曲线面积,
Δw2的计算公式为:Δw2=距当前时间第二近的第二时间段的趋势线上的曲线面积-距当前时间第二近的第二时间段的趋势线下的曲线面积,
其中,第一时间段和第二时间段连续且不相交,并且第一时间段和第二时间段长度相等且属于预设时间段,其中,当面积差在目标搜索对象的三个增长特性中排名最高时,表示预设时间段内针对目标搜索对象的搜索量增长类型为搜索量趋势波动性,例如增长且持续类型。
在本公开的实施例中,距当前时间最近的第一时间段可以是例如距当前时间最近的第一周,距当前时间最近的第二时间段可以是例如距当前时间最近的第二周。当然,本公开实施例不限于此,第一时间段和第二时间段可以任意定义。
在本公开的实施例中,(Δw1–Δw2)越小,表示搜索量趋势波动越小。
图10示出根据本公开另一实施方式数据分析方法的应用场景中的搜索量的第二增长特性的确定方法的一个示例。
如图10所示,横轴表示时间,纵轴表示搜索量,直线1001是利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算得到的一元线性回归方程的趋势线,线1002是利用预设时间段内针对目标搜索对象的搜索量的时间序列数据所构成的曲线,虚线1003是确定第一时间段的起算时间点之后的时间段内对目标搜索对象的搜索量的时间序列数据所构成的曲线。在一个实施例中,面积差表示搜索量增长的中短期趋势。
在本公开的一个实施方式中,步骤S201包括:利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算出当前时间向前特定时间段内的搜索量增长作为第三增长特性。
在本公开的一个实施方式中,在利用预设时间段内针对目标搜索对象的搜索量的时间序列数据计算出的当前时间向前特定时间段的搜索量增长中,
向前特定时间段的搜索量增长=(向前特定时间段的搜索量变化平均值-预设时间段内搜索量单位时间变化平均值的中位数)/预设时间段内搜索量单位时间变化平均值的标准差
其中,向前特定时间段的搜索量变化平均值是当前时间向前特定时间段对目标搜索对象的搜索量的移动平均值,预设时间段内搜索量单位时间变化平均值的中位数是利用预设时间段内每一特定时间段针对目标搜索对象的搜索量的移动平均值的中位数,预设时间段内搜索量单位时间变化平均值的标准差是利用预设时间段内每一特定时间段针对目标搜索对象的搜索量的移动平均值的标准差,其中,当向前特定时间段的搜索量增长在三个增长特性中排名最高时,表示预设时间段内针对目标搜索对象的搜索量增长类型为搜索量短期趋势,例如激增类型。
在本公开的一个实施方式中,特定时间段可以以分、小时、天等作为单位。例如,向前特定时间段可以是向前一天,每一特定时间段可以是每一天。
在本公开的实施方式中,移动平均的时期个数可以是2个时期,3个时期等等。例如,当利用21天内对目标搜索对象的搜索量的时间序列数据计算向前特定时间段的搜索量变化平均值是当前时间向前特定时间段对目标搜索对象的搜索量的移动平均值时,如果移动平均的天数是2天,则可以得到20个(天)移动平均值,预设时间段内搜索量单位时间变化平均值的中位数即为20个移动平均值的中位数,预设时间段内搜索量单位时间变化平均值的标准差为20个移动平均值的标准差。
通过以上对搜索量趋势、搜索量趋势波动性和激增类型的计算方式的描述,可以使得平台运营方对目标搜索对象的增长类型进行精确的判断,给平台运营提前提供预警。
图5示出根据本公开一实施方式的数据分析装置的结构框图。该装置可以包括获取模块501、确定模块502和呈现模块503。
获取模块501被配置为获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据。
确定模块502被配置为利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标。
呈现模块503被配置为呈现所述增长指标。
以上描述了数据分析装置的内部功能和结构,在一个可能的设计中,该数据分析装置的结构可实现为数据分析设备,如图11中所示,该处理设备1100可以包括处理器1101以及存储器1102。
所述存储器1102用于存储支持数据分析系统执行上述任一实施例中数据分析方法的程序,所述处理器1101被配置为用于执行所述存储器1102中存储的程序。
所述存储器1102用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器1101执行以实现以下步骤:
获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;
利用所述预设时间段内对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;
呈现所述增长指标。
在本公开的一个实施方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性;
根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标。
在本公开的一个实施方式中,所述多个增长特性包括:表示所述预设时间段内针对所述目标搜索对象的搜索量趋势的第一增长特性、表示所述预设时间段内针对所述目标搜索对象的搜索量趋势波动性的第二增长特性、和表示所述预设时间段内针对所述目标搜索对象的搜索量短期趋势第三增长特性。
在本公开的一个实施方式中,所述增长指标包括搜索量增长指数,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
根据所述多个增长特性确定所述目标搜索对象在所述预设时间段内的搜索量增长指数。
在本公开的一个实施方式中,所述增长指标包括搜索量增长类型,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
对预设时间段内针对所述目标搜索对象计算的所述多个增长特性进行排序,以确定所述目标搜索对象在所述预设时间段内的搜索量增长类型。
在本公开的一个实施方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程,其中,所述一元线性回归方程的自变量为时间,因变量为与特定时间对应的针对所述目标搜索对象的搜索量;
计算所述一元线性回归方程所表示的趋势线的斜率以获得所述第一增长特性。
在本公开的一个实施方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据构成曲线;
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程以及所述一元线性回归方程所表示的趋势线;
利用所述曲线和所述趋势线相交区域的面积计算出面积差以获得所述第二增长特性。
在本公开的一个实施方式中,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算出当前时间向前特定时间段内的搜索量增长作为所述第三增长特性。
其中,所述数据分析设备的结构中还可以包括通信接口,用于数据分析设备与其他设备或通信网络通信。
本公开示例性实施例还提供了一种计算机存储介质,用于储存所述数据分析系统所用的计算机软件指令,其包含用于执行上述任一实施例中数据分析方法所涉及的程序。
图12是适于用来实现根据本公开一实施方式的数据分析方法的计算机系统的结构示意图。
如图12所示,计算机系统1200包括中央处理单元(CPU)1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行上述图1所示的实施方式中的各种处理。在RAM1203中,还存储有系统1200操作所需的各种程序和数据。CPU1201、ROM1202以及RAM1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本公开的实施方式,上文参考图1描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行图1的数据处理方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。
附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种数据分析方法,其特征在于,包括:
获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;
呈现所述增长指标。
2.根据权利要求1所述的方法,其特征在于,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性;
根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标。
3.根据权利要求2的方法,其特征在于,所述多个增长特性包括:表示所述预设时间段内针对所述目标搜索对象的搜索量趋势的第一增长特性、表示所述预设时间段内针对所述目标搜索对象的搜索量趋势波动性的第二增长特性、和表示所述预设时间段内针对所述目标搜索对象的搜索量短期趋势第三增长特性。
4.根据权利要求3所述的方法,其特征在于,所述增长指标包括搜索量增长指数,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
根据所述多个增长特性确定所述目标搜索对象在所述预设时间段内的搜索量增长指数。
5.根据权利要求3所述的方法,其特征在于,所述增长指标包括搜索量增长类型,所述根据所述多个增长特性确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标,包括:
对预设时间段内针对所述目标搜索对象计算的所述多个增长特性进行排序,以确定所述目标搜索对象在所述预设时间段内的搜索量增长类型。
6.根据权利要求2-5任一项所述的方法,其特征在于,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程,其中,所述一元线性回归方程的自变量为时间,因变量为与特定时间对应的针对所述目标搜索对象的搜索量;
计算所述一元线性回归方程所表示的趋势线的斜率以获得所述第一增长特性。
7.根据权利要求2-5任一项所述的方法,其特征在于,所述利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,计算预设时间段内针对所述目标搜索对象的搜索量的多个增长特性,包括:
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据构成曲线;
利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据计算得到一元线性回归方程以及所述一元线性回归方程所表示的趋势线;
利用所述曲线和所述趋势线相交区域的面积计算出面积差以获得所述第二增长特性。
8.一种数据分析装置,其特征在于,包括:
获取模块,被配置为获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;
确定模块,被配置为利用所述预设时间段内针对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;
呈现模块,被配置为呈现所述增长指标。
9.一种电子设备,其特征在于,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现以下步骤:
获取搜索量数据,其中,所述搜索量数据包括预设时间段内针对目标搜索对象的搜索量的时间序列数据;
利用所述预设时间段内对所述目标搜索对象的搜索量的时间序列数据,确定表示所述目标搜索对象在所述预设时间段内的搜索量增长趋势的增长指标;
呈现所述增长指标。
10.一种计算机存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现如权利要求1-7任一项所述的方法。
CN201811076627.XA 2018-09-14 2018-09-14 数据分析方法、装置、设备及计算机存储介质 Pending CN109241486A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811076627.XA CN109241486A (zh) 2018-09-14 2018-09-14 数据分析方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811076627.XA CN109241486A (zh) 2018-09-14 2018-09-14 数据分析方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN109241486A true CN109241486A (zh) 2019-01-18

Family

ID=65059356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811076627.XA Pending CN109241486A (zh) 2018-09-14 2018-09-14 数据分析方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN109241486A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111212337A (zh) * 2019-12-27 2020-05-29 中国联合网络通信集团有限公司 端口分类方法及装置
CN111369121A (zh) * 2020-02-27 2020-07-03 深圳市赤狐软件技术有限公司 一种客户数据的处理方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033929A (zh) * 2010-12-15 2011-04-27 百度在线网络技术(北京)有限公司 热点视频集的展现方法及装置
CN102937991A (zh) * 2012-10-31 2013-02-20 北京奇虎科技有限公司 搜索导航系统和方法
CN104063450A (zh) * 2014-06-23 2014-09-24 百度在线网络技术(北京)有限公司 热点信息分析方法及设备
CN105183840A (zh) * 2015-09-02 2015-12-23 百度在线网络技术(北京)有限公司 信息处理方法及装置
CN107180093A (zh) * 2017-05-15 2017-09-19 北京奇艺世纪科技有限公司 信息搜索方法及装置和时效性查询词识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033929A (zh) * 2010-12-15 2011-04-27 百度在线网络技术(北京)有限公司 热点视频集的展现方法及装置
CN102937991A (zh) * 2012-10-31 2013-02-20 北京奇虎科技有限公司 搜索导航系统和方法
CN104063450A (zh) * 2014-06-23 2014-09-24 百度在线网络技术(北京)有限公司 热点信息分析方法及设备
CN105183840A (zh) * 2015-09-02 2015-12-23 百度在线网络技术(北京)有限公司 信息处理方法及装置
CN107180093A (zh) * 2017-05-15 2017-09-19 北京奇艺世纪科技有限公司 信息搜索方法及装置和时效性查询词识别方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111212337A (zh) * 2019-12-27 2020-05-29 中国联合网络通信集团有限公司 端口分类方法及装置
CN111212337B (zh) * 2019-12-27 2022-02-25 中国联合网络通信集团有限公司 端口分类方法及装置
CN111369121A (zh) * 2020-02-27 2020-07-03 深圳市赤狐软件技术有限公司 一种客户数据的处理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN110704751B (zh) 数据处理方法、装置、电子设备及存储介质
US8880532B2 (en) Interestingness of data
US9811584B2 (en) Information retrieval system, method, and program
CN110995524B (zh) 流量数据监控方法、装置、电子设备和计算机可读介质
EP2096565A1 (en) Computing engine design variables using genetic algorithms
CN109241486A (zh) 数据分析方法、装置、设备及计算机存储介质
CN107291835B (zh) 一种搜索词的推荐方法和装置
CN111506731A (zh) 一种训练字段分类模型的方法、装置及设备
CN113515399A (zh) 数据异常检测方法及装置
CN112182067A (zh) 个体身高预测方法、装置、电子设备及存储介质
CN114238993A (zh) 风险检测方法、装置、设备及介质
CN109408566A (zh) 一种智能图表推荐方法及装置
CN111136655B (zh) 一种获取巡检点的方法及装置
CN110674399B (zh) 确定搜索项目的顺序的方法和装置
US20150160274A1 (en) Method and apparatus for power estimation
CN111428117A (zh) 应用程序的数据获取方法和装置
US20070136410A1 (en) Finite impulse response filter for a time-synchronized system
CN110931136B (zh) 事件的搜索方法及装置、计算机介质和电子设备
CN114020813A (zh) 基于哈希算法的数据比对方法、装置、设备及存储介质
JP2018190049A (ja) 表示装置、表示方法及びプログラム
CN115511014B (zh) 信息匹配方法、装置、设备及存储介质
CN111737555A (zh) 热点关键词的选取方法、设备和存储介质
US10277694B2 (en) Method for determining a trend of a user engagement metric
CN110347905A (zh) 确定信息关联度、信息推荐的方法、装置和存储介质
JP6790745B2 (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190118