CN106095895A - 信息推送方法和装置 - Google Patents

信息推送方法和装置 Download PDF

Info

Publication number
CN106095895A
CN106095895A CN201610398826.7A CN201610398826A CN106095895A CN 106095895 A CN106095895 A CN 106095895A CN 201610398826 A CN201610398826 A CN 201610398826A CN 106095895 A CN106095895 A CN 106095895A
Authority
CN
China
Prior art keywords
data
measurement period
user behavior
unit
state parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610398826.7A
Other languages
English (en)
Other versions
CN106095895B (zh
Inventor
韩雷
韩艳
曹永创
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610398826.7A priority Critical patent/CN106095895B/zh
Publication of CN106095895A publication Critical patent/CN106095895A/zh
Application granted granted Critical
Publication of CN106095895B publication Critical patent/CN106095895B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Abstract

本申请公开了信息推送方法和装置。所述方法的一具体实施方式包括:获取预设的全季节周期内每个单位时间的用户行为数据,用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;利用所述线性回归模型生成行为参考信息,并将所述行为参考信息推送至终端设备进行展示。该实施方式实现了行为参考信息的高效生成与推送。

Description

信息推送方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及大数据技术领域,尤其涉及信息推送方法和装置。
背景技术
信息推送,又称为“网络广播”,是通过一定的技术标准或协议,在互联网上通过推送用户需要的信息来减少信息过载的一项技术。信息推送技术通过主动推送信息给用户,可以减少用户在网络上搜索所花的时间。并且,信息推送前经过一系列分析和运算,可以使所推送的信息可以更精准。
然而,现有技术中在推送信息时,通常需要先进行人工收集原始数据,然后对人工收集的数据进行进一步处理才能得到用户感兴趣的信息并推送给用户。这种方式过度依赖人工收集原始数据,导致耗时较长,所推送的信息存在时效性不足、初始信息收集成本偏高等问题。
发明内容
本申请的目的在于提出一种改进的信息推送方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种信息推送方法,所述方法包括:获取预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;将所述线 性回归模型生成的行为参考信息推送至终端设备进行展示。
在一些实施例中,所述利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,包括:根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据;根据所述周期用户行为数据的季节变化率得到所述第一实体集合在该单位统计周期内的状态参数,所述季节变化率为所述季节性用户行为数据与非季节性用户行为数据的比值。
在一些实施例中,所述根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据,包括:对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;获取各个单位统计周期内对数数据的平均值;线性变换所述平均值,得到所述周期用户行为数据。
在一些实施例中,所述提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据,包括:对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用户行为数据。
在一些实施例中,所述对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用户行为数据,包括:将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据的平均值确定为所述当前单位统计周期的非季节性用户行为数据。
在一些实施例中,所述根据所述周期用户行为数据的季节变化率得到所述第一实体集合在该单位统计周期内的状态参数,包括:获取相邻全季节周期中季节变化率的变化率平均值;根据所述季节变化率与所述变化率平均值,获取与所述状态参数关联的特征系数;将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。
在一些实施例中,所述根据所述季节变化率与所述变化率平均值, 获取状态参数序列的特征系数,包括:将所述季节变化率与所述变化率平均值的差值作为所述特征系数;或者,根据所述非季节性用户行为数据和所述变化率平均值的增量获取季节增长量,并将所述周期用户行为数据与所述季节增长量的差值与所述非季节性用户行为数据的比值作为所述特征系数。
在一些实施例中,所述将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数序列,包括:将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。
在一些实施例中,所述使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型,包括:从所述调研数据中提取出优质时间序列;使用所述优质时间序列和所述状态参数序列进行拟合,得到所述线性回归模型。
在一些实施例中,所述使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型,包括以下至少一项:采用自回归积分滑动平均模型算法从所述试题调研数据中对应的一致指数调查数据获取一致指数优质时间序列,并根据所述一致指数优质时间序列和所述状态参数序列拟合得到所述一致指数的线性回归模型;采用自回归积分滑动平均模型算法从所述试题调研数据中对应的先行指数调查数据获取先行指数优质时间序列,并根据所述先行指数优质时间序列和所述状态参数序列拟合得到所述先行指数的线性回归模型;采用向量自回归模型算法从所述试题调研数据中对应的生产者物价指数调查数据获取生产者物价指数优质时间序列,并根据所述生产者物价指数优质时间序列和所述状态参数序列拟合得到所述生产者物价指数的线性回归模型;采用向量自回归模型算法从所述试题调研数据中对应的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据所述采购经理人指数优质时间序列和所述状态参数序列拟合得到所述采购经理人指数的线性回归模型。
第二方面,本申请提供了一种信息推送装置,所述装置包括:获取单元,用于获取预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;形成单元,用于针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;构造单元,用于使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;推送单元,用于将所述线性回归模型生成的行为参考信息推送至终端设备进行展示。
在一些实施例中,所述形成单元包括:获取子单元,用于根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;提取子单元,提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据;信息得到子单元,用于根据所述周期用户行为数据的季节变化率得到所述第一实体集合在该单位统计周期内的状态参数,所述季节变化率为所述季节性用户行为数据与非季节性用户行为数据的比值。
在一些实施例中,所述获取子单元进一步用于:对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;获取各个单位统计周期内对数数据的平均值;线性变换所述平均值,得到所述周期用户行为数据。
在一些实施例中,所述提取子单元进一步用于:对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用户行为数据。
在一些实施例中,所述提取子单元进一步用于:将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据的平均值确定为所述当前单位统计周期的非季节性用户行为数据。
在一些实施例中,所述信息得到子单元,包括:平均值获取模块,用于获取相邻全季节周期中季节变化率的变化率平均值;系数获取模块,用于根据所述季节变化率与所述变化率平均值,获取与所述状态 参数关联的特征系数;加权处理模块,用于将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。
在一些实施例中,所述系数获取模块进一步用于:将所述季节变化率与所述变化率平均值的差值作为所述特征系数;或者,根据所述非季节性用户行为数据和所述变化率平均值的增量获取季节增长量,并将所述周期用户行为数据与所述季节增长量的差值与所述非季节性用户行为数据的比值作为所述特征系数。
在一些实施例中,所述加权处理模块进一步用于:将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。
在一些实施例中,所述构造单元进一步用于:从所述调研数据中提取出时间序列;使用所述优质时间序列和所述状态参数序列进行拟合,得到所述线性回归模型。
在一些实施例中,所述构造单元进一步用于以下至少一项:采用自回归积分滑动平均模型算法从所述试题调研数据中对应的一致指数调查数据获取一致指数优质时间序列,并根据所述一致指数优质时间序列和所述状态参数序列拟合得到所述一致指数的线性回归模型;采用自回归积分滑动平均模型算法从所述试题调研数据中对应的先行指数调查数据获取先行指数优质时间序列,并根据所述先行指数优质时间序列和所述状态参数序列拟合得到所述先行指数的线性回归模型;采用向量自回归模型算法从所述试题调研数据中对应的生产者物价指数调查数据获取生产者物价指数优质时间序列,并根据所述生产者物价指数优质时间序列和所述状态参数序列拟合得到所述生产者物价指数的线性回归模型;采用向量自回归模型算法从所述试题调研数据中对应的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据所述采购经理人指数优质时间序列和所述状态参数序列拟合得到所述采购经理人指数的线性回归模型。
本申请提供的信息推送方法和装置,通过大数据技术根据用户行为数据获取到第一实体集合的状态参数序列,再将状态参数序列结合从第三方平台获取的调研数据结合生成线性回归模型,从而可以基于 线下预测模型生成行为参考信息并推送至终端设备进行展示,实现了行为参考信息的自动化生成和推送,效率较高。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的信息推送方法的一个实施例的流程图;
图3是图2对应实施例中ARIMA模型下的最优参数计算结果示意图;
图4是图2对应实施例中ARIMA模型下的标准差诊断的诊断结果示意图;
图5是图2对应实施例中ARIMA模型下的自相关检验的检验结果示意图;
图6是图2对应实施例中ARIMA模型下的Ljung-Box检验的检验结果示意图;
图7是图2对应实施例中AVR模型下的企业情况调查数据的时间序列示意图;
图8是图2对应实施例中AVR模型下企业情况调查数据与状态参数的序列的相关性示意图;
图9是图2对应实施例中AVR模型下的测定系数计算结果示意图;
图10是根据本申请的信息推送装置的一个实施例的结构示意图;
图11是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与 有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的信息推送方法或信息推送装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的网页提供支持的后台网页服务器。后台网页服务器可以对接收到的网页页面请求等数据进行分析等处理,并将处理结果(例如网页页面数据)推送给终端设备。
需要说明的是,本申请实施例所提供的信息推送方法一般由服务器105执行,相应地,信息推送装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的信息推送方法的一个实施例的流程200。所述的信息推送方法,包括以下步骤:
步骤201,获取预设的全季节周期内每个单位时间的用户行为数据。
在本实施例中,信息推送方法运行于其上的电子设备(例如图1所示的服务器)可以从本机或通过有线连接方式或者无线连接方式从存储有用户行为数据的其他设备中获取数据,所获取的数据可以是预设的全季节周期内每个单位时间的用户行为数据。
其中,用户行为数据可以是与第一实体集合相关联的用户行为的用户行为数据。可选的,上述的第一实体集合,可以是一系列的中小企业。在网络推广系统或电子商务运营平台中与这些实体关联的用户行为数据与这些实体的状态有较大联系,这些用户行为数据可作为后续步骤的数据基础。这里所说的状态,从经济学上可以表达为第一实体集合(例如中小企业)的景气指数。
在获取用户行为数据时,可以直接通过网页数据抓取工具从网页中抓取,也可以从网络推广系统的后台数据库或者从电子商务运营平台的后台数据库获取。这些网页、推广系统或电子商务运营平台通常用于记录与第一实体集合相关联的用户行为数据,例如点击搜索数据、点击消费数据等。其中,用户行为数据所关联的第一实体集合可以是指中小企业群体。实践中,所记录的数据可以是第一实体集合中的某一些实体。所获取的用户行为数据可以如表1所述。
表1 一天的用户行为数据列表示意
表1中展现栏对应的数值4518是5月27日当消费者通过搜索引擎输入关键词(例如焊接)进行搜索,推广系统向消费者展示的搜索结果页面中所展现的企业用户的产品的相关条目的次数的统计数值。点击栏对应的数值88是当日消费者对相关条目点击的次数的统计数值。消费栏对应的金额¥522.9是因为向消费者展现相关条目以及消费者点击相关条目的行为对应的企业用户应该向A推广系统支付的金额,转化率是根据相关条目产生的线上(网页)和线下(实体)交易金额相对于消费栏的金额的百分比。实践中,用户行为数据可以是表 1所列出的各种数据中的一种或多种,也可以是未列出的其他类型的用户行为数据。
需要说明的是,本实施例中的全季节周期通常可以是指一个自然年,但也可以其他类型的年度周期。相应的,单位时间通常可以是天,在某些情况下也可以是小时等其他时间计量单位。
步骤202,针对全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成与全季节周期对应的状态参数序列。
在本实施例中,基于步骤201中得到的用户行为数据,上述电子设备(例如图1所示的服务器)可以针对全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成与全季节周期对应的状态参数序列。其中,单位统计周期可以是周,也可以是月,还可以是其他时间长度位于全季节周期和单位时间之间的时间周期。
可选的,步骤202中利用单位统计周期内每个单位时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数具体可以包括:根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;提取出周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据;根据周期用户行为数据的季节变化率得到第一实体集合在该单位统计周期内的状态参数,季节变化率为季节性用户行为数据与非季节性用户行为数据的比值。
可选的,上述根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据可以进一步包括:对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;获取各个单位统计周期内对数数据的平均值;线性变换平均值,得到周期用户行为数据。
其中,假设单位时间是天,单位统计周期为周,每周中第i天的用户行为数据是datai(其中i是处于1到7的整数),则其进行对数运算后的对数数据为log(datai),其中log为自然对数运算,即等同于IN,底数为e。对应的,各个单位统计周期内对数数据的平均值是
线性变化平均值,是为了将指数数据的平均值进行标准化处理。可选的,可以采用现有的数据分析软件,包括但不限于统计产品与服务解决方案软件(Statistical Productand Service Solutions,SPSS)。以SPSS为例,可以在SPSS的“描述性”对话框里,将指数数据的平均值放入右边的“变量”文本框里,选中左下角的“将标准化得分另存为变量”点击确定,在数据视图的右边就会出现标准化(即线性变换)后的对数数据的平均值(即第二点击消费数据)。优选地,还可以对对数数据的平均值进行筛选,具体的,可以求任一对数数据的平均值的方差,并保留数值在[20,180]之间的对数数据的平均值;进一步的,由于有些行业或者地区的第一点击消费数据较稀疏,即数据量少,对应的连续几周(单位统计周期)的指数数据的平均值波动较大,这些波动较大的指数数据的平均值也可以去掉,不再参与后续步骤。
在本实施例的一些可选实现方式中,为了提高数据安全,还可以对线性变换前的指数数据的平均值或者对线性变换后的指数数据的平均值进行数据加密的处理。
在本实施例的一些可选实现方式中,上述提取出周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据,可以具体包括:将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据的平均值确定为当前单位统计周期的非季节性用户行为数据。
需要说明的是,全季节周期可以是单个全季节周期或连续多个全季节周期。例如,一个单位统计周期可以选取为一周,一个全季节周期可以选取为一年(52周),周期(单个全季节周期所包含的单位统计周期的数量)T=52。全季节周期则可以是一年或连续几年。此时,全季节周期内的周期用户行为数据可以表示为数据集合{xi},其中xi是全季节周期内第i周的周期用户行为数据。其中i=1,…,N,N为观测总数。其中,周期用户行为数据可以划分为非季节性用户行为数据tj和季节性用户行为数据xj–tj两个部分,其中j是53到N之间的整数。非季节性用户行为数据tj可以通过按照式(1)对周期用户行为数据进 行平滑处理得到对应的非季节用户行为数据tj
在本实施例的一些可选实现方式中,上述根据周期用户行为数据的季节变化率得到第一实体集合在该单位统计周期内的状态参数,包括:获取相邻全季节周期中季节变化率的变化率平均值;根据季节变化率与变化率平均值,获取与状态参数关联的特征系数;将特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。其中,该特征系数是表征状态参数的系数,在经济学领域中可以表达为景气系数。
可选的,季节变化率pj通过式(2)计算得到:
相邻全季节周期中季节变化率的变化率平均值qj则可以通过式(3)获取:
在本实施例的一些可选实现方式中,上述根据季节变化率与变化率平均值,获取状态参数序列的特征系数,包括:将季节变化率与变化率平均值的差值作为特征系数;或者,根据非季节性用户行为数据和变化率平均值的增量获取季节增长量,并将周期用户行为数据与季节增长量的差值与非季节性用户行为数据的比值作为特征系数。
具体的,该特征系数rj可以通过季节变化率pj与季节变化率的平均值qj生成,例如通过式(4)生成:
rj=pj-qj j=53,…N (4)
上述特征系数rj也可以首先根据非季节性用户行为数据tj和季节变化率的变化率平均值qj的增量获取季节增长量sj,参见式(5);然后,将周期用户行为数据与季节增长量sj的差值相比于非季节性用户 行为数据tj所得到的比值作为特征系数rj,参见式(6)。
sj=tj *(1+qj),j=53,…N (5)
在本实施例的一些可选实现方式中,上述将特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数序列可以包括:将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。例如,特征系数在六个单位统计周期(周)内平滑后进行加权处理得到对应的状态参数。具体的,可以将六周内为正数的特征系数的平均值进行线性加权处理后得到对应的状态参数,因为对于负数的特征系数会抵消部分或者全部正数的状态参数,从而弱化状态参数的波动,影响信息的可靠性。处理算法可以参见式(7)。
其中,j为各个统计周期的序号,rcj为所得到的各个状态参数序列。
在本实施例的一些可选实现方式中,还可以将状态参数序列推送至终端设备进行展示。在展示时,终端设备可以根据各个状态参数所对应的单位统计周期,绘制成曲线形式进行展示。
步骤203,使用状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型。
在本实施例中,基于步骤202所生成的状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,电子设备利用状态参数序列和调研数据构造成线性回归模型,该线性回归模型用于预测行为参考信息。其中,行为参考信息可以是数值形式,可以表达为经济学中的宏观经济景气指数。调研数据可以从国家统计局获取或者从其他经济预测平台获取的是企业情况调查数据。
在本实施例的一些可选实现方式中,上述步骤203可以具体包括: 从调研数据中提取出优质时间序列;使用优质时间序列和状态参数序列进行拟合,得到线性回归模型。
在本实施例的一些可选实现方式中,上述步骤203可以通过以下方式中的一种或多种执行。方式一:采用自回归积分滑动平均模型算法从试题调研数据中对应的一致指数调查数据获取一致指数优质时间序列,并根据一致指数优质时间序列和状态参数序列拟合得到一致指数的线性回归模型;方式二:采用自回归积分滑动平均模型算法从试题调研数据中对应的先行指数调查数据获取先行指数优质时间序列,并根据先行指数优质时间序列和状态参数序列拟合得到先行指数的线性回归模型;方式三:采用向量自回归模型算法从试题调研数据中对应的生产者物价指数调查数据获取生产者物价指数优质时间序列,并根据生产者物价指数优质时间序列和状态参数序列拟合得到生产者物价指数的线性回归模型;方式四,采用向量自回归模型算法从试题调研数据中对应的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据采购经理人指数优质时间序列和状态参数序列拟合得到采购经理人指数的线性回归模型。
具体的,在上述第一种方式中,可以采用自回归积分滑动平均模型(AutoRegressive Integrated Moving Average,ARIMA)模型算法从企业情况调查数据中对应的一致指数调查数据获取一致指数优质时间序列;对应的,上述使用优质时间序列和状态参数序列进行拟合,得到线性回归模型可以是:根据一致指数优质时间序列和状态参数的序列拟合得到一致指数的线性回归模型。
在上述第二种方式中,可以采用自回归积分滑动平均模型算法从企业情况调查数据中对应的先行指数调查数据获取先行指数优质时间序列;对应的,上述使用优质时间序列和状态参数序列进行拟合,得到线性回归模型可以是:根据先行指数优质时间序列和状态参数的序列拟合得到先行指数的线性回归模型
在上述第三种方式中,可以采用向量自回归(Vector Auto Regressive,VAR)模型算法从企业情况调查数据中对应的生产者物价指数调查数据获取PPI(Producer PriceIndex,生产者物价指数)优 质时间序列;对应的,上述使用优质时间序列和状态参数序列进行拟合,得到线性回归模型可以是:根据生产者物价指数优质时间序列和状态参数的序列拟合得到生产者物价指数的线性回归模型。
在上述第四种方式中,可以采用向量自回归模型算法从企业情况调查数据中对应的采购经理人指数调查数据获取PMI(Purchasing Managers'Index,采购经理人指数)优质时间序列;对应的,根据采购经理人指数优质时间序列和状态参数的序列拟合得到采购经理人指数的线性回归模型。
在上述实现方式中,对一致指数和先行指数的预测采用ARIMA模型算法,其基本原理包括:根据时间序列的散点图、自相关函数和偏自相关函数图以单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。对非平稳序列进行平稳化处理,如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合自回归过程模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合移动平均过程模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合自回归移动平均过程模型。进行参数估计,检验是否具有统计意义。进行假设检验,诊断残差序列是否为白噪声。利用已通过检验的模型进行预测分析。
在上述实现方式中,对PPI和PMI的预测采用VAR模型算法,其基本原理包括:基于数据的统计性质建立模型,模型把数据系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的向量自回归模型。
例如,在本实施例中,采用ARIMA模型对一致指数进行预测包括模型定阶、参数估计和模型诊断。
其中,定阶过程先检验平稳性,并校验序列(即企业情况调查数 据所组成的序列)的序列自相关性和序列偏相关性,确定至少两组模型。之后,对至少两组模型进行参数估计和模型诊断,筛选得到最优的模型。其中,参数估计和模型诊断所采用的方法可以包括但不限于最小信息准则(Akaike Information Criterion,AIC)。可选的,进行模型诊断时可以采用残差诊断结果,进行参数估计时可以考虑置信区间是否包含0等。该模型中包括的回归项,其相关性就是计算目标变量和协整变量之间相关系数的高低。以预测一致指数为例,直接使用R包auto.arima函数,该函数能够自动定阶,选出几组合适的模型,并筛选得到最优的ARIMA模型,加入回归项序列(即状态参数的序列),得到如下参数:auto.arima中有参数xreg(xreg为外部的回归量),得到的就是自相关时间序列加协变量时间序列的复合时间序列;auto.arima自动选择最优参数p,d,q(p为自回归项,q为移动平均项数,d为时间序列成为平稳时所做的差分次数),设置这几个参数最大取值,程序会在0到最大值中选所有情况遍历,得到最优结果,比如输入(p=3,d=2,q=3)。参见图3,其示出本发明使用ARIMA模型时的最优参数计算结果示意图,xreg参数可以是根据推广系统在一年内1月-12月的用户行为数据获取的状态参数的序列。根据图3中的计算结果,可以得到式(8)所示的模型。
yt=yt-1+0.0219*xtt (8)
其中,yt是目标变量,xt是协变量,εt是随机项,AIC=74.51。其中,图3中的圆圈301指示计算出xt的系数值,圆圈301指示AIC的值。图3中的示意图中其它数据的含义可以通过现有技术进行识别,这里不再赘述。可选的,图4是示出本发明在ARIMA模型下的标准差诊断的诊断结果示意图;图5是本发在ARIMA模型下的自相关检验的检验结果示意图;图6是示出本发明在ARIMA模型下的Ljung-Box检验的检验结果示意图。
参见图4中,标准差诊断过程中,横坐标(每周)对应的数据的指数lag0-lag40的残差均无明显超过标准差线401,则可接受相应的模型。参见图5,自相关检验过程中,竖直线501表明自相关只有lag0,也即跟后面的不相关,也就是模型最终是arima(0,1,0)。参见图6, Ljung-Box检验过程中,图中圆圈602表示各参数对应的p值显著高于衡量线601,模型可接受。因此残差诊断模型通过。
例如,在本实施例中,采用VAR模型对PPI和PMI进行预测。VAR模型建模过程基本同ARIMA模型。但在定阶过程使用的是交叉相关函数(Cross-Correlation Function,CCF)。CCF通过给定阶数,计算在哪个阶数下AIC最小,从而得到VAR最优阶数。在R语言的VAR包中,可以直接调用CCF函数。比较模型的标准是测定系数R2,各阶系数的显著性等。图7是示出本发明中AVR模型下的企业情况调查数据的时间序列示意图。参见图7,首先从企业情况调查数据中筛选出最好的相关序列,以预测PMI最终选择的协变量,图7中的第一曲线701和第二曲线702表明两条曲线对应的时间序列有高度相关性。图8是示出本发明中AVR模型下企业情况调查数据与状态参数的序列的相关性示意图。采用CCF计算图7中第一曲线701和第二曲线702对应的时间序列的相关性,第一曲线701和第二曲线702对应的时间序列中的同期数据对应的竖直线801、802、803、804、805和806的高度都超过自相关性标准线801,相关性最高。图9是示出本发明中AVR模型下的测定系数计算结果示意图。根据企业情况调查数据和状态参数的序列采用VAR模型计算出参数,参见图9,其中all的lag1(图9中的all.l1),lag2(图9中的all.l2),lag3(图9中的all.l3)都有较强显著性(显著性判断属于现有技术,这里不再赘述),调整的拟合系数R2为62%(图9中圆圈901指示),这些评价指标相比其余的模型均有更好的效果。图9中的示意图中其它数据的含义可以通过现有技术进行识别,这里不再赘述。
在本实现方式中,对一致指数和先行指数的预测采用ARIMA模型算法,其基本原理包括:根据时间序列的散点图、自相关函数和偏自相关函数图以单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。对非平稳序列进行平稳化处理,如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。根据时间序 列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合自回归过程模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合移动平均过程模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合自回归移动平均过程模型。进行参数估计,检验是否具有统计意义。进行假设检验,诊断残差序列是否为白噪声。利用已通过检验的模型进行预测分析。
在本实现方式中,对PPI和PMI的预测采用VAR模型算法,其基本原理包括:基于数据的统计性质建立模型,模型把数据系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的向量自回归模型。
实践中,在除了ARIMA模型和/或VAR模型,还可以采用其他可以处理时间序列的模型。
使用该实现方式的技术方案时,采用点击消费数据所预测的先行指数与国家统计局实际公布的先行指数有79%的相关性,所预测的一致指数与国家统计局实际公布的一致指数有91%的相关性,预测生成的参考信息可以以数字形式展示,给国家、企业以及个人的决策行为提供全面客观的参考信息。
步骤204,利用线性回归模型生成行为参考信息,并将行为参考信息推送至终端设备进行展示。
在本实施例中,基于步骤203所生成的线性回归模型,电子设备利用该线性回归模型生成行为参考信息,并将所生成的行为参考信息推送至终端设备进行展示。实践中,线性回归模型输出的行为参考信息可以是数值形式,电子设备可以将相应数值推送至终端设备进行展示。通常,当所推送对应多个时间段的行为参考信息时,可以将表征各个时间段的行为参考信息的数值绘制成曲线进行显示,以提高信息展示效果。
本申请的上述实施例提供的方法通过大数据技术根据用户行为数据获取到第一实体集合的状态参数序列,再将状态参数序列结合从第 三方平台获取的调研数据结合生成线性回归模型,从而可以基于线性回归模型生成行为参考信息并推送至终端设备进行展示,实现了行为参考信息的自动化生成,效率较高。
进一步参考图10,作为对上述各图所示方法的实现,本申请提供了一种信息推送装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图10所示,本实施例所述的信息推送装置1000包括:获取单元1001、形成单元1002、构造单元1003和推送单元1004。其中,获取单元1001用于获取预设的全季节周期内每个单位时间的用户行为数据,用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;形成单元1002用于针对全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成与全季节周期对应的状态参数序列;信息选取单元1003用于使用状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;而推送单元1004用于将线性回归模型生成的行为参考信息推送至终端设备进行展示。
在本实施例中,信息推送装置1000的获取单元1001、形成单元1002、构造单元1003和推送单元1004的具体处理可以分别参考图2对应实施例的步骤201、步骤202、步骤203以及步骤204,这里不再赘述。
在本实施例的一些可选实现方式中,形成单元502包括:获取子单元(未示出),用于根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;提取子单元(未示出),提取出周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据;信息得到子单元(未示出),用于根据周期用户行为数据的季节变化率得到第一实体集合在该单位统计周期内的状态参数,季节变化率为季节性用户行为数据与非季节性用户行为数据的比值。
在本实施例的一些可选实现方式中,上述获取子单元进一步用于: 对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;获取各个单位统计周期内对数数据的平均值;线性变换平均值,得到周期用户行为数据。
在本实施例的一些可选实现方式中,上述提取子单元进一步用于:对周期用户行为数据在全季节周期内进行平滑处理得到对应的非季节性用户行为数据。
在本实施例的一些可选实现方式中,上述提取子单元进一步用于:将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据的平均值确定为当前单位统计周期的非季节性用户行为数据。
在本实施例的一些可选实现方式中,信息得到子单元,包括:平均值获取模块,用于获取相邻全季节周期中季节变化率的变化率平均值;系数获取模块,用于根据季节变化率与变化率平均值,获取与状态参数关联的特征系数;加权处理模块,用于将特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。
在本实施例的一些可选实现方式中,系数获取模块进一步用于:将季节变化率与变化率平均值的差值作为特征系数;或者,根据非季节性用户行为数据和变化率平均值的增量获取季节增长量,并将周期用户行为数据与季节增长量的差值与非季节性用户行为数据的比值作为特征系数。
在本实施例的一些可选实现方式中,加权处理模块进一步用于:将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。
在本实施例的一些可选实现方式中,构造单元进一步用于,包括:从调研数据中提取出优质时间序列;使用优质时间序列和状态参数序列进行拟合,得到线性回归模型。
在本实施例的一些可选实现方式中,构造单元进一步用于以下至少一项:采用自回归积分滑动平均模型算法从试题调研数据中对应的一致指数调查数据获取一致指数优质时间序列,并根据一致指数优质时间序列和状态参数序列拟合得到一致指数的线性回归模型;采用自 回归积分滑动平均模型算法从试题调研数据中对应的先行指数调查数据获取先行指数优质时间序列,并根据先行指数优质时间序列和状态参数序列拟合得到先行指数的线性回归模型;采用向量自回归模型算法从试题调研数据中对应的生产者物价指数调查数据获取生产者物价指数优质时间序列,并根据生产者物价指数优质时间序列和状态参数序列拟合得到生产者物价指数的线性回归模型;采用向量自回归模型算法从试题调研数据中对应的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据采购经理人指数优质时间序列和状态参数序列拟合得到采购经理人指数的线性回归模型。
下面参考图11,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统1100的结构示意图。
如图11所示,计算机系统1100包括中央处理单元(CPU)1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。在RAM 1103中,还存储有系统1100操作所需的各种程序和数据。CPU 1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
以下部件连接至I/O接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施 例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、形成单元、构造单元和推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取预设的全季节周期内每个单位时间的用户行为数据的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:获取预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调 研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;将所述线性回归模型生成的行为参考信息推送至终端设备进行展示。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (20)

1.一种信息推送方法,其特征在于,所述方法包括:
获取预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;
针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;
使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;
利用所述线性回归模型生成行为参考信息,并将所述行为参考信息推送至终端设备进行展示。
2.根据权利要求1所述的方法,其特征在于,所述利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,包括:
根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;
提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据;
根据所述周期用户行为数据的季节变化率得到所述第一实体集合在该单位统计周期内的状态参数,所述季节变化率为所述季节性用户行为数据与非季节性用户行为数据的比值。
3.根据权利要求2所述的方法,其特征在于,所述根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据,包括:
对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;
获取各个单位统计周期内对数数据的平均值;
线性变换所述平均值,得到所述周期用户行为数据。
4.根据权利要求3所述的方法,其特征在于,所述提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据,包括:
对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用户行为数据。
5.根据权利要求4所述的方法,其特征在于,所述对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用户行为数据,包括:
将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据的平均值确定为所述当前单位统计周期的非季节性用户行为数据。
6.根据权利要求3所述的方法,其特征在于,所述根据所述周期用户行为数据的季节变化率得到所述第一实体集合在该单位统计周期内的状态参数,包括:
获取相邻全季节周期中季节变化率的变化率平均值;
根据所述季节变化率与所述变化率平均值,获取与所述状态参数关联的特征系数;
将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。
7.根据权利要求6所述的方法,其特征在于,所述根据所述季节变化率与所述变化率平均值,获取状态参数序列的特征系数,包括:
将所述季节变化率与所述变化率平均值的差值作为所述特征系数;
或者,根据所述非季节性用户行为数据和所述变化率平均值的增 量获取季节增长量,并将所述周期用户行为数据与所述季节增长量的差值与所述非季节性用户行为数据的比值作为所述特征系数。
8.根据权利要求6所述的方法,其特征在于,所述将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数序列,包括:
将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。
9.根据权利要求1-8之一所述的方法,其特征在于,所述使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型,包括:
从所述调研数据中提取出优质时间序列;
使用所述优质时间序列和所述状态参数序列进行拟合,得到所述线性回归模型。
10.根据权利要求1-8之一所述的方法,其特征在于,所述使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型,包括以下至少一项:
采用自回归积分滑动平均模型算法从所述试题调研数据中对应的一致指数调查数据获取一致指数优质时间序列,并根据所述一致指数优质时间序列和所述状态参数序列拟合得到所述一致指数的线性回归模型;
采用自回归积分滑动平均模型算法从所述试题调研数据中对应的先行指数调查数据获取先行指数优质时间序列,并根据所述先行指数优质时间序列和所述状态参数序列拟合得到所述先行指数的线性回归模型;
采用向量自回归模型算法从所述试题调研数据中对应的生产者物 价指数调查数据获取生产者物价指数优质时间序列,并根据所述生产者物价指数优质时间序列和所述状态参数序列拟合得到所述生产者物价指数的线性回归模型;
采用向量自回归模型算法从所述试题调研数据中对应的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据所述采购经理人指数优质时间序列和所述状态参数序列拟合得到所述采购经理人指数的线性回归模型。
11.一种信息推送装置,其特征在于,所述装置包括:
获取单元,用于获取预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;
形成单元,用于针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;
构造单元,用于使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;
推送单元,用于利用所述线性回归模型生成行为参考信息,并将所述行为参考信息推送至终端设备进行展示。
12.根据权利要求11所述的装置,其特征在于,所述形成单元包括:
获取子单元,用于根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;
提取子单元,提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据;
信息得到子单元,用于根据所述周期用户行为数据的季节变化率 得到所述第一实体集合在该单位统计周期内的状态参数,所述季节变化率为所述季节性用户行为数据与非季节性用户行为数据的比值。
13.根据权利要求12所述的装置,其特征在于,所述获取子单元进一步用于:
对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;
获取各个单位统计周期内对数数据的平均值;
线性变换所述平均值,得到所述周期用户行为数据。
14.根据权利要求13所述的装置,其特征在于,所述提取子单元进一步用于:
对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用户行为数据。
15.根据权利要求14所述的装置,其特征在于,所述提取子单元进一步用于:
将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据的平均值确定为所述当前单位统计周期的非季节性用户行为数据。
16.根据权利要求13所述的装置,其特征在于,所述信息得到子单元,包括:
平均值获取模块,用于获取相邻全季节周期中季节变化率的变化率平均值;
系数获取模块,用于根据所述季节变化率与所述变化率平均值,获取与所述状态参数关联的特征系数;
加权处理模块,用于将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。
17.根据权利要求16所述的装置,其特征在于,所述系数获取模块进一步用于:
将所述季节变化率与所述变化率平均值的差值作为所述特征系数;
或者,根据所述非季节性用户行为数据和所述变化率平均值的增量获取季节增长量,并将所述周期用户行为数据与所述季节增长量的差值与所述非季节性用户行为数据的比值作为所述特征系数。
18.根据权利要求16所述的装置,其特征在于,所述加权处理模块进一步用于:
将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。
19.根据权利要求11-18之一所述的方法,其特征在于,所述构造单元进一步用于:
从所述调研数据中提取出优质时间序列;
使用所述优质时间序列和所述状态参数序列进行拟合,得到所述线性回归模型。
20.根据权利要求11-18之一所述的装置,其特征在于,所述构造单元进一步用于以下至少一项:
采用自回归积分滑动平均模型算法从所述试题调研数据中对应的一致指数调查数据获取一致指数优质时间序列,并根据所述一致指数优质时间序列和所述状态参数序列拟合得到所述一致指数的线性回归模型;
采用自回归积分滑动平均模型算法从所述试题调研数据中对应的先行指数调查数据获取先行指数优质时间序列,并根据所述先行指数优质时间序列和所述状态参数序列拟合得到所述先行指数的线性回归模型;
采用向量自回归模型算法从所述试题调研数据中对应的生产者物 价指数调查数据获取生产者物价指数优质时间序列,并根据所述生产者物价指数优质时间序列和所述状态参数序列拟合得到所述生产者物价指数的线性回归模型;
采用向量自回归模型算法从所述试题调研数据中对应的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据所述采购经理人指数优质时间序列和所述状态参数序列拟合得到所述采购经理人指数的线性回归模型。
CN201610398826.7A 2016-06-07 2016-06-07 信息推送方法和装置 Active CN106095895B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610398826.7A CN106095895B (zh) 2016-06-07 2016-06-07 信息推送方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610398826.7A CN106095895B (zh) 2016-06-07 2016-06-07 信息推送方法和装置

Publications (2)

Publication Number Publication Date
CN106095895A true CN106095895A (zh) 2016-11-09
CN106095895B CN106095895B (zh) 2019-12-10

Family

ID=57227353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610398826.7A Active CN106095895B (zh) 2016-06-07 2016-06-07 信息推送方法和装置

Country Status (1)

Country Link
CN (1) CN106095895B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590562A (zh) * 2017-09-05 2018-01-16 西安交通大学 一种基于变权组合预测法的电力负荷短期预测方法
CN107895297A (zh) * 2017-11-03 2018-04-10 深圳市易达云科技有限公司 一种订单创建方法及系统
CN108628861A (zh) * 2017-03-15 2018-10-09 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN109800359A (zh) * 2018-12-20 2019-05-24 北京百度网讯科技有限公司 信息推荐处理方法、装置、电子设备及可读存储介质
CN110046200A (zh) * 2018-11-07 2019-07-23 阿里巴巴集团控股有限公司 文本可信模型分析方法、设备和装置
CN110704730A (zh) * 2019-09-06 2020-01-17 中国平安财产保险股份有限公司 基于大数据的产品数据推送方法、系统及计算机设备
CN111367640A (zh) * 2020-03-06 2020-07-03 咪咕文化科技有限公司 数据统计周期确定方法、装置、电子设备及存储介质
CN111666535A (zh) * 2020-04-24 2020-09-15 北京奇艺世纪科技有限公司 确定用户活跃时长的方法、装置、电子设备及存储介质
CN114186129A (zh) * 2021-12-10 2022-03-15 中国电信股份有限公司 套餐推荐方法、装置、电子设备及计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946319A (zh) * 2012-09-29 2013-02-27 焦点科技股份有限公司 网络用户行为信息分析系统及其分析方法
CN103873583A (zh) * 2014-03-24 2014-06-18 北京聚思信息咨询有限公司 基于云平台针对互联网用户行为进行分析的方法和系统
CN104598521A (zh) * 2014-12-12 2015-05-06 北京京东尚科信息技术有限公司 处理用户行为数据的方法和装置
CN104636406A (zh) * 2013-11-15 2015-05-20 华为技术有限公司 一种根据用户行为推送信息的方法和装置
CN104766175A (zh) * 2015-04-16 2015-07-08 东南大学 一种基于时间序列分析的电力系统异常数据辨识与修正方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946319A (zh) * 2012-09-29 2013-02-27 焦点科技股份有限公司 网络用户行为信息分析系统及其分析方法
CN104636406A (zh) * 2013-11-15 2015-05-20 华为技术有限公司 一种根据用户行为推送信息的方法和装置
CN103873583A (zh) * 2014-03-24 2014-06-18 北京聚思信息咨询有限公司 基于云平台针对互联网用户行为进行分析的方法和系统
CN104598521A (zh) * 2014-12-12 2015-05-06 北京京东尚科信息技术有限公司 处理用户行为数据的方法和装置
CN104766175A (zh) * 2015-04-16 2015-07-08 东南大学 一种基于时间序列分析的电力系统异常数据辨识与修正方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108628861B (zh) * 2017-03-15 2022-03-04 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN108628861A (zh) * 2017-03-15 2018-10-09 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN107590562A (zh) * 2017-09-05 2018-01-16 西安交通大学 一种基于变权组合预测法的电力负荷短期预测方法
CN107895297A (zh) * 2017-11-03 2018-04-10 深圳市易达云科技有限公司 一种订单创建方法及系统
CN110046200A (zh) * 2018-11-07 2019-07-23 阿里巴巴集团控股有限公司 文本可信模型分析方法、设备和装置
CN110046200B (zh) * 2018-11-07 2023-05-05 创新先进技术有限公司 文本可信模型分析方法、设备和装置
CN109800359A (zh) * 2018-12-20 2019-05-24 北京百度网讯科技有限公司 信息推荐处理方法、装置、电子设备及可读存储介质
CN110704730A (zh) * 2019-09-06 2020-01-17 中国平安财产保险股份有限公司 基于大数据的产品数据推送方法、系统及计算机设备
CN111367640A (zh) * 2020-03-06 2020-07-03 咪咕文化科技有限公司 数据统计周期确定方法、装置、电子设备及存储介质
CN111367640B (zh) * 2020-03-06 2023-08-15 咪咕文化科技有限公司 数据统计周期确定方法、装置、电子设备及存储介质
CN111666535A (zh) * 2020-04-24 2020-09-15 北京奇艺世纪科技有限公司 确定用户活跃时长的方法、装置、电子设备及存储介质
CN111666535B (zh) * 2020-04-24 2023-09-26 北京奇艺世纪科技有限公司 确定用户活跃时长的方法、装置、电子设备及存储介质
CN114186129A (zh) * 2021-12-10 2022-03-15 中国电信股份有限公司 套餐推荐方法、装置、电子设备及计算机可读介质

Also Published As

Publication number Publication date
CN106095895B (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
CN106095895A (zh) 信息推送方法和装置
US11941645B1 (en) Methods and systems to extract signals from large and imperfect datasets
Li et al. A MIDAS modelling framework for Chinese inflation index forecast incorporating Google search data
Hassani et al. Forecasting European industrial production with singular spectrum analysis
de Carvalho et al. Real-time nowcasting the US output gap: Singular spectrum analysis at work
Weng et al. Probabilistic baseline estimation based on load patterns for better residential customer rewards
Chaâbane A novel auto-regressive fractionally integrated moving average–least-squares support vector machine model for electricity spot prices prediction
CN106384256A (zh) 基于指标体系动态变化的供电服务满意度动态测评系统
Zhang et al. Decomposition methods for tourism demand forecasting: A comparative study
CN117235586B (zh) 酒店客户画像构建方法、系统、电子设备及存储介质
Chit Exchange rate volatility and exports: Evidence from the ASEAN-China Free Trade Area
McHugh et al. Hourly electricity price forecasting with NARMAX
CN116542395A (zh) 一种低碳楼宇监测系统及方法
CN109858756A (zh) 一种服务质量缺陷诊断方法和装置
CN113723747A (zh) 分析报告生成方法、电子设备及可读存储介质
Christiansen Do technology shocks lead to productivity slowdowns? Evidence from patent data
CN110910241A (zh) 现金流评估方法、装置、服务器设备及存储介质
Arsova et al. Intersection tests for the cointegrating rank in dependent panel data
CN111815204B (zh) 风险评估方法、装置以及系统
CN114897607A (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN113947439A (zh) 需求预测模型训练方法和装置、需求预测方法和装置
CN113128739B (zh) 用户触达时间的预测方法、预测模型训练方法及相关装置
Eskandarnia et al. Predication of future energy consumption using SARIMAX
Souza Why aggregate long memory time series?
Griffiths Bayesian inference in the seemingly unrelated regressions model

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant