CN108287867A - 行业景气指数生成方法、装置、设备及其存储介质 - Google Patents

行业景气指数生成方法、装置、设备及其存储介质 Download PDF

Info

Publication number
CN108287867A
CN108287867A CN201711373687.3A CN201711373687A CN108287867A CN 108287867 A CN108287867 A CN 108287867A CN 201711373687 A CN201711373687 A CN 201711373687A CN 108287867 A CN108287867 A CN 108287867A
Authority
CN
China
Prior art keywords
series
sample
sample time
logistics
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711373687.3A
Other languages
English (en)
Other versions
CN108287867B (zh
Inventor
陈佳琦
王本玉
刘琼
席怡雯
金晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
SF Tech Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN201711373687.3A priority Critical patent/CN108287867B/zh
Publication of CN108287867A publication Critical patent/CN108287867A/zh
Application granted granted Critical
Publication of CN108287867B publication Critical patent/CN108287867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Fuzzy Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了行业景气指数生成方法、装置、设备及其存储介质。该方法,包括清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据;从原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt;基于样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成行业景气指数。本申请实施例,从物流数据中抽取样本时间序列,并经过对样本时间序列进行季节处理之后,生成行业景气指数,并通过一系列检验方法验证基于物流大数据的行业景气指数相比国家经济指标具有先行性,从而为企业发展提供可信的决策依据,进一步提升物流服务质量。

Description

行业景气指数生成方法、装置、设备及其存储介质
技术领域
本申请一般涉及计算机领域,具体涉及计算机信息处理技术领域,尤其涉及行业景气指数生成方法、装置、设备及其存储介质。
背景技术
行业景气指数是通过将综合反映行业的各种指标进行加权编制而成的,并能够反映行业变动趋势的一种综合指数。基于行业景气指数能够快速地对行业的发展趋势进行分析和判断,从而指导企业的生产经营和投资。
现代物流依靠信息技术来保证物流体系正常运作,同时物流系统也提供了丰富的信息服务功能,例如提供基于物流的预测、动态情报及有关的费用情报、生产情报、市场情报等等。
随着物流的发展,其在经济领域的作用日益重要。但是,目前物流大数据的挖掘仅仅显示出物流活动中各个环节的内在联系,并没有发现物流在经济范畴内的真正的意义。
基于上述现状,亟待提出一种基于物流行业的景气指数生成方法。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种基于物流大数据生成行业景气指数的方案。
第一方面,本申请实施例提供了一种行业景气指数生成方法,该方法包括:
清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据;
从原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
基于样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成行业景气指数。
第二方面,本申请实施例提供了一种行业景气指数生成装置,该装置包括:
清洗转换单元,用于清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据;
样本抽取单元,用于从原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
景气指数生成单元,用于基于样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成行业景气指数。
第三方面,本申请实施例提供了一种设备,包括处理器、存储装置;其特征在于:
前述存储装置,用于存储一个或多个程序;
当前述一个或多个程序被前述处理器执行,使得前述处理器实现本申请实施例描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本申请实施例描述的方法。
本申请实施例提供的行业景气指数生成的方案,通过物流大数据创建行业景气指数,可以从物流大数据中提取用于挖掘行业发展趋势的商务件运单作为样本时间序列。进而,通过对样本时间序列进行建模分析,并从样本时间序列中剔除日历效应、假日效应、离群值影响等因素后,验证经过季节处理后的样本时间序列是否符合建模要求。经证明,本申请实施例,选择商务件运单抽样获取的样本时间序列,在经过季节处理后,去除了季节效应的影响,能体现出行业景气发展长期趋势,并通过与经济指标拟合,证明基于物流大数据的行业景气指数相比经济指标具有先行性。因此,通过物流大数据建立的行业景气指数为行业发展提供可信的决策依据,进一步提升物流服务质量。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了本申请实施例提供的行业景气指数生成方法的流程示意图;
图2示出了本申请又一实施例提供的行业景气指数生成方法的流程示意图;
图3示出了本申请实施例提供的行业景气指数生成装置的结构示意图;
图4示出了本申请又一实施例提供的行业景气指数生成装置的结构示意图;
图5示出了适于用来实现本申请实施例的终端设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,图1示出了本申请实施例提供的行业景气指数生成方法的流程示意图。如图1所示,该方法包括:
步骤101,清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据。
物流基础数据是指物流各种活动内容的资料、图像、数据、文件的总称。但是,目前物流行业存在很多不规范的物流基础数据,为了更好地利用物流基础数据来进行分析挖掘,以满足现有物流活动参与各方对信息共享的需求。本申请实施例,对物流基础数据中能够体现企业兴衰的物流数据进行清洗转换,使其满足统一的标准格式,从而便于基于大数据技术挖掘物流数据的规律特性。例如,选择物流数据中托寄物内容,作为研究对象。
步骤102,从原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
本申请实施例中,对原始数据进行抽样处理以获得样本时间序列,通过对样本时序序列进行挖掘分析,以获取样本时间序列的发展规律。物流基础数据是极为丰富的资源,为了更好地分析物流数据与经济指标的内在联系,可以通过筛选与企业发展相关的特征,来构建行业景气指数。例如,目前的企业按照所属行业可以划分为农、林、牧、渔业、制造业等等,其中,制造业又可以细分为食品加工制造业、纺织业、化学纤维制造业、服装、鞋帽、皮革制造业等等。首先,从所属行业中选择能够体现该行业发展的企业作为研究对象,然后,进一步选择与企业相关的物流数据作为挖掘对象。例如,筛选归属某行业的多个企业,能够体现该企业兴衰程度的指标有用电数据、物流数据等,其中物流数据,又可以根据流通的物体划分为文件票据、个人消费品、电子电器、工业制造品等等,其中文件票据作为物流行业的商务件数据,可以直观地反应企业的活动状态,从而反应出企业的经济动向。
本申请实施例,可以基于商务件数据,提取样本时间序列用于挖掘分析。根据企业的商务件量判定该企业是否处于稳定发展时期,例如,根据企业的连续时间范围内的商务件量,可以判定出企业是否满足稳定期条件,对该企业的商务件数据进行提取抽样,获得该企业的样本时间序列用作挖掘对象。
本申请实施例,基于托寄物内容可以生成食品行业的景气指数、个人消费品行业的景气指数、文化娱乐行业的景气指数等等。
步骤103,基于样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成行业景气指数。
本申请实施例,在获取样本时间序列之后,需要根据样本时间序列构建物流景气指数模型,考虑到物流的时间特性具有特殊价值,在构建物流景气指数模型时,加入中国法定节假日(即假日效应),交易日效应以及离群值特性对样本时间序列进行季节调整处理,从而根据调整处理后的样本时间序列生成能够用于指示行业发展的景气指数。
其中,季节调整处理可以是X13季节调整处理方法,或者是X-11季节调整方法。通过季节调整处理可以消除季节效应,从而使得样本时间序列呈现非季节特性。
对样本时间序列进行季节调整后,还需要进行一系列的检验从而判断调整后的样本时间序列去除了季节效应的影响,且能体现出行业景气发展长期趋势。
经过季节调整后的样本时间序列,在经过归一化处理后,还需进行先行性验证,根据先行性验证结果,表明季节调整后的样本时间序列与经济发展指标之间具有因果关系,从而证明物流行业的景气指数是国家经济指标的因,而国家经济指标不是物流行业的景气指数的因,进而将物流行业的景气指数作为行业的先行性指标,用于指导行业的发展。
请参考图2,图2示出了本申请又一实施例提供的行业景气指数生成方法的流程示意图。如图2所示,该方法包括:
步骤201,清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据。
本申请实施中,对物流基础数据中能够体现企业兴衰的物流数据进行清洗转换,使其满足统一的标准格式。例如,对物流数据中托寄物内容项进行清洗转换,可以选择设定时间范围内的物流数据中的托寄物内容。例如,设定时间范围为近3年。选择近3年的企业客户的物流数据,对托寄物内容进行标准化处理。通过标准化处理可以克服现有物流数据因填写不规范导致数据价值较低的问题。
标准化处理托寄物内容之后,通过从托寄物内容中提取关键词,判断该托寄物内容对应的运单归属于类型。例如,如果从托寄物内容提取到保单,则判定保单属于文件票据类,而文件票据类的划分对应物流数据的运单类型,例如商务件运单。根据提取的关键词,可以将托寄物内容按照物品分类模型分为文件票据、个人消费品、电子电器、工业制品、食品医药、文化娱乐、服装鞋帽等等。基于这些分类信息可以构建基于文件票据的景气指数,基于个人消费品的景气指数等等。
本申请实施例中,可选地,清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据,可以包括:
步骤2011,获取设定时间范围内的物流数据中的托寄物内容;
步骤2012,标准化处理托寄物内容;
步骤2013,从托寄物内容中提取关键词;
步骤2014,根据关键词将托寄物内容按物品分类模型进行分类,得到原始数据。
可选地,分类可以包括以下至少一项:文件票据、个人消费品、电子电器、工业制品、食品医药、文化娱乐、服装鞋帽。
步骤202,从原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
本申请实施例,可以基于商务件数据,提取样本时间序列用于挖掘分析。根据企业的商务件量判定该企业是否处于稳定发展时期,例如,根据企业的连续时间范围内的商务件量,可以判定出企业是否满足稳定期条件,对该企业的商务件数据进行提取抽样,获得该企业的样本时间序列用作挖掘对象。
例如从选择的近3年企业的商务件运单作为原始数据,从这些商务件运单中按月抽取样本,并对样本进行筛选判断。例如,选择2014年1月1日到2015年12月31日的多个企业的商务件运单,每个月抽取企业样本集合,并判断被抽取的企业样本集合中每个企业在该月是否处于稳定期,如果不属于稳定期,从本月抽取的企业样本集合中删除不属于稳定期的企业样本,再从原始数据中选择满足稳定期条件的其他企业样本补入到本月抽取的企业样本集合中。
本申请实施例中,步骤202,可以包括:
步骤2021,按月抽取原始数据的样本,得到样本时间序列Yt
步骤2022,判断样本在当月是否从稳定期变更为衰亡期;
步骤2023,如果是,从样本时间序列Yt中删除该样本,并从原始数据中选取与该样本条件相同但属于稳定期的其他样本,并从当月起将其他样本补入样本时间序列Yt
步骤2024,如果否,则样本符合稳定期条件,将样本保留在样本时间序列Yt中。
本申请实施例,通过轮换抽取企业样本,从而保证被抽取的样本数据,可以较好地反应出企业所属行业发展的稳定性。
步骤203,基于样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成行业景气指数。
本申请实施例,在获取样本时间序列之后,需要根据样本时间序列构建物流景气指数模型,考虑到物流的时间特性具有特殊价值,在构建物流景气指数模型时,加入中国法定节假日(即假日效应),交易日效应以及离群值特性对样本时间序列进行季节调整处理,从而根据调整处理后的样本时间序列生成能够用于指示行业发展的景气指数。
其中,季节调整处理可以是X13季节调整处理方法,或者是X-11季节调整方法。通过季节调整处理可以消除季节效应,从而使得样本时间序列呈现非季节特性。
步骤203,可以包括:
步骤2031,结合离群值、假日效应、交易日效应构建基于样本时间序列Yt的物流景气指数模型,得到模型输出序列。
步骤2032,基于模型输出序列以生成行业景气指数。
可选地,步骤2031可以采用X13季节调整处理获取的样本时间序列Yt
从样本时间序列Yt中剔除日历效应、假日效应以及离群值的影响,并对误差序列建立时间序列模型。
在剔除日历效应、假日效应及离群值等影响因素时,需要根据AIC的最小原则,确定是否对样本时间序列Yt进行对数等变换调整,然后对样本时间序列建立线性回归模型,其中,日历效应包括:固定季节效应、闰年效应、月份长度效应、季节长度效应、交易日效应、工作日效应、移动假日效应等。假日效应包括:春节、中秋节、端午节、清明节等。本申请实施例假日效应可以优选春节。离群值可以包括加性离群值、水平漂移、暂时变化、斜线变动、季节性离群值等。
然后,利用时间序列模型对样本时间序列Yt进行前向预测和后向预测,得到初步调整后的样本时间序列Yt (1)
再采用SEATS方法对初步调整后的样本时间序列Yt (1)进行季节调整,得到二次调整后的样本时间序列Yt (2),该二次调整后的样本时间序列Yt (2)作为模型输出序列;
最后,对二次调整后的样本时间序列Yt (2)进行诊断。
通过对样本时间序列进行季节处理,消除了季节对商务件数据的影响。为了验证季节处理后的数据仍然能体现出行业景气发展的长期趋势。还需要对经过季节处理的数据进行多重验证,以判断季节处理后的样本时间序列是符合建模要求的。
例如,判断季节调整后的样本时间序列是否具有平稳性,和/或判断季节调整后的样本时间序列是否残留季节影响成分或者交易日效应等。
其中判断季节调整后的样本序列是否具有平稳性,可以采用4个信号成分的一阶矩和二阶矩校验、平移区间检验、修正历史检验等方式从多个角度对季节调整后的样本时间序列进行判断,可以采用谱分析季节调整后的样本时间序列和不规则成分分量在季节频率和交易日频率处是否存在峰值,从而进一步判断经过季节处理后是否消除季节影响因素和从样本时间序列中剔除交易日效应。
本申请实施例,对样本时间序列进行季节调整后,还需要进行一系列的检验从而判断调整后的样本时间序列去除了季节效应的影响,且能体现出行业景气发展长期趋势。
可选地,步骤2032,还可以包括:
对模型输出序列进行数据归一化处理;
对前述数据归一化处理后的结果进行先行性验证,以生成行业景气指数。
经过季节调整后的样本时间序列,能够用于预测行业发展,需要对其进行验证判断。在验证之前,需要将该模型输出序列或者样本时间序列进一步处理,使其符合参考标准的要求,例如经过归一化处理。以国家经济指标M2为例,将模型输出序列进行对数转换等处理,使得模型输出序列的数值变化范围与M2序列的数值变化范围属于相同的区间,从而可以进一步的验证模型输出序列与M2序列之间的因果关系。
在进行先行性验证时,可以经过单整验证、协整检验、格兰杰因果检验等方式,判断模型输出序列与M2序列之间的因果关系。本申请实施例中经过依次进行单整验证、协整检验、格兰杰因果检验之后,得到基于商务件的样本时间序列是国家经济指标M2的因,而国家经济指标M2不是基于商务件的样本时间序列的因。
本申请实施例,根据先行性验证结果,表明季节调整后的样本时间序列与经济发展指标之间具有因果关系,从而证明物流行业的景气指数是国家经济指标的因,而国家经济指标不是物流行业的景气指数的因,进而将物流行业的景气指数作为行业的先行性指标,用于指导行业的发展。
请参考图3,图3示出了本申请实施例提供的行业景气指数生成装置的结构示意图。如图3所示,该装置300包括:
清洗转换单元301,用于清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据。
物流基础数据是指物流各种活动内容的资料、图像、数据、文件的总称。但是,目前物流行业存在很多不规范的物流基础数据,为了更好地利用物流基础数据来进行分析挖掘,以满足现有物流活动参与各方对信息共享的需求。本申请实施例,对物流基础数据中能够体现企业兴衰的物流数据进行清洗转换,使其满足统一的标准格式,从而便于基于大数据技术挖掘物流数据的规律特性。例如,选择物流数据中托寄物内容,作为研究对象。
样本抽取单元302,用于从原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
本申请实施例中,对原始数据进行抽样处理以获得样本时间序列,通过对样本时序序列进行挖掘分析,以获取样本时间序列的发展规律。物流基础数据是极为丰富的资源,为了更好地分析物流数据与经济指标的内在联系,可以通过筛选与企业发展相关的特征,来构建行业景气指数。例如,目前的企业按照所属行业可以划分为农、林、牧、渔业、制造业等等,其中,制造业又可以细分为食品加工制造业、纺织业、化学纤维制造业、服装、鞋帽、皮革制造业等等。首先,从所属行业中选择能够体现该行业发展的企业作为研究对象,然后,进一步选择与企业相关的物流数据作为挖掘对象。例如,筛选归属某行业的多个企业,能够体现该企业兴衰程度的指标有用电数据、物流数据等,其中物流数据,又可以根据流通的物体划分为文件票据、个人消费品、电子电器、工业制造品等等,其中文件票据作为物流行业的商务件数据,可以直观地反应企业的活动状态,从而反应出企业的经济动向。
本申请实施例,可以基于商务件数据,提取样本时间序列用于挖掘分析。根据企业的商务件量判定该企业是否处于稳定发展时期,例如,根据企业的连续时间范围内的商务件量,可以判定出企业是否满足稳定期条件,对该企业的商务件数据进行提取抽样,获得该企业的样本时间序列用作挖掘对象。
本申请实施例,基于托寄物内容可以生成食品行业的景气指数、个人消费品行业的景气指数、文化娱乐行业的景气指数等等。
景气指数生成单元303,用于基于样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成行业景气指数。
本申请实施例,在获取样本时间序列之后,需要根据样本时间序列构建物流景气指数模型,考虑到物流的时间特性具有特殊价值,在构建物流景气指数模型时,加入中国法定节假日(即假日效应),交易日效应以及离群值特性对样本时间序列进行季节调整处理,从而根据调整处理后的样本时间序列生成能够用于指示行业发展的景气指数。
其中,季节调整处理可以是X13季节调整处理方法,或者是X-11季节调整方法。通过季节调整处理可以消除季节效应,从而使得样本时间序列呈现非季节特性。
对样本时间序列进行季节调整后,还需要进行一系列的检验从而判断调整后的样本时间序列去除了季节效应的影响,且能体现出行业景气发展长期趋势。
经过季节调整后的样本时间序列,在经过归一化处理后,还需进行先行性验证,根据先行性验证结果,表明季节调整后的样本时间序列与国家经济发展指标之间具有因果关系,从而证明物流行业的景气指数是国家经济指标的因,而国家经济指标不是物流行业的景气指数的因,进而将物流行业的景气指数作为行业的先行性指标,用于指导行业的发展。
请参考图4,图4示出了本申请又一实施例提供的行业景气指数生成装置的结构示意图。如图4所示,该装置400包括:
清洗转换单元401,用于清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据。
本申请实施中,对物流基础数据中能够体现企业兴衰的物流数据进行清洗转换,使其满足统一的标准格式。例如,对物流数据中托寄物内容项进行清洗转换,可以选择设定时间范围内的物流数据中的托寄物内容。例如,设定时间范围为近3年。选择近3年的企业客户的物流数据,对托寄物内容进行标准化处理。通过标准化处理可以克服现有物流数据因填写不规范导致数据价值较低的问题。
标准化处理托寄物内容之后,通过从托寄物内容中提取关键词,判断该托寄物内容对应的运单归属于类型。例如,如果从托寄物内容提取到保单,则判定保单属于文件票据类,而文件票据类的划分对应物流数据的运单类型,例如商务件运单。根据提取的关键词,可以将托寄物内容按照物品分类模型分为文件票据、个人消费品、电子电器、工业制品、食品医药、文化娱乐、服装鞋帽等等。基于这些分类信息可以构建基于文件票据的景气指数,基于个人消费品的景气指数等等。
本申请实施例中,可选地,清洗转换单元401,可以包括:
获取子单元4011,用于获取设定时间范围内的物流数据中的托寄物内容;
标准化处理子单元4012,用于标准化处理托寄物内容;
关键词提取子单元4013,用于从托寄物内容中提取关键词;
分类子单元4014,用于根据关键词将托寄物内容按物品分类模型进行分类,得到原始数据。
可选地,分类可以包括以下至少一项:文件票据、个人消费品、电子电器、工业制品、食品医药、文化娱乐、服装鞋帽。
样本抽取单元402,用于从原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
本申请实施例,可以基于商务件数据,提取样本时间序列用于挖掘分析。根据企业的商务件量判定该企业是否处于稳定发展时期,例如,根据企业的连续时间范围内的商务件量,可以判定出企业是否满足稳定期条件,对该企业的商务件数据进行提取抽样,获得该企业的样本时间序列用作挖掘对象。
例如从选择的近3年企业的商务件运单作为原始数据,从这些商务件运单中按月抽取样本,并对样本进行筛选判断。例如,选择2014年1月1日到2015年12月31日的多个企业的商务件运单,每个月抽取企业样本集合,并判断被抽取的企业样本集合中每个企业在该月是否处于稳定期,如果不属于稳定期,从本月抽取的企业样本集合中删除不属于稳定期的企业样本,再从原始数据中选择满足稳定期条件的其他企业样本补入到本月抽取的企业样本集合中。
本申请实施例中,样本抽取单元402,可以包括:
第一抽取子单元4021,用于按月抽取原始数据的样本,得到样本时间序列Yt
判断子单元4022,用于判断样本在当月是否从稳定期变更为衰亡期;
样本补入子单元4023,用于如果是,从样本时间序列Yt中删除该样本,并从原始数据中选取与该样本条件相同但属于稳定期的其他样本,并从当月起将其他样本补入样本时间序列Yt;如果否,则样本符合稳定期条件,将样本保留在样本时间序列Yt中。
本申请实施例,通过轮换抽取企业样本,从而保证被抽取的样本数据,可以较好地反应出企业所属行业发展的稳定性。
景气指数生成单元403,基于样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成行业景气指数。
本申请实施例,在获取样本时间序列之后,需要根据样本时间序列构建物流景气指数模型,考虑到物流的时间特性具有特殊价值,在构建物流景气指数模型时,加入中国法定节假日(即假日效应),交易日效应以及离群值特性对样本时间序列进行季节调整处理,从而根据调整处理后的样本时间序列生成能够用于指示行业发展的景气指数。
可选地,季节调整处理可以是X13季节调整处理方法,或者是X-11季节调整方法。通过季节调整处理可以消除季节效应,从而使得样本时间序列呈现非季节特性。
可选地,景气指数生成单元403,可以包括:
景气指数模型构建子单元4031,用于结合离群值、假日效应、交易日效应构建基于样本时间序列Yt的物流景气指数模型,得到模型输出序列。
景气指数生成子单元4032,用于基于模型输出序列以生成行业景气指数。
可选地,景气指数模型构建子单元4031可以采用X13季节调整处理获取的样本时间序列Yt。可选地,其可以包括:
第一子单元,用于从样本时间序列Yt中剔除日历效应、假日效应以及离群值的影响,并对误差序列建立时间序列模型。
在剔除日历效应、假日效应及离群值等影响因素时,需要根据AIC的最小原则,确定是否对样本时间序列Yt进行对数等变换调整,然后对样本时间序列建立线性回归模型,其中,日历效应包括:固定季节效应、闰年效应、月份长度效应、季节长度效应、交易日效应、工作日效应、移动假日效应等。假日效应包括:春节、中秋节、端午节、清明节等。本申请实施例假日效应可以优选春节。离群值可以包括加性离群值、水平漂移、暂时变化、斜线变动、季节性离群值等。
第二子单元,用于利用时间序列模型对样本时间序列Yt进行前向预测和后向预测,得到初步调整后的样本时间序列Yt (1)
第三子单元,用于采用SEATS方法对初步调整后的样本时间序列Yt (1)进行季节调整,得到二次调整后的样本时间序列Yt (2),该二次调整后的样本时间序列Yt (2)作为模型输出序列;
诊断子单元,用于对二次调整后的样本时间序列Yt (2)进行诊断。
通过对样本时间序列进行季节处理,消除了季节对商务件数据的影响。为了验证季节处理后的数据能体现出行业景气发展的长期趋势。还需要对经过季节处理的数据进行多重验证,以判断季节处理后的样本时间序列是符合建模要求的。
例如,判断季节调整后的样本时间序列是否具有平稳性,和/或判断季节调整后的样本时间序列是否残留季节影响成分或者交易日效应等。
其中判断季节调整后的样本序列是否具有平稳性,可以采用4个信号成分的一阶矩和二阶矩校验、平移区间检验、修正历史检验等方式从多个角度对季节调整后的样本时间序列进行判断,可以采用谱分析季节调整后的样本时间序列和不规则成分分量在季节频率和交易日频率处是否存在峰值,从而进一步判断经过季节处理后是否消除季节影响因素和从样本时间序列中剔除交易日效应。
本申请实施例,对样本时间序列进行季节调整后,还需要进行一系列的检验从而判断调整后的样本时间序列去除了季节效应的影响,且能体现出行业景气发展长期趋势。
可选地,景气指数生成子单元4032,还可以包括:
数据处理子单元,用于对模型输出序列进行数据归一化处理;
验证子单元,用于对前述数据归一化处理的结果进行先行性验证,以生成行业景气指数。
经过季节调整后的样本时间序列,能够用于预测行业发展,需要对其进行验证判断。在验证之前,需要将该模型输出序列或者样本时间序列进一步处理,使其符合参考标准的要求,例如经过归一化处理。以国家经济指标M2为例,将模型输出序列进行对数转换等处理,使得模型输出序列的数值变化范围与M2序列的数值变化范围属于相同的区间,从而可以通过进一步的验证,判断模型输出序列与M2序列之间的因果关系。
在进行先行性验证时,可以经过单整验证、协整检验、格兰杰因果检验等方式,判断模型输出序列与M2序列之间的因果关系。本申请实施例中通过依次进行单整验证、协整检验、格兰杰因果检验之后,得到基于商务件的样本时间序列是经济指标M2的因,而经济指标M2不是基于商务件的样本时间序列的因。
本申请实施例,根据先行性验证结果,表明季节调整后的样本时间序列与经济发展指标之间具有因果关系,从而证明物流行业的景气指数是国家经济指标的因,而国家经济指标不是物流行业的景气指数的因,进而将物流行业的景气指数作为行业的先行性指标,用于指导行业的发展。
应当理解,装置300或400中记载的诸单元或模块与参考图1或2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置300或400及其中包含的单元,在此不再赘述。装置300或400可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。装置300或400中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考图1或2描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,前述计算机程序包含用于执行图1或2的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括清洗转换单元、样本抽取单元以及景气指数生成单元。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,清洗转换单元还可以被描述为“用于清洗转换设定时间范围内物流数据中的托寄物内容的单元”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中前述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,前述程序被一个或者一个以上的处理器用来执行描述于本申请的行业景气指数生成方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (19)

1.一种行业景气指数生成方法,其特征在于,该方法包括:
清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据;
从所述原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
基于所述样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成所述行业景气指数。
2.根据权利要求1所述的方法,其特征在于,所述清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据,包括:
获取所述设定时间范围内的物流数据中的托寄物内容;
标准化处理所述托寄物内容;
从所述托寄物内容中提取关键词;
根据所述关键词将所述托寄物内容按物品分类模型进行分类,得到所述原始数据。
3.根据权利要求2所述的方法,其特征在于,所述分类包括以下至少一项:文件票据、个人消费品、电子电器、工业制品、食品医药、文化娱乐、服装鞋帽。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述从所述原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt,包括:
按月抽取所述原始数据的样本,得到所述样本时间序列Yt;
判断所述样本在当月是否从稳定期变更为衰亡期;
如果是,从所述样本时间序列Yt中删除该样本,并从所述原始数据中选取与该样本条件相同但属于稳定期的其他样本,并从当月起将所述其他样本补入样本时间序列Yt;如果否,则所述样本符合稳定期条件,将所述样本保留在所述样本时间序列Yt中。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述基于所述样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成所述行业景气指数,包括:
结合离群值、假日效应、交易日效应构建基于所述样本时间序列Yt的物流景气指数模型,得到所述模型输出序列;
基于所述模型输出序列以生成所述行业景气指数。
6.根据权利要求5所述的方法,其特征在于,所述结合离群值、假日效应、交易日效应构建基于所述样本时间序列Yt的物流景气指数模型,得到所述模型输出序列,包括:
从所述样本时间序列Yt中剔除日历效应、假日效应以及离群值的影响,并对误差序列建立时间序列模型;
利用所述时间序列模型对所述样本时间序列Yt进行前向预测和后向预测,得到初步调整后的样本时间序列
采用SEATS方法对所述初步调整后的样本时间序列进行季节调整,得到二次调整后的样本时间序列所述二次调整后的样本时间序列作为模型输出序列;
对所述二次调整后的样本时间序列进行诊断。
7.根据权利要求5所述的方法,其特征在于,所述基于所述模型输出序列以生成所述行业景气指数,包括:
对所述模型输出序列进行数据归一化处理;
对所述数据归一化处理后的结果进行先行性验证,以生成所述行业景气指数。
8.根据权利要求6所述的方法,其特征在于,所述对所述调整后的样本时间序列进行诊断,包括:
根据4个信号成分的一阶矩和二阶矩检验,所述二次调整后的样本时间序列和不规则成分的谱分析,平移区间检验以及修正历史检验,判断所述二次调整后的样本时间序列是否符合建模标准。
9.根据权利要求7所述的方法,其特征在于,所述对所述数据归一化处理后的结果进行先行性验证,包括:
对所述数据归一化处理后的结果依次进行单整验证、协整检验、格兰杰因果检验。
10.一种行业景气指数生成装置,其特征在于,该装置包括:
清洗转换单元,用于清洗转换设定时间范围内的物流数据中的托寄物内容,得到原始数据;
样本抽取单元,用于从所述原始数据中抽取符合稳定期条件的样本,得到样本时间序列Yt
模型构建单元,用于基于所述样本时间序列Yt构建物流景气指数模型,得到模型输出序列以生成所述行业景气指数。
11.根据权利要求10所述的装置,其特征在于,所述清洗转换单元,包括:
获取子单元,用于获取所述设定时间范围内的物流数据中的托寄物内容;
标准化处理子单元,用于标准化处理所述托寄物内容;
关键词提取子单元,用于从所述托寄物内容中提取关键词;
分类子单元,用于根据所述关键词将所述托寄物内容按物品分类模型进行分类,得到所述原始数据。
12.根据权利要求10-11任一项所述的装置,其特征在于,所述样本抽取单元,包括:
第一抽取子单元,用于按月抽取所述原始数据的样本,得到所述样本时间序列Yt
判断子单元,用于判断所述样本在当月是否从稳定期变更为衰亡期;
样本补入子单元,用于如果是,从所述样本时间序列Yt中删除该样本,并从所述原始数据中选取与该样本条件相同的其他样本,从当月起将所述其他样本补入样本时间序列Yt;如果否,则所述样本符合稳定期条件,将所述样本保留在所述样本时间序列Yt中。
13.根据权利要求9-11任一项所述的装置,其特征在于,所述模型构建单元,包括:
景气指数模型构建子单元,用于结合离群值、假日效应、交易日效应构建基于所述样本时间序列Yt的物流景气指数模型,得到模型输出序列;
景气指数生成子单元,用于基于所述模型输出序列以生成所述行业景气指数。
14.根据权利要求13所述的装置,其特征在于,所述景气指数模型构建子单元,还包括:
第一子单元,用于从所述样本时间序列Yt中剔除日历效应、假日效应以及离群值的影响,并对误差序列建立时间序列模型;
第二子单元,用于利用所述时间序列模型对所述样本时间序列Yt进行前向预测和后向预测,得到初步调整后的样本时间序列
第三子单元,用于采用SEATS方法对所述初步调整后的样本时间序列进行季节调整,得到二次调整后的样本时间序列所述二次调整后的样本时间序列作为模型输出序列;
诊断子单元,用于对所述二次调整后的样本时间序列进行诊断。
15.根据权利要求13所述的装置,其特征在于,所述景气指数生成子单元,包括:
数据处理子单元,用于对所述模型输出序列进行数据归一化处理所述;
验证子单元,用于对所述数据归一化处理后的结果进行先行性验证,以生成所述行业景气指数。
16.根据权利要求14所述的装置,其特征在于,所述诊断子单元,包括:
用于根据4个信号成分的一阶矩和二阶矩检验,所述二次调整后的样本时间序列和不规则成分的谱分析,平移区间检验以及修正历史检验,判断所述二次调整后的样本时间序列是否符合建模标准。
17.根据权利要求15所述的装置,其特征在于,所述验证子单元,包括:
用于对所述数据归一化处理后的结果依次进行单整验证、协整检验、格兰杰因果检验。
18.一种设备,包括处理器、存储装置;其特征在于:
所述存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述处理器执行,使得所述处理器实现如权利要求1-9中任一项所述的方法。
19.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-9中任一项所述的方法。
CN201711373687.3A 2017-12-19 2017-12-19 行业景气指数生成方法、装置、设备及其存储介质 Active CN108287867B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711373687.3A CN108287867B (zh) 2017-12-19 2017-12-19 行业景气指数生成方法、装置、设备及其存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711373687.3A CN108287867B (zh) 2017-12-19 2017-12-19 行业景气指数生成方法、装置、设备及其存储介质

Publications (2)

Publication Number Publication Date
CN108287867A true CN108287867A (zh) 2018-07-17
CN108287867B CN108287867B (zh) 2021-11-23

Family

ID=62832039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711373687.3A Active CN108287867B (zh) 2017-12-19 2017-12-19 行业景气指数生成方法、装置、设备及其存储介质

Country Status (1)

Country Link
CN (1) CN108287867B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226779A (zh) * 2013-03-26 2013-07-31 广东林安物流发展有限公司 公路物流价格指数
KR20140041665A (ko) * 2014-03-17 2014-04-04 황금찬 물류 배송 스케줄 자동 제공 방법
CN104657788A (zh) * 2015-02-04 2015-05-27 国家电网公司 基于行业景气指数的重点行业用电量预测方法
CN104881718A (zh) * 2015-06-02 2015-09-02 国家电网公司 基于多尺度经济先行指标的区域电力景气指数构建方法
CN105701729A (zh) * 2016-01-29 2016-06-22 江苏省电力公司电力经济技术研究院 一种基于电力景气指数的电量预测方法
CN105741019A (zh) * 2016-01-22 2016-07-06 江苏省电力公司电力经济技术研究院 一种电力景气预警方法
CN105844351A (zh) * 2016-03-22 2016-08-10 广西电网有限责任公司电力科学研究院 一种电力用电市场景气指数预测方法
CN205899601U (zh) * 2016-07-25 2017-01-18 四川建筑职业技术学院 一种基于北斗卫星导航系统的物流实时定位查询系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226779A (zh) * 2013-03-26 2013-07-31 广东林安物流发展有限公司 公路物流价格指数
KR20140041665A (ko) * 2014-03-17 2014-04-04 황금찬 물류 배송 스케줄 자동 제공 방법
CN104657788A (zh) * 2015-02-04 2015-05-27 国家电网公司 基于行业景气指数的重点行业用电量预测方法
CN104881718A (zh) * 2015-06-02 2015-09-02 国家电网公司 基于多尺度经济先行指标的区域电力景气指数构建方法
CN105741019A (zh) * 2016-01-22 2016-07-06 江苏省电力公司电力经济技术研究院 一种电力景气预警方法
CN105701729A (zh) * 2016-01-29 2016-06-22 江苏省电力公司电力经济技术研究院 一种基于电力景气指数的电量预测方法
CN105844351A (zh) * 2016-03-22 2016-08-10 广西电网有限责任公司电力科学研究院 一种电力用电市场景气指数预测方法
CN205899601U (zh) * 2016-07-25 2017-01-18 四川建筑职业技术学院 一种基于北斗卫星导航系统的物流实时定位查询系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
陈治国 等: "基于状态空间模型的我国物流业对经济增长的传导效应研究", 《产经评论》 *
高学贤等: "基于灰色关联分析的山东区域物流与经济发展协调性评价", 《河南科学》 *

Also Published As

Publication number Publication date
CN108287867B (zh) 2021-11-23

Similar Documents

Publication Publication Date Title
CN110400021B (zh) 银行网点现金用量预测方法及装置
EP3037991A1 (en) Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
CN110458107A (zh) 用于图像识别的方法和装置
CN107704871A (zh) 生成机器学习样本的组合特征的方法及系统
US20140012800A1 (en) Apparatus and method for providing application for processing big data
CN107451266A (zh) 用于处理数据方法及其设备
CN110308946A (zh) 基于人工智能的跑批处理方法、设备、存储介质及装置
CN109828906A (zh) Ui自动化测试方法、装置、电子设备及存储介质
US20200320125A1 (en) Automated system and method to extract and present quantitative information through predictive analysis of data
CN110059267A (zh) 数据分析结果的展示方法、装置、计算机设备及存储介质
CN107622326A (zh) 用户分类、可用资源预测方法、装置及设备
CN107729469A (zh) 用户挖掘方法、装置、电子设备及计算机可读存储介质
CN114757307A (zh) 一种人工智能自动训练方法、系统、装置及存储介质
CN110231974A (zh) 运维信息的可视化方法、装置、设备及可读存储介质
CN115576834A (zh) 支撑故障还原的软件测试复用方法、系统、终端及介质
CN109284342A (zh) 用于输出信息的方法和装置
Hao A study of ecologically unequal exchange for 89 countries between 1990 and 2015
Arasteh et al. Using multi-attribute decision-making approaches in the selection of a hospital management system
CN116503026B (zh) 科技项目的运维风险评估方法、系统及存储介质
CN110807159B (zh) 数据标记方法、装置、存储介质及电子设备
CN108287867A (zh) 行业景气指数生成方法、装置、设备及其存储介质
CN114972931A (zh) 一种基于知识蒸馏的货物存放方法及装置
CN114936160A (zh) 一种产品的测试需求范围分析方法及装置
Hamilton et al. Integrated assessment frameworks for understanding pathways for socially inclusive agricultural intensification
CN113379212A (zh) 基于区块链的物流信息平台违约风险评估方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant