CN106600310B - 一种基于网络搜索指数进行销量预测的方法和系统 - Google Patents

一种基于网络搜索指数进行销量预测的方法和系统 Download PDF

Info

Publication number
CN106600310B
CN106600310B CN201610964787.2A CN201610964787A CN106600310B CN 106600310 B CN106600310 B CN 106600310B CN 201610964787 A CN201610964787 A CN 201610964787A CN 106600310 B CN106600310 B CN 106600310B
Authority
CN
China
Prior art keywords
keyword
keywords
correlation
index
search index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610964787.2A
Other languages
English (en)
Other versions
CN106600310A (zh
Inventor
蹇洁
吴如海
袁恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201610964787.2A priority Critical patent/CN106600310B/zh
Publication of CN106600310A publication Critical patent/CN106600310A/zh
Application granted granted Critical
Publication of CN106600310B publication Critical patent/CN106600310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明请求保护一种基于网络搜索指数进行销量预测的方法和系统,涉及计算机信息处理技术领域,是一种基于消费者信息搜索与产品实际销量相关性,建立网络搜索指数合成体系,进行产品的市场销量预测的系统及方法;所述系统包括构建关键词库模块、关键词搜索指数合成模块和产品销量预测模块。结合产品相关特征、影响因素与网络搜索指数构建关键词库,分析关键词的时差阶数与相关性,将该期的历史销量数据作为基准指标,进而根据关键词搜索数据与基准指标对关键词进行主成分分析及综合搜索指数构建,确保预测的有效性;本发明克服现有系统易造成数据缺失或者噪声数据过多的缺陷,能够广泛用于电商平台。

Description

一种基于网络搜索指数进行销量预测的方法和系统
技术领域
本发明涉及计算机信息处理技术领域,是一种基于消费者信息搜索与产品实际销量相关性,建立网络搜索指数合成体系,并结合网络搜索指数与历史销量数据,进行产品的市场销量预测的系统及方法。
背景技术
在产品市场销量预测中,传统预测方法对部分领域,尤其是即时市场和新兴市场预测尤为乏力,有很强的应用领域限制。
互联网与移动应用在互联网时代得到了指数级的应用增长与普及,日本电通集团与2005年结合互联网时代特点,提出了基于网络购买消费者行为的AISAS(Attention、Interest、Search、Action、Share)分析模型。中国互联网信息中心发布的我国网民搜索行为研究报告表示,70%左右的用户在有购物需求时会通过搜索引擎搜索相关信息。消费者的实际产品购买需求的变化最直接的市场表象就是产品市场销量的变化,而在网络信息上的表现则主要是相关网络信息搜索及浏览指标的变化,并且,两种信息的变化在时间维度上存在一定的时滞。
与本申请最接近的现有技术,公开号为CN 105701553,名称为商品销量预测系统及商品销量预测方法的中国专利申请,该专利申请披露了一个销量预测系统和相关使用方法。上述方法是通过收集累计成交数、相关品类商品数据与消费者评论,来针对电子商务平台的销量进行预测。该方法的应用要求收集累计成交数、相关品类商品数据和消费者评论数据,缺一不可。因此该方法的应用也局限与电子商务平台。在收集商品成交数时,难以判断和过滤刷单现象产生的无效购买;在定义相关品类商品时依赖主观性,会造成数据缺失或者噪声数据过多;在收集消费者评论数据的工作中,难以过滤虚假评论,时效性差、关联性弱的评论。
本申请为打破上述方法的局限性,提出一种客观有效且具有普适性的基于网络搜索指数进行销量预测的方法和系统。能够为商家提供准确的市场信息,能能够针对客户需要为其提供更优质的服务。
发明内容
本发明针对现有技术中电商平台为商家提供商品销量预测,以便对进货和库存需求进行指导的预测模型对数据来源齐全性要求苛刻、数据处理难判断有效性、应用领域局限于电子商务平台等问题,提供一种根据产品的网络搜索指数,对该产品未来的销量进行预测的可行方法。该申请的方法可用于电子商务、市场营销和库存管理等多个领域。
本发明提出一种基于网络搜索指数进行销量预测的方法和系统。该预测方法和系统可利用网络搜索指数平台建立起用于销量预测的网络搜索关键词库,并基于关键词库提取出关键词的主成分,结合产品的历史销量数据和网络搜索指数来预测产品市场销量。本发明的方案与最接近的现有技术相比,无需判断产品评论信息的真实性、有效性,也不受刷单等多种复杂情况所产生的噪声数据影响,应用领域也不局限于电子商务平台。任何人都可以通过本发明实现具有更强的有效性、更高的时效性和更广泛的应用领域的产品市场销量预测,具有更高的实用价值。
本发明解决上述技术问题的技术方案是:一种基于网络搜索指数的产品销量预测系统,包括:构建关键词库模块,用于搜寻初始关键词,调用指数平台对初始关键词进行优化,选择相关性强的关键词,获得关键词搜索指数数据,根据关键词搜索指数数据对初始关键词进行过滤,剔除重复和数据量缺失严重的关键词,获得初始关键词库,对初始关键词库进行评价,筛选出相关性高的先行关键词,构建预测关键词库;关键词搜索指数合成模块,用于根据相关性系数将关键词进行分类,根据关键词的相关性系数与领先阶数的关系,将关键词的搜索数据与基准指标进行错位对齐,对每个关键词搜索指数及销量数据做标准化处理,对关键词搜索指数做主成分分析,获取正相关关键词搜索指数和负相关关键词搜索指数;产品销量预测模块,根据关键词搜索指数调用预测模型进行产品销量预测,向产品配送中心传送机构输出信号控制向相关地区的产品分配。
(1)构建关键词库模块:构建关键词库模块用于根据确定的初始关键词进行搜寻,借助指数平台对关键词进行优化,选择相关性强的关键词,获得关键词搜索指数数据,对关键词搜索指数数据中的关键词进行过滤,剔除重复和数据量严重缺失的关键词,获得原始关键词库。对原始关键词库进行评价,筛选出相关性高的先行关键词,构建预测需要的关键词库。
关键词并非越多越好,当关键词覆盖面达到一定程度后,新关键词的边际贡献非常有限,因此要选取核心的关键词构成关键词库。构建关键词库遵循两个原则,一是考虑关键词经济含义的重要性,即所选关键词必须要能够反应基准指标影响因素的一个方面、能反应消费者的一种行为,构成关键词库的所有关键词的组合能够反应基准指标的主要方面;二是关键词统计上的充分性,即关键词的搜索指数数据序列应该有一定的连续性。
进一步地,构建关键词库模块包括关键词提取单元、关键词过滤单元、关键词时差分析单元、关键词相关性分析单元。
关键词提取单元,用于获取一个结合产品影响因素和相关搜索指数的基础关键词库。
优选地,所述关键词提取单元包括建立初始关键词库子单元,用于充分考虑包括产品性能参数、品牌名称、竞品名称等与产品本身直接或间接相关的因素,选取一批潜在相关性的基础关键词作为初始关键词。
优选地,所述关键词提取单元包括扩充初始关键词库子单元,用于根据搜索指数平台的相关性和搜索数据,将与产品相关性高的关键词纳入初始关键词库。
关键词过滤单元,用于剔除重复出现的关键词和数据信息严重缺失的关键词,直至只保留一个相关关键词,并结合预测目标,剔除搜索指数平台未收录的关键词。
关键词时差分析单元,用于对关键词进行时差分析,调用百度搜索指数平台,搜集产品关键词第i月搜索数据,记为xi,搜集产品第i月实际市场销售数量,记为yi
调用公式:
Figure GDA0001234121940000051
其中,p=0,±1,±2,…,±L,(0—L之间的整数)
对关键词进行时差相关分析。枚举p的各rp种情况,计算对应的相关性系数rp,获得每个关键词的相关性系数rp和领先阶数p的对应关系。
公式(1)中,y为预测研究对象,可以是产品的实际销量,
Figure GDA0001234121940000052
为预测对象均值;x为被选择指标,这里指关键词的网络搜索指数数据,
Figure GDA0001234121940000053
为关键词的网络搜索指数数据均值;rp为p时的相关性系数;p表示x领先或滞后y的时差阶数,p取负数表示超前,p取正数表示滞后,L为最大时差阶数;n为网络搜索指数数据个数。
滞后关键词对预测没有帮助,因此选取p为负数的关键词,即先行关键词。公式(1)通过对比关键词搜索指数与产品销量,计算获得每个关键词的相关性系数rp和领先阶数p的对应关系。
关键词相关性分析单元,用于分析关键词与产品的相关性。
优选地,所述关键词相关性分析单元包括确定领先阶数子单元,用于通过计算关键词库中每个关键词搜索指数与基准指标先行1~12期的皮尔逊相关系数(PearsonCorrelation Coefficient)rp,对rp值的绝对值进行排序,当关键词相关性系数的绝对值取最大时,p即为关键词搜索指数与基准指标的时差阶数,对应rp则为关键词相关系数,rp>0则表示关键词正相关,rp<0则表示关键词负相关。
选取p为负数,确定具有先行相关关系的关键词;计算具有先行相关关系的关键词的相关系数rp;设置弱相关临界值,相关系数的绝对值低于弱相关临界值的关键词为弱相关关键词。剔除滞后的关键词(p为正数的关键词)和弱相关的关键词,构建用于产品销量预测的关键词词库。
(2)关键词搜索指数合成模块:关键词搜索指数合成模块包括错位对齐单元和主成分分析单元,用于提取正、负合成相关合成指数。
错位对齐单元,用于将关键词的搜索量和基准指标进行错位对齐。基于构建的关键词词库,根据相关系数的正、负将关键词进行分类,将关键词分为正相关关键词和负相关关键词。根据所得的关键词领先阶数p,以该期的实际销量作为基准指标,将有超前关键词的搜索数据,按照其领先阶数向后移p期,与基准指标进行错位对齐,对每个关键词搜索指数及销量数据做标准化处理。
主成分分析单元,用于提取正相关关键词和负相关关键词的主成分,将其合成为正类别关键词搜索指数和负类别关键词搜索指数。调用SPSS22.0(第22版统计产品与服务解决方案系统),对关键词搜索指数数据做主成分分析,获得各个核心关键词主成分对产品销量预测的贡献程度,提取正类别合成搜索指数和负类别合成搜索指数。
分析各个关键词主成分对产品销量预测的贡献程度:
收集所有关键词,假设所预测的产品有P个考察指标,记第i个考察指标为Xi,将这P个随机变量成列,构成随机向量X=(X1,X2,…,Xp)Τ,其中角标T表示对矩阵转秩。求X的均值向量μ和协方差矩阵∑,即X~N(μ,Σ),即X服从均值向量为μ,协方差矩阵为∑的正太分布。对X进行正交变换计算,得到主成分向量Y=(Y1,Y2,…,Yp)Τ。该正交变换考虑合成变量的方差大小及对其原始变量波动的贡献大小,而对于原始随机变量X1,X2,…,Xp,其协方差矩阵或相关矩阵是对各变量离散程度和相关程度的度量。
设λ1≥λ2≥…≥λp≥0为∑的特征值,以λ1相应的特征向量a1为系数,使得Y1=a1 ΤX满足方差最大,即var(Y1)=a1 ΤΣa1达到最大,则称Y1为随机变量X的第一主成分,对应的特征根λ1即为Y1的方差,且第一主成分的贡献度为
Figure GDA0001234121940000071
以此同样的方法计算Yi的方差var(Yi)i=1,2,...,p,对主成分向量中所有元素Y1,Y2,…,Yp的方差从大到小排序,方差λi的值越大则表示对应主成分Yi的贡献度越大。
根据初始特征值的大小,提取正相关关键词搜索指数和负相关关键词搜索指数的主成分,合计初始特征值<1的则舍去。设正相关关键词共计m个,负相关关键词共计n个,计算正相关主成分的特征向量矩阵(a1,a2…am)T,正相关关键词搜索指数为Qi=a1X1+a2X2+…+amXm;计算负相关主成分的特征向量矩阵(a1',a2'…an')T,负相关关键词搜索指数为qi=a1'X1+a2'X2+…+an'Xn。其中,每个正相关关键词搜索指数Qi和每个负相关关键词搜索指数qi都单独计算,故ai、ai'与Xi都是各自对应的特征向量和考察指标的值(p=0,±1,±2,…,±p)。
(3)产品销量预测模块:
产品销量预测模块,用于根据关键词搜索指数调用预测模型进行预测。
Figure GDA0001234121940000081
根据关键词搜索指数调用预测模型进行预测。对预测时期内产品的销量进行预测。其中,Volumet为t时期的产品销量;Qi,t和qi,t分别表示由关键词网络搜索指数合成时所提取出的第i个正相关合成指数和第i个负相关合成指数主成分在第t期(与基准销量指标错位对齐后的时期)的值,其中,正相关合成指数共计m个,负相关合成指数共计n个;Volumet-1、Volumet-12分别为前1期和前1年同时期的产品销量,Volumet-1作为前1期的销量数据,包含众多销量变化的历史信息,Volumet-12作为前1年同时期的销量数据,包含销量的季节性变动因素;εt为模型的残差项,β0为常数项,由回归结果所得。
本发明具有更强的有效性、更高的时效性和更广泛的应用领域的产品市场销量预测,通过对与产品相关的关键词及相关度分析,获取相关度高的关键词和数据,过滤掉相关度低的关键词,提高分析的效率和准确性,克服现有技术产品预测分析中易造成数据缺失或者噪声数据过多,具有相当高的实用价值。
附图说明
图1是消费者网络信息搜索与产品市场销量模型框架;
图2是网络搜索关键词库构建流程图;
图3是网络搜索指数体系建设流程图。
具体实施方式
以下结合附图及具体实施方式,对本发明作进一步的详细描述。
本发明基于消费者信息搜索与产品实际销量,结合网络搜索指数与历史销量数据,对产品的销量进行预测并控制输出的方法。
如图1所示为消费者的网络搜索与产品市场销量的关系流程图。
消费者产生消费需求之后,制定购买决策之前,会进行大量的信息搜集工作。包括利用网络搜索查看产品信息;通过浏览行业网站、新闻、论坛等了解与产品有关的信息;并且会借助论坛、贴吧等对产品进行讨论。其中,利用网络搜索引擎来进行网络搜索是最为普遍和常用的手段。而在不同的阶段,会产生相应的关键词,如需求阶段关键词、决策阶段关键词和购后阶段关键词。而通过这些关键词搜集的信息则会影响和指导消费者的购买决策和购后行为。因此这些关键词和产品的实际市场销量有必然的相关关系,和较实际销量先行或者滞后的关系。因此我们可以通过结合产品销量的历史数据与网络搜索数据来对产品的市场销量进行预测。控制相关产品的生产、进货及库存等。
如图2所示为网络搜索关键词库的构建流程图。
首先建立初始关键词库。基于理论分析并结合对产品行业特性的充分考虑,从宏观层面和微观层面进行搜索关键词初步确定。宏观层面可考虑国家整体消费水平与消费环境等;微观层面可考虑与产品有直接或间接相关的影响因素,如性能、品牌和竞品等。之后综合小组讨论法初步选取可能存在潜在相关性的基础关键词。然后扩充关键词库。在初始关键词库基础上,使用“百度指数”平台关键词推荐技术进一步扩充关键词考察范围。具体实施就是:
STEP1.针对与产品本身直接或间接相关的因素,充分考虑包括产品性能参数、品牌名称、竞品名称等与产品本身直接或间接相关的因素,选取一批潜在相关性的基础关键词作为初始关键词;
STEP2.调用“百度指数”平台的“趋势研究”模块,键入关键词,点击搜索即可获得关键词搜索指数数据;
STEP3.调用“百度指数”平台“需求图谱”模块,获得键入关键词的消费者需求信息和该关键词的相关关键词;
STEP4.在“百度指数”平台的“需求图谱”中,选择相关性强的关键词,键入这些相关性强的关键词,点击搜索获得关键词搜索指数数据。
重复第2、3、4个步骤,找出足够的关键词搜索指数数据。
关键词过滤单元对关键词搜索指数数据中的关键词进行过滤。剔除重复和部分数据量缺失严重的关键词,如原始搜索指数数据过多为0的关键词。然后结合预测目的的需要,过滤掉“百度指数”平台未收录的关键词。获得原始关键词库。
根据上述三个步骤已获得原始关键词库,接下来进行关键词评价,获取用于问题分析及市场预测网络搜索关键词库。运用时差相关分析来筛选出相关性较高且具有先行关键词,构成预测需要的关键词库。调用公式:
Figure GDA0001234121940000101
其中,p=0,±1,±2,…,±L
对关键词进行相关分析与时差分析,枚举p的各种情况,计算对应的相关性系数rp,获得每个关键词的相关性系数rp和领先阶数p的对应关系。
公式(1)中,y指预测研究对象,这里指产品的实际销量,yi为产品第i月的实际市场销量,
Figure GDA0001234121940000111
为预测对象均值;x为被选择指标,这里指关键词的网络搜索指数数据,xi为产品关键词第i月的搜索数据,
Figure GDA0001234121940000112
为关键词的网络搜索指数数据均值;rp为p时的相关性系数;p表示x领先或滞后y的时差阶数,p取负数表示超前,p取正数表示滞后,L为最大时差阶数;n为取齐后的数据个数。
只保留p为负数,选取p为负数的关键词,即有领先性的先行关键词。为预测需要,剔除p为正数对应的关键词,即滞后关键词,滞后关键词为噪声数据对预测没有帮助。
关键词相关性分析模块,对关键词进行相关性分析。通过计算关键词库中每个关键词搜索指数与基准指标先行预定期(1~12期)的皮尔逊相关系数(Pearson CorrelationCoefficient)rp确定领先阶数:对先行相关关键词的相关性rp值的绝对值进行排序,提取相关性值的绝对值最大对应的p值作为时差阶数。当关键词相关性系数的绝对值取最大时,对应的p即为关键词搜索指数与基准指标的时差阶数。过滤掉p为正数对应的关键词,选取p为负数对应的关键词,确定具有先行相关关系的关键词,根据公式(1)计算具有先行相关关系的关键词的相关系数。
设置弱相关临界值(如取0.45),相关系数的绝对值低于弱相关临界值(rp<0.45)的关键词为弱相关关键词。剔除滞后的关键词(p为正数的关键词)和弱相关的关键词,构建用于产品市场销量预测的关键词词库。
如图3所示为网络搜索指数体系建设流程图。
基于构建的关键词词库,根据相关系数rp的正、负将关键词进行分类,rp为正对应的关键词为正相关关键词,rp为负对应的关键词为负相关关键词,将关键词分为正相关关键词和负相关关键词。在数据准备阶段中,首先根据关键词的相关性系数与领先阶数,将关键词的搜索数据与基准指标进行错位对齐。具体实施如下:
通过图2所示步骤中的“时差分析”步骤,已经获得关键词的时差阶数p。根据所得关键词的时差阶数作为关键词领先阶数p,以该期的市场实际销量作为基准指标,将先行关键词的搜索数据按照其领先阶数向后移p期,完成将关键词搜索数据与基准指标进行错位对齐。错位对齐后,对每个关键词搜索指数及销量数据做标准化处理。
对关键词搜索指数做主成分分析。利用SPSS22.0,即第22版统计产品与服务解决方案软件,对关键词搜索指数数据做主成分分析。
具体可采用如下实施方式:
成列关键词向量X:X中的元素为所有关键词(X1,X2,…,Xp),构成随机关键词向量为X=(X1,X2,…,Xp)Τ,其中右上角角标T表示矩阵的转秩;
求向量X的均值向量μ和协方差矩阵∑,即X~N(μ,Σ);按照如下方式计算主成分向量Y:
对X进行正交变换计算,即
Figure GDA0001234121940000131
求得Y=(Y1,Y2,……,Yp)Τ,其中右上角角标T表示矩阵的转秩;
设,ai=(ai1,ai2,…,aip)Τ,A=(a1,a2,…,ap)Τ则有,Y=AX,i=1,2,…,p,且满足ai Τai=1,即ai1 2+ai2 2+…+aip 2=1,i=1,2,…,p,上述表达式中,ai=(ai1,ai2,…,aip)Τ与A=(a1,a2,…,ap)Τ的右上角角标T表示矩阵的转秩。
之后构建综合搜索指数,按照如下方法,分别提取正类别关键词搜索指数Qi和负类别关键词搜索指数qi
计算协方差矩阵∑的特征值λ1≥λ2≥…≥λp≥0,以特征值λ1相应的特征向量a1为系数,计算关键词主成分Y1=a1 ΤX的方差,即var(Y1)=a1 ΤΣa1,其中右上角角标T表示矩阵的转秩;以此同样的方法计算第i个主成分Yi的方差var(Yi)i=1,2,...,p,对主成分向量中所有元素Y1,Y2,…,Yp的方差从大到小排序,值越大对应的关键词则对该产品影响的贡献度越大。
根据初始特征值λi的大小,提取正相关关键词搜索指数和负相关关键词搜索指数的主成分,合计初始特征值<1的则舍去。
计算主成分的特征向量矩阵,设正相关关键词共计m个,负相关关键词共计n个,计算正相关主成分的特征向量矩阵(a1,a2…am)T,正相关关键词搜索指数为Qi=a1X1+a2X2+…+amXm;计算负相关主成分的特征向量矩阵(a1',a2'…an')T,负相关关键词搜索指数为qi=a1'X1+a2'X2+…+an'Xn。其中,每个正相关关键词搜索指数Qi和每个负相关关键词搜索指数qi都单独计算,故ap与Xp都是各自对应的特征向量和考察指标的值(p=0,±1,±2,…,±p)。
获得关键词综合搜索指数后,则根据关键词搜索指数调用预测模型进行预测。
Figure GDA0001234121940000141
收集产品前1期和前1年同时期的销量Volumet-1、Volumet-12。分别累加计算正负关键词网络搜索指数。其中Qi,t和qi,t分别表示由关键词网络搜索指数合成时所提取出的第i个正相关合成指数和第i个负相关合成指数主成分在第t期(与基准销量指标错位对齐后的时期)的值。
Volumet-1、Volumet-12分别为t时前1期和前1年同时期的产品销量,Volumet-1作为t时前1期的销量数据,包含众多销量变化的历史信息,Volumet-12作为前1年同时期的销量数据,包含销量的季节性变动因素;εt为模型的残差项,β0为常数项。调用公式(2)计算t时期的产品销量Volumet
将预测的产品销量发送到控制系统,控制系统根据预测的产品销量,向库存管理系统发送信息,控制商品采购,向传输机构发送控制命令,向预测区域传送相关产品。根据商品库存数量及销售数量预测,控制系统定时发送商品进货信息,或滞销预警信息。
本发明具有更强的有效性、更高的时效性和更广泛的应用领域的产品市场销量预测,具有相当高的实用价值。

Claims (10)

1.一种基于网络搜索指数的产品销量预测系统,其特征在于,包括:构建关键词库模块、关键词搜索指数合成模块、产品销量预测模块,其中,构建关键词库模块包括关键词提取单元、关键词过滤单元、关键词时差分析单元、关键词相关性分析单元,关键词提取单元,用于搜寻初始关键词;关键词过滤单元,用于剔除重复出现的关键词和数据信息严重缺失的关键词,以及搜索指数平台未收录的关键词;关键词时差分析单元,调用搜索指数平台对初始关键词进行优化,对关键词进行时差相关分析;关键词搜索指数合成模块,基于构建的关键词词库,根据相关系数将关键词分为正相关关键词和负相关关键词,根据时差阶数p将有超前关键词的搜索数据,按照其时差阶数向后移,与基准指标进行错位对齐,对关键词搜索指数做主成分分析,构建综合搜索指数,筛选出相关性高的先行关键词,构成预测关键词库;
根据公式var(Yi)=ai TΣai计算第i个主成分Yi的方差var(Yi),对主成分向量中所有元素Y1,Y2,…,Yp的方差从大到小排序,根据公式:
Qi=a1X1+a2X2+…+amXm计算正相关关键词搜索指数,根据公式:
qi=a1'X1+a2'X2+…+an'Xn计算负相关关键词搜索指数,其中,ai为以第i个主成分的特征值λi相应的特征向量系数,m为正相关关键词个数,n为负相关关键词个数,p表示网络搜索指数数据领先或滞后预测对象y的时差阶数,Xm为所预测产品的第m个考察指标,Xn为所预测产品的第n个考察指标,(a1,a2…am)T为正相关主成分的特征向量矩阵,(a1',a2'…an')T为负相关主成分的特征向量矩阵,分别提取正类别关键词搜索指数Qi和负类别关键词搜索指数qi;产品销量预测模块调用公式:
Figure FDA0002616584140000021
预测计算第t期的产品销量Volumet,获得预测结果,控制系统根据预测结果向库存管理系统发送信息控制商品采购,向传输机构发送向预测区域发送相关产品的控制命令,其中,Volumet-1、Volumet-12分别为第t期前1期和前12期的产品销量,εt为模型的残差项,β0为常数项,Qi,t和qi,t分别表示由关键词网络搜索指数合成时所提取出的第i个正相关合成指数和第i个负相关合成指数主成分在第t期的值,r1,r2为第1和第2个关键词的相关性系数。
2.根据权利要求1所述的系统,其特征在于,关键词库模块中关键词提取单元调用百度指数平台趋势研究模块,根据初始关键词获得关键词搜索指数,调用百度指数平台需求图谱模块,获得初始关键词的相关关键词,在百度指数平台需求图谱模块,选择与初始关键词相关性强的关键词,获得关键词搜索指数数据。
3.根据权利要求1所述的系统,其特征在于,构建关键词库模块中关键词过滤单元筛选出相关性高的先行关键词,构成预测关键词库具体包括:搜集产品关键词第i月搜索数据xi以及产品第i月销售数量yi调用公式:
Figure FDA0002616584140000022
计算每个关键词的相关系数rp,获得每个关键词相关性系数rp和对应时差阶数p,选取p为负数的关键词构成预测关键词库,其中,
Figure FDA0002616584140000023
为预测对象均值,
Figure FDA0002616584140000024
为关键词的网络搜索指数数据均值。
4.根据权利要求1所述的系统,其特征在于,关键词库模块中主成分分析单元构成随机向量为X=(X1,X2,…,Xp)T的成列关键词向量X,求X的均值向量μ和协方差矩阵∑,对X进行正交变换,即
Figure FDA0002616584140000031
求得主成分向量Y=(Y1,Y2,……,Yp)T,设ai=(ai1,ai2,…,aip)T,A=(a1,a2,…,ap)T则有,Y=AX,i=1,2,…,p,且满足ai Tai=1,以协方差矩阵∑的特征值对应的特征向量为系数,计算主成分向量中各元素的方差,并将方差排序。
5.根据权利要求3所述的系统,其特征在于,关键词库模块中关键词相关性分析单元通过计算预测关键词库中每个关键词搜索指数与基准指标先行预定期的皮尔逊相关性系数rp确定时差阶数,具体包括:对相关性系数rp值的绝对值进行排序,提取绝对值最大对应的p值作为关键词搜索指数与基准指标的时差阶数。
6.一种基于网络搜索指数的产品销量预测方法,其特征在于,包括:关键词提取单元搜寻初始关键词;关键词过滤单元剔除重复出现的关键词和数据信息严重缺失的关键词,剔除搜索指数平台未收录的关键词构建初始关键词库;关键词时差分析单元调用搜索指数平台对初始关键词进行优化,搜集产品关键词第i月搜索数据xi,对关键词进行时差相关分析;关键词搜索指数合成模块根据相关系数将关键词分为正相关关键词和负相关关键词,根据时差阶数p将有超前关键词的搜索数据,按照其时差阶数向后移,与基准指标进行错位对齐,对关键词搜索指数做主成分分析,构建综合搜索指数,筛选出相关性高的先行关键词,构成预测关键词库;根据公式var(Yi)=ai TΣai计算主成分向量中第i个主成分Yi的方差,对主成分向量中所有方差从大到小排序,根据公式:Qi=a1X1+a2X2+…+amXm计算正相关关键词搜索指数,根据公式:qi=a1'X1+a2'X2+…+an'Xn计算负相关关键词搜索指数,其中,p为时差阶数,ai为以特征值λi相应的特征向量系数;产品销量预测模块调用公式:
Figure FDA0002616584140000041
预测计算第t期的产品销量Volumet,获得产品销量预测结果,控制系统根据预测结果向库存管理系统发送信息控制商品采购,向传输机构发送向预测区域传送相关产品的控制命令,其中,Volumet-1、Volumet-12分别为第t期前1期和前12期的产品销量,εt为模型的残差项,β0为常数项,Qi,t和qi,t分别表示由关键词网络搜索指数合成时所提取出的第i个正相关合成指数和第i个负相关合成指数主成分在第t期的值,r1,r2为第1和第2个关键词的相关性系数。
7.根据权利要求6所述的方法,其特征在于,构建关键词库模块中关键词提取单元调用百度指数平台的趋势研究模块,根据初始关键词获得关键词搜索指数,调用百度指数平台需求图谱模块,获得初始关键词的相关关键词,在百度指数平台的需求图谱中,选择与初始关键词相关性强的关键词,获得关键词搜索指数数据。
8.根据权利要求6所述的方法,其特征在于,构建关键词库模块中关键词过滤单元筛选出相关性较高且具有先行关键词,构成预测关键词库,搜集产品第i月销售数量yi调用公式:
Figure FDA0002616584140000051
计算每个关键词的相关系数rp,获得每个关键词在时差阶数p对应的相关性系数rp,选取p为负数的关键词构成预测需要的关键词库。
9.根据权利要求6所述的方法,其特征在于,构建关键词库模块中主成分分析单元根据成列关键词向量X,构成随机向量为X=(X1,X2,…,Xp)T求成列关键词向量X的均值向量μ和协方差矩阵∑,对X进行正交变换,即
Figure FDA0002616584140000052
求得主成分向量Y=(Y1,Y2,……,Yp)T,设ai=(ai1,ai2,…,aip)T,A=(a1,a2,…,ap)T则有,
Figure FDA0002616584140000053
且满足ai Tai=1,以协方差矩阵∑的特征值对应的特征向量为系数,计算主成分向量中各元素的方差,并将方差排序,提取正相关关键词搜索指数和负相关关键词搜索指数的主成分获得关键词综合搜索指数。
10.根据权利要求6所述的方法,其特征在于,构建关键词库模块中关键词相关性分析单元通过计算预测关键词库中每个关键词搜索指数与基准指标先行预定期的皮尔逊相关系数rp确定时差阶数,具体包括:对相关系数rp值的绝对值进行排序,提取绝对值最大对应的p值作为关键词搜索指数与基准指标的时差阶数。
CN201610964787.2A 2016-11-04 2016-11-04 一种基于网络搜索指数进行销量预测的方法和系统 Active CN106600310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610964787.2A CN106600310B (zh) 2016-11-04 2016-11-04 一种基于网络搜索指数进行销量预测的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610964787.2A CN106600310B (zh) 2016-11-04 2016-11-04 一种基于网络搜索指数进行销量预测的方法和系统

Publications (2)

Publication Number Publication Date
CN106600310A CN106600310A (zh) 2017-04-26
CN106600310B true CN106600310B (zh) 2020-11-17

Family

ID=58589810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610964787.2A Active CN106600310B (zh) 2016-11-04 2016-11-04 一种基于网络搜索指数进行销量预测的方法和系统

Country Status (1)

Country Link
CN (1) CN106600310B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767180A (zh) * 2017-10-27 2018-03-06 南京坤艮信息科技有限公司 一种网上商城的配货方法
CN107958075B (zh) * 2017-12-11 2021-02-26 重庆邮电大学 一种基于网络搜索指数判断消费者购买意向转移的方法
CN108319700A (zh) * 2018-02-05 2018-07-24 广东广垦畜牧工程研究院有限公司 一种基于网络搜索指数的猪肺疫预测方法
CN108491374B (zh) * 2018-02-12 2022-05-27 郑长敬 基于房地产行业的词库构建方法及系统
CN108921462B (zh) * 2018-05-28 2022-07-05 顺丰科技有限公司 库存管理方法、库存管理装置、设备及存储介质
CN109239764B (zh) * 2018-07-18 2022-08-23 重庆邮电大学 一种大平板ct探测器高产率模块化生产组装方法
CN110705736A (zh) * 2019-05-28 2020-01-17 软通智慧科技有限公司 宏观经济预测方法、装置、计算机设备及存储介质
CN111476030B (zh) * 2020-05-08 2022-03-15 中国科学院计算机网络信息中心 一种基于深度学习的前瞻因子筛选方法
CN113934921A (zh) * 2020-07-13 2022-01-14 广西中烟工业有限责任公司 基于消费者搜索多元数据融合卷烟品牌评价方法
CN112184301A (zh) * 2020-09-25 2021-01-05 杭州安恒信息技术股份有限公司 一种数据预测方法、装置、设备及计算机可读存储介质
CN117934048B (zh) * 2024-03-14 2024-07-02 深圳美云集网络科技有限责任公司 一种电商商品销量分析方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841946A (zh) * 2012-08-24 2012-12-26 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和系统
CN104700152A (zh) * 2014-10-22 2015-06-10 浙江中烟工业有限责任公司 一种融合季节销售信息与搜索行为信息的烟草销量预测方法
CN105678576A (zh) * 2016-01-06 2016-06-15 浪潮集团有限公司 一种通过大数据搜寻分析预测产品价格变化趋势的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140372172A1 (en) * 2013-06-12 2014-12-18 Telefonica Digital Espana, S.L.U. Method and computer system to forecast economic time series of a region and computer program thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841946A (zh) * 2012-08-24 2012-12-26 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和系统
CN104700152A (zh) * 2014-10-22 2015-06-10 浙江中烟工业有限责任公司 一种融合季节销售信息与搜索行为信息的烟草销量预测方法
CN105678576A (zh) * 2016-01-06 2016-06-15 浪潮集团有限公司 一种通过大数据搜寻分析预测产品价格变化趋势的方法

Also Published As

Publication number Publication date
CN106600310A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN106600310B (zh) 一种基于网络搜索指数进行销量预测的方法和系统
CN104281956B (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN103377250B (zh) 基于邻域的top‑k推荐方法
CN102385601B (zh) 一种产品信息的推荐方法及系统
CN105183727A (zh) 一种图书推荐方法及其系统
WO2016101777A1 (zh) 用户兴趣数据分析和收集系统及其方法
CN106844787A (zh) 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN110852852A (zh) 一种工业互联网产品推荐系统及方法
Eliyas et al. Recommendation systems: Content-based filtering vs collaborative filtering
CN101271559A (zh) 一种基于用户局部兴趣挖掘的协作推荐系统
CN103886486A (zh) 一种基于支持向量机svm的电子商务推荐方法
CN104700152A (zh) 一种融合季节销售信息与搜索行为信息的烟草销量预测方法
CN105023178B (zh) 一种基于本体的电子商务推荐方法
CN104778237A (zh) 一种基于关键用户的个性化推荐方法和系统
Beck et al. Sensing social media signals for cryptocurrency news
CN102118382A (zh) 一种基于兴趣组合的协作推荐攻击检测系统及方法
CN103309885A (zh) 一种在电子交易平台中识别特征用户的方法及装置和搜索方法及装置
KR101658714B1 (ko) 온라인 활동 이력에 기초한 사용자의 온라인 활동 예측 방법 및 시스템
Xue et al. Intelligent mining on purchase information and recommendation system for e-commerce
Chou et al. The RFM Model Analysis for VIP Customer: A case study of golf clothing brand
CN117557306A (zh) 基于行为、特征对消费者分类的管理系统
CN102262764A (zh) 一种基于回归模型的电子商务推荐方法
CN113763032B (zh) 一种商品购买意愿识别方法及装置
CN110727867A (zh) 一种基于模糊机制的语义实体推荐方法
US20130311233A1 (en) Method for predicting revenue to be generated by a webpage comprising a list of items having common properties

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant