CN110598775B - 基于模糊聚类和bp神经网络的预测方法、系统及存储介质 - Google Patents

基于模糊聚类和bp神经网络的预测方法、系统及存储介质 Download PDF

Info

Publication number
CN110598775B
CN110598775B CN201910827753.2A CN201910827753A CN110598775B CN 110598775 B CN110598775 B CN 110598775B CN 201910827753 A CN201910827753 A CN 201910827753A CN 110598775 B CN110598775 B CN 110598775B
Authority
CN
China
Prior art keywords
historical
data
key factor
passenger flow
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910827753.2A
Other languages
English (en)
Other versions
CN110598775A (zh
Inventor
王彬有
梁昌勇
陆文星
徐健
赵树平
董骏峰
蒋丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201910827753.2A priority Critical patent/CN110598775B/zh
Publication of CN110598775A publication Critical patent/CN110598775A/zh
Application granted granted Critical
Publication of CN110598775B publication Critical patent/CN110598775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/043Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Automation & Control Theory (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Fuzzy Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)

Abstract

本发明提供一种基于模糊聚类和BP神经网络的预测方法、系统及存储介质,属于景区客流量的预测技术领域。该预测方法包括:获取景区的历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据;以预定的时间周期为单位进行相关性分析,得到关键因素矩阵;对关键因素矩阵进行预处理;根据关键因素矩阵采用模糊聚类方法将历史时间以时间周期为单位在不同的K值下分别分成多个类别;在每个K值下,从多个类别中选择随机选择一个类别;从类别中随机选择一个时间段作为测试集,将其余的时间段作为训练集以对初始的神经网络进行训练;采用测试集测试训练后的神经网络以得到预测精度;选择预测精度最高的神经网络预测客流量值。

Description

基于模糊聚类和BP神经网络的预测方法、系统及存储介质
技术领域
本发明涉及景区客流量的预测技术领域,具体地涉及一种基于模糊聚类和BP神经网络的预测方法、系统及存储介质。
背景技术
风景区短期客流量的准确预测,相比起中长期的客流量预测,在各大景区中显得尤为重要。风景区的旅游管理者可以根据对当天客流量的准确预测来提前部署并合理安排各个景点的工作人员,调度协调物资及交通等方面,方便景区的管理,同时也能确保游客的安全。目前,鲜有对风景区短期客流量预测模型的研究,已有的模型包括传统时间序列模型、BP神经网络模型和支持向量机等模型。但短期日客流量预测相比起中长期客流量预测,由于受各种因素如天气类型、气温、节假日等影响,更加呈现出复杂的非线性特征,且这些因素会制约模型的预测效果。
发明内容
本发明实施方式的目的是提供一种基于模糊聚类和BP神经网络的预测方法、系统及存储介质。该预测方法、系统及存储介质可以克服现有技术中预测方法由于没有考虑天气类型、气温以及节假日的因素而导致的预测结果不准确的问题。
为了实现上述目的,本发明实施方式提供一种基于模糊聚类和BP神经网络的预测方法,所述预测方法包括:
获取景区的历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据;
将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据以预定的时间周期为单位进行相关性分析,得到关于所述历史客流量数据、所述历史电子订票数据、所述历史气温数据以及所述历史天气数据中的至少一者的关键因素矩阵;
对所述关键因素矩阵进行预处理;
根据预处理后的所述关键因素矩阵采用模糊聚类方法将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据对应的历史时间以所述时间周期为单位在不同的K值下分别分成多个类别,其中,每个所述类别包括至少一个时间段,每个所述时间段的时间长度等于所述时间周期,每个所述时间段对应有所述景区在所述时间段内的客流量值;
在每个所述K值下,从所述多个类别中选择随机选择一个所述类别;
从所述类别中随机选择一个时间段作为测试集,将其余的所述时间段作为训练集以对初始的神经网络进行训练;
采用所述测试集测试训练后的所述神经网络以得到当前的所述神经网络的预测精度;
选择所述预测精度最高的所述神经网络预测所述景区的客流量值。
可选地,所述将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据以预定的时间周期为单位进行相关性分析,得到关于所述历史客流量数据、所述历史电子订票数据、所述历史气温数据以及所述历史天气数据中的至少一者的关键因素矩阵具体包括:
采用公式(1)表示所述关键因素矩阵,
Figure BDA0002189657950000021
其中,S为所述关键因素矩阵,所述关键因素矩阵中的每行元素表示一个时间周期的关键因素,每列元素表示所述关键因素中的一个子因素在每个所述时间周期中的值。
可选地,所述对所述关键因素矩阵进行预处理具体包括:
计算在所述历史时间内,所述景区的总客流量值;
将所述历史时间平均划分为多个时间区间;
提取每个所述时间区间中相同位置的时间周期;
计算所有相同位置的时间周期对应的客流量值的第一总和;
分别计算每个所述第一总和和所述总客流量值的比值。
可选地,所述时间区间为一周,所述时间周期为24小时。
可选地,所述对所述关键因素矩阵进行预处理具体包括:
计算在所述历史时间内,所述景区的总客流量值;
将所述历史天气数据中的天气分成多个类型;
分别计算每个所述类型对应的时间周期的客流量值的第二总和;
分别计算每个所述第二总和与所述总和流量值的比值。
可选地,所述对所述关键因素矩阵进行预处理具体包括:
计算每个所述时间周期的所述平均气温;
对每个所述平均气温进行归一化计算。
可选地,所述根据预处理后的所述关键因素矩阵采用模糊聚类方法将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据对应的历史时间以所述时间周期为单位在不同的K值下分别分成多个类别具体包括:
根据公式(2)对所述关键因素矩阵进行标准化处理,
Figure BDA0002189657950000031
其中,
Figure BDA0002189657950000032
为进行所述标准化处理后位于所述关键因素矩阵的第i行第j列的元素,Xij为进行所述标准化处理前位于所述关键因素矩阵的第i行第j列的元素,n为所述关键因素矩阵的行数;
根据公式(3)和公式(4)建立模糊相似矩阵,
rij=1-cd(xi,xj), (3)
Figure BDA0002189657950000041
其中,rij为所述模糊相似矩阵中第i行第j列的元素,c为预设的参数,xi、xj为所述关键因素矩阵的第i行、第j行的元素,xik、xjk为所述关键因素矩阵的第k列的第i行和第j行的元素;
采用平方法根据所述模糊相似矩阵形成传递闭包;
根据所述传递闭包和对应的K值计算K截矩阵;
根据所述K截矩阵将所有的所述时间周期划分为多个所述类别。
可选地,所述神经网络为BP神经网络。
另一方面,本发明还提供一种基于模糊聚类和BP神经网络的预测系统,其特征在于,所述预测系统包括处理器,所述处理器用于执行上述任一所述的预测方法。
再一方面,本发明还提供一种存储介质,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行上述任一所述的预测方法。
通过上述技术方案,本发明提供的基于模糊聚类和BP神经网络的预测方法、系统及存储介质通过结合景区的历史客流量数据、历史电子商务订票数据、历史天气数据以及历史气温数据,通过模糊聚类和BP神经网络对该数据进行分析,克服了现有技术中的预测方法由于没有考虑天气类型、气温以及节假日的因素而导致的预测结果不准确的问题,实现了对景区客流量的准确预测。
本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施方式的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施方式,但并不构成对本发明实施方式的限制。在附图中:
图1是根据本发明的一个实施方式的基于模糊聚类和BP神经网络的预测方法的流程图;
图2是根据本发明的一个实施方式的对历史客流量数据的预处理的流程图;
图3是根据本发明的一个实施方式的对历史天气数据的预处理的流程图;
图4是根据本发明的一个实施方式的对历史气温数据的预处理的流程图;以及
图5是根据本发明的一个实施方式的模糊聚类方法的流程图。
具体实施方式
以下结合附图对本发明实施方式的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施方式,并不用于限制本发明实施方式。
在本发明实施方式中,在未作相反说明的情况下,使用的方位词如“上、下、顶、底”通常是针对附图所示的方向而言的或者是针对竖直、垂直或重力方向上而言的各部件相互位置关系描述用词。
另外,若本发明实施方式中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施方式之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
如图1所示是根据本发明的一个实施方式的基于模糊聚类和BP神经网络的预测方法的流程图。在图1中,该预测方法可以包括:
在步骤S10中,获取景区的历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据。
在步骤S11中,将历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据以预定的时间周期为单位进行相关性分析,得到关于该历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据至少一者的关键因素矩阵。在该实施方式中,该相关性分析可以是例如采用SPSS软件对该历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据进行分析,从而得到该关键因素矩阵。对于该关键因素矩阵的具体形式,可以是例如公式(1)所示,
Figure BDA0002189657950000061
其中,S为关键因素矩阵,关键因素矩阵中的每行元素表示一个时间周期的关键因素,每列元素表示关键因素中的一个子因素在每个时间周期中的值。
在步骤S12中,对关键因素矩阵进行预处理。对于该预处理,可以是本领域人员所知的多种形式。在本发明的一个示例中,考虑到该实施方式需要采用模糊聚类方法对上述历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据中的至少一者进行聚类处理。但是,如果直接采用该聚类方法对上述数据进行聚类处理,就会出现聚类处理的结果无法体现客流量变化的规律性的问题。以历史客流量数据为例,在一周的时间内,周一至周五的日客流量值往往和周末的日客流量值存在较大的差异,直接采用模糊聚类方法对上述数据进行处理则无法体现出这种差异(历史电子商务订票数据、历史天气数据和历史气温数据类似,故此处不再赘述)。因此,为了便于后续的模糊聚类方法对该关键因素矩阵的处理,针对该历史客流量数据,该预处理可以包括如图2中所示出的方法。在该图2中,该步骤S12可以包括:
在步骤S1210中,计算在历史时间内,景区的总客流量值;
在步骤S1211中,将历史时间平均划分为多个时间区间。在该示例中,以时间区间为一周、时间周期为24小时为例,该时间区间则可以包括7个时间周期(天),分别为周一至周日。
在步骤S1212中,提取每个时间区间中相同位置的时间周期。
在步骤S1213中,计算所有相同位置的时间周期对应的客流量值的第一总和。在以上述示例为例的情况下,该步骤S1213则可以为分别计算在该历史时间内的所有周一至周日每天的总客流量值。以该时间区间为一周为例,由于一个景区的客流量变化往往和节假日相关。就不同周而言,由于节假日的影响,不同的周一的客流量变化也可以存在较大差异。因此,在该实例中,可以在预处理时参考所有的周一的客流量值的总和,从而避免节假日对客流量值产生的影响。
在步骤S1214中,分别计算每个第一总和和总客流量值的比值。
对于该历史电子商务订票数据的预处理过程,与该历史客流量数据的预处理方式类似。因此,此处不再赘述。
对于该历史天气数据,在该示例中,该步骤S12可以包括如图3所示出的步骤。在该图3中,该步骤S12可以包括:
在步骤S1220中,计算在历史时间内,景区的总客流量值;
在步骤S1221中,将历史天气数据中的天气分成多个类型,例如晴天、多云、阴天、小雨、中雨、大雨、雷阵雨、雪天(小雪、中雪、大雪、暴雪、雨夹雪)等;
在步骤S1222中,分别计算每个类型对应的时间周期的客流量值的第二总和;
在步骤S1223中,分别计算每个第二总和与总和流量值的比值。
对于该历史气温数据,在该示例中,该步骤S12可以包括如图4所示出的步骤。在该图4中,该步骤S12可以包括:
在步骤S1230中,计算每个时间周期的平均气温。由于获取到的历史气温数据往往是每日的最高气温和最低气温,而事实上,游客在旅游时往往不会在最高气温或最低气温的时间点来景区。因此,在该实例中,可以采用平均气温来作为客流量值变化的因素;
在步骤S1231中,对每个平均气温进行归一化计算。
在步骤S13中,根据预处理后的关键因素矩阵采用模糊聚类方法将历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据对应的历史时间以时间周期为单位在不同的K值下分别分成多个类别。其中,每个类别可以包括至少一个时间段,每个时间段的时间长度可以等于该时间周期,每个时间段可以对应有该景区在该时间段内的客流量值。具体地,该模糊聚类方法可以包括如图5所示的步骤。在图5中,该模糊聚类方法可以包括:
在步骤S131中,根据公式(2)对关键因素矩阵进行标准化处理,
Figure BDA0002189657950000081
其中,
Figure BDA0002189657950000082
为进行标准化处理后位于关键因素矩阵的第i行第j列的元素,Xij为进行标准化处理前位于关键因素矩阵的第i行第j列的元素,n为关键因素矩阵的行数;
在步骤S132中,根据公式(3)和公式(4)建立模糊相似矩阵,
rij=1-cd(xi,xj), (3)
Figure BDA0002189657950000091
其中,rij为模糊相似矩阵中第i行第j列的元素,c为预设的参数,xi、xj为关键因素矩阵的第i行、第j行的元素,xik、xjk为关键因素矩阵的第k列的第i行和第j行的元素;
在步骤S133中,采用平方法根据模糊相似矩阵形成传递闭包;
在步骤S134中,根据传递闭包和对应的K值计算K截矩阵;
在步骤S135中,根据该K截矩阵将所有的时间周期划分为多个类别。
在步骤S14中,在每个K值下,从多个类别中选择随机选择一个类别;
在步骤S15中,从选择的类别中随机选择一个时间段作为测试集,将其余的时间段作为训练集以对初始的神经网络进行训练。对于该神经网络,可以是包括但不限于本领域人员所知的LSTM网络、BP神经网络等。在本发明的一个示例中,该神经网络可以优选为BP神经网络。
在步骤S16中,采用测试集测试训练后的神经网络以得到当前的神经网络的预测精度;
在步骤S17中,选择预测精度最高的神经网络预测景区的客流量值。
另一方面,本发明还提供一种基于模糊聚类和BP神经网络的预测系统,该预测系统可以包括处理器,该处理器可以用于执行上述任一的预测方法。
对于该处理器,可以为通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)电路、任何其它类型的集成电路(IC)、状态机、系统级芯片(SOC)等。
再一方面,本发明还提供一种存储介质,该存储介质可以存储有指令,该指令可以用于被机器读取以使得机器执行上述任一所述的预测方法。
通过上述技术方案,本发明提供的基于模糊聚类和BP神经网络的预测方法、系统及存储介质通过结合景区的历史客流量数据、历史电子商务订票数据、历史天气数据以及历史气温数据,通过模糊聚类和BP神经网络对该数据进行分析,克服了现有技术中的预测方法由于没有考虑天气类型、气温以及节假日的因素而导致的预测结果不准确的问题,实现了对景区客流量的准确预测。
以上结合附图详细描述了本发明例的可选实施方式,但是,本发明实施方式并不限于上述实施方式中的具体细节,在本发明实施方式的技术构思范围内,可以对本发明实施方式的技术方案进行多种简单变型,这些简单变型均属于本发明实施方式的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施方式对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施方式的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施方式的思想,其同样应当视为本发明实施方式所公开的内容。

Claims (10)

1.一种基于模糊聚类和BP神经网络的预测方法,其特征在于,所述预测方法包括:
获取景区的历史客流量数据、历史电子商务订票数据、历史气温数据以及历史天气数据;
将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据以预定的时间周期为单位进行相关性分析,得到关于所述历史客流量数据、所述历史电子订票数据、所述历史气温数据以及所述历史天气数据中的至少一者的关键因素矩阵;
对所述关键因素矩阵进行预处理;
根据预处理后的所述关键因素矩阵采用模糊聚类方法将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据对应的历史时间以所述时间周期为单位在不同的K值下分别分成多个类别,其中,每个所述类别包括至少一个时间段,每个所述时间段的时间长度等于所述时间周期,每个所述时间段对应有所述景区在所述时间段内的客流量值;
在每个所述K值下,从所述多个类别中选择随机选择一个所述类别;
从所述类别中随机选择一个时间段作为测试集,将其余的所述时间段作为训练集以对初始的神经网络进行训练;
采用所述测试集测试训练后的所述神经网络以得到当前的所述神经网络的预测精度;
选择所述预测精度最高的所述神经网络预测所述景区的客流量值。
2.根据权利要求1的预测方法,其特征在于,所述将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据以预定的时间周期为单位进行相关性分析,得到关于所述历史客流量数据、所述历史电子订票数据、所述历史气温数据以及所述历史天气数据中的至少一者的关键因素矩阵具体包括:
采用公式(1)表示所述关键因素矩阵,
Figure FDA0002189657940000021
其中,S为所述关键因素矩阵,所述关键因素矩阵中的每行元素表示一个时间周期的关键因素,每列元素表示所述关键因素中的一个子因素在每个所述时间周期中的值。
3.根据权利要求1所述的预测方法,其特征在于,所述对所述关键因素矩阵进行预处理具体包括:
计算在所述历史时间内,所述景区的总客流量值;
将所述历史时间平均划分为多个时间区间;
提取每个所述时间区间中相同位置的时间周期;
计算所有相同位置的时间周期对应的客流量值的第一总和;
分别计算每个所述第一总和和所述总客流量值的比值。
4.根据权利要求3所述的预测方法,其特征在于,所述时间区间为一周,所述时间周期为24小时。
5.根据权利要求1所述的预测方法,其特征在于,所述对所述关键因素矩阵进行预处理具体包括:
计算在所述历史时间内,所述景区的总客流量值;
将所述历史天气数据中的天气分成多个类型;
分别计算每个所述类型对应的时间周期的客流量值的第二总和;
分别计算每个所述第二总和与所述总和流量值的比值。
6.根据权利要求1所述的预测方法,其特征在于,所述对所述关键因素矩阵进行预处理具体包括:
计算每个所述时间周期的平均气温;
对每个所述平均气温进行归一化计算。
7.根据权利要求1所述的预测方法,其特征在于,所述根据预处理后的所述关键因素矩阵采用模糊聚类方法将所述历史客流量数据、所述历史电子商务订票数据、所述历史气温数据以及所述历史天气数据对应的历史时间以所述时间周期为单位在不同的K值下分别分成多个类别具体包括:
根据公式(2)对所述关键因素矩阵进行标准化处理,
Figure FDA0002189657940000031
其中,X′ij为进行所述标准化处理后位于所述关键因素矩阵的第i行第j列的元素,Xij为进行所述标准化处理前位于所述关键因素矩阵的第i行第j列的元素,n为所述关键因素矩阵的行数;
根据公式(3)和公式(4)建立模糊相似矩阵,
rij=1-cd(xi,xj),(3)
Figure FDA0002189657940000032
其中,rij为所述模糊相似矩阵中第i行第j列的元素,c为预设的参数,xi、xj为所述关键因素矩阵的第i行、第j行的元素,xik、xjk为所述关键因素矩阵的第k列的第i行和第j行的元素;
采用平方法根据所述模糊相似矩阵形成传递闭包;
根据所述传递闭包和对应的K值计算K截矩阵;
根据所述K截矩阵将所有的所述时间周期划分为多个所述类别。
8.根据权利要求1所述的预测方法,其特征在于,所述神经网络为BP神经网络。
9.一种基于模糊聚类和BP神经网络的预测系统,其特征在于,所述预测系统包括处理器,所述处理器用于执行如权利要求1至8任一所述的预测方法。
10.一种存储介质,其特征在于,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如权利要求1至8任一所述的预测方法。
CN201910827753.2A 2019-09-03 2019-09-03 基于模糊聚类和bp神经网络的预测方法、系统及存储介质 Active CN110598775B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910827753.2A CN110598775B (zh) 2019-09-03 2019-09-03 基于模糊聚类和bp神经网络的预测方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910827753.2A CN110598775B (zh) 2019-09-03 2019-09-03 基于模糊聚类和bp神经网络的预测方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN110598775A CN110598775A (zh) 2019-12-20
CN110598775B true CN110598775B (zh) 2022-11-08

Family

ID=68857105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910827753.2A Active CN110598775B (zh) 2019-09-03 2019-09-03 基于模糊聚类和bp神经网络的预测方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN110598775B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111627209A (zh) * 2020-05-29 2020-09-04 青岛大学 交通流量数据聚类、补偿方法及设备
CN112016755A (zh) * 2020-08-31 2020-12-01 国网甘肃省电力公司建设分公司 输变电工程施工图通用设计造价标准化技术模块构建方法
CN113361825A (zh) * 2021-07-19 2021-09-07 青岛理工大学 一种踩踏事故早期预警方法及系统
CN117132004B (zh) * 2023-10-27 2024-02-09 四川省建筑设计研究院有限公司 基于神经网络的公共场所人流密度预测方法、系统及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106251001A (zh) * 2016-07-18 2016-12-21 南京工程学院 一种基于改进模糊聚类算法的光伏功率预测方法
CN109784579A (zh) * 2019-01-30 2019-05-21 合肥工业大学 基于粒子群算法和bp网络的景区客流量的预测方法及系统
CN110147903A (zh) * 2019-04-19 2019-08-20 合肥工业大学 用于预测景区的客流量的方法、系统及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160162779A1 (en) * 2014-12-05 2016-06-09 RealMatch, Inc. Device, system and method for generating a predictive model by machine learning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106251001A (zh) * 2016-07-18 2016-12-21 南京工程学院 一种基于改进模糊聚类算法的光伏功率预测方法
CN109784579A (zh) * 2019-01-30 2019-05-21 合肥工业大学 基于粒子群算法和bp网络的景区客流量的预测方法及系统
CN110147903A (zh) * 2019-04-19 2019-08-20 合肥工业大学 用于预测景区的客流量的方法、系统及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于模糊聚类与RBF网络的短期负荷预测;王平等;《继电器》;20060515(第10期);全文 *
模糊聚类与径向基网络相结合的短期负荷预测;刘昊等;《西安工业大学学报》;20090415(第02期);全文 *

Also Published As

Publication number Publication date
CN110598775A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
CN110598775B (zh) 基于模糊聚类和bp神经网络的预测方法、系统及存储介质
CN111932402A (zh) 一种基于相似日和lstm的短期电力负荷双向组合预测方法
CN107292417B (zh) 基于重污染序列案例库的区域重污染判别预报方法及装置
CN111582559B (zh) 一种到达时间的预估方法及装置
AU2018215877B2 (en) A method of predicting a traffic behaviour in a road system
CN108009596B (zh) 确定降雨特征的方法和装置
CN110889558A (zh) 路况预测方法及装置
CN108960520A (zh) 一种电力负荷预测方法、系统、计算机设备、介质
CN111950603B (zh) 一种路段交通事故率的预测方法、装置及计算机存储介质
CN111199247B (zh) 一种公交运行仿真方法
AU2018215876B2 (en) A method of predicting a traffic behaviour in a road system
CN115456695A (zh) 一种店铺选址的分析方法、装置、系统及介质
CN112652164B (zh) 一种交通时段划分方法、装置及设备
CN108053646B (zh) 基于时间敏感特征的交通特征获取方法、预测方法及系统
CN107316096A (zh) 一种轨道交通一票通乘客进站量预测方法
CN111145535B (zh) 一种复杂场景下的行程时间可靠性分布预测方法
CN115017990B (zh) 一种交通流量预测方法、装置、设备及存储介质
CN112926809B (zh) 一种基于聚类和改进的xgboost的航班流量预测方法及系统
CN113449780A (zh) 基于随机森林和lstm神经网络的路内泊位占有率预测方法
CN106779241B (zh) 一种轨道交通短期客流预测方法
CN113361556B (zh) 污染相似案例自动识别的方法和装置
CN117314504B (zh) 一种公共交通客流预测方法及系统
Torvela Weather impact on public transport ridership: Predicting passenger load using machine learning
CN115798252A (zh) 一种基于道路公共停车位获取方法、系统及装置
CN111598333A (zh) 客流数据的预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant