CN107316103A - 基于回声状态网络的景点动态质量预测方法 - Google Patents
基于回声状态网络的景点动态质量预测方法 Download PDFInfo
- Publication number
- CN107316103A CN107316103A CN201710410788.7A CN201710410788A CN107316103A CN 107316103 A CN107316103 A CN 107316103A CN 201710410788 A CN201710410788 A CN 201710410788A CN 107316103 A CN107316103 A CN 107316103A
- Authority
- CN
- China
- Prior art keywords
- sight spot
- msub
- sight
- mrow
- dynamic mass
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种结合回声状态网络预测景点动态质量计算景点综合景点质量以进行景点综合质量评估的方法。所述方法为:网络挖掘大量具有相同属性的用户游览景点的历史轨迹,利用回声状态网络,根据用户历史参观景点的概率分布,预测景点动态质量(未来景点可参观性)。同时结合网络挖掘景点出名程度、游客感兴趣程度等景点静态质量对景点综合质量进行量化。该方法量化的景点综合质量相对更为客观,更具有实际意义。
Description
技术领域
本发明涉及景点动态质量预测领域,特别是涉及基于回声状态网络的景点动态质量预测方法。
背景技术
在游客计划未来某天旅游出行的情况下,获得该日各景点的可参观性信息较为重要。若只根据景点静态质量进行景点选取,可能出现冬日游览海滩等不切实际的旅游方法。为了解决以上问题,充分预测未来某天的景点动态质量对游客进行景点选取具有实际意义。本文中使用回声状态网络实现景点动态质量的预测。
回声状态网络(Echo State Network,ESN)是用于执行非线性系统预测的特殊类型的循环神经网络。ESN架构基于随机连接的循环神经网络(recurrent neural network,RNN),其核心概念为存储池计算(reservoir computing),利用存储池计算作为训练递归神经网络的梯度下降方法的替代方法。存储池由时间输入驱动,其状态是输入历史的特征性表现,因此储层单元的简单线性组合是未来输入的良好预测因子。
现有的主流景点量化方式为:挖掘景点相关数据,如基于地理标记的照片的现实生活中的旅行序列、访问持续时间等进而量化景点的各类指标,如出名程度、游客对该景点的感兴趣程度等等。但它们并未考虑到游客在不同时间参观各景点的概率的差异性,使计划的切实可行性降低。
发明内容
为了解决上述存在的问题,本发明提供基于回声状态网络的景点动态质量预测方法,通过网络挖掘大量具有相同属性的用户游览景点的历史轨迹,利用回声状态网络,根据用户历史参观景点的概率分布,预测景点动态质量,结合网络挖掘景点出名程度、游客感兴趣程度等景点静态质量对景点综合质量进行量化,为达此目的,本发明提供基于回声状态网络的景点动态质量预测方法,基于具有相同属性的用户参观景点的历史轨迹信息,使用ESN对景点动态质量进行预测,结合网络挖掘景点出名程度、游客感兴趣程度等景点静态质量对景点综合质量进行量化,其具体步骤为:
步骤1:网络挖掘大量相关数据,如景点静态指标、景点地理位置和类型、大量用户参观景点历史轨迹;
步骤2:基于具有相同属性的用户参观景点的历史轨迹信息,使用ESN对景点动态质量进行预测;
步骤3:结合景点静态质量如出名程度、用户感兴趣程度,计算景点综合质量。
本发明的进一步改进,步骤2所述的获得景点动态质量信息的方法,如图4所示,具体步骤如下:
步骤2.1:网络数据挖掘大量具有相似属性的用户各类景点参观历史轨迹,并计算各类景点被参观的频率数据样本以作为训练数据;
步骤2.2:利用输入用户属性向量xτ=[xτ,1,…,xτ,K]T计算τ时刻存储池状态vτ:
vτ=f(W·vτ-1+Win·xτ); (公式1);
步骤2.3:根据输入用户属性结合存储池状态输出τ时刻景点动态质量预测值:
yτ(xτ)=[proτ,1,porτ,2,...,proτ,N]:
步骤2.4:根据真实值更新输出权重矩阵以实现预测值与真实值之间的逼近:
或:
上述公式中,为输入权重矩阵,Nw为存储池单元数量;W为存储池循环矩阵;Wout是唯一需要随时间训练更替的输出权重矩阵,包含了输出与输入的关系;β为调制系数。
本发明的进一步改进,步骤3所述的景点动态质量结合网络挖掘景点出名程度、游客感兴趣程度对景点静态质量进行量化的方法,如下所述:
景点pi获得的点评数量作为景点出名程度的指标,以标准化形式表述:通过分析景点pi获得的评论和评分作为用户感兴趣程度的指标,以标准化形式表述:从而获得景点综合质量:
其中,η、μ为权重。
本发明的进一步改进,步骤2.4中W为存储池循环矩阵,为了使该神经网络具有回声状态网络性质,循环矩阵W是权值谱半径小于1的稀疏矩阵,也就是说该矩阵的最大绝对特征值小于1,表示如下:ρ(W)<1。当实际情况依赖较长时间的历史记忆数据的时候,ρ(W)需要被设置得大一些;当实际情况较依赖近期情况时,ρ(W)则需要小一些。
本发明的进一步改进,步骤2.4中输出权重矩阵包含了大量用户信息与游览景点之间的关系,被训练以用来输出预测数据,有如公式3和公式4两种训练方式,其中,公式3为岭回归方式进行巡览,由如下公式求导得来:
即实现预测值与真实值的逼近。该方法对比于最小化均方根误差方法来说,添加了偏置有利于控制Wout的变化幅度,防止过拟合以及调节反馈不稳定带来的影响;
公式4为线性梯度下降方法,其中,λα是学习速率,eτ是日期τ真实的各类景点被参观概率。
本发明提供的使用ESN对景点动态质量进行预测方法,可以获取在特定时间景点的动态质量信息以辅助景点评估,结合以网络挖掘景点出名程度、游客感兴趣程度等景点静态质量更可以相对客观地对景点综合质量进行量化。根据实验仿真结果表明,验证了ESN预测的准确性以及实际可用性。在已有景点静态质量数据的情况下,由于该预测数据在一定程度上表征了特定时期用户人群对一个景点的偏好情况,所以辅以该预测数据进行未来某日景点综合质量评估将更符合用户习惯和实际情况,具有实际可行性。
附图说明
图1为本发明实施系统流程说明图;
图2为各类景点动态质量预测值与真实值对比图;其中:
图2a为自然景观类景点动态质量预测值与真实值对比图;
图2b为休闲游戏类景点动态质量预测值与真实值对比图;
图2c为历史古迹类景点动态质量预测值与真实值对比图;
图2d为人文景观类景点动态质量预测值与真实值对比图;
图3为不同参数设置下ESN预测误差图;
图4为ESN模型示意图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
下面以真实的数据集为基础,结合附图对本发明基于回声状态网络的预测景点动态质量的景点综合质量评估的具体实施方式作了直观详尽的分析说明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利。本发明实例中,根据计算机计算能力及误差状况,进行了参数优化设置分析:虽然存储池单元数量越多,结果越精准,但是考虑到计算量时延等问题,鉴于本模型的实际情况,存储池单元数量设定为1000已然足够。在β取不同值时,预测误差率随训练次数增加的变化如图3所示。在该图中,各条折线在训练长度为100、500、1100次时出现极小值,但是100和500并非可取的训练次数,因为其训练跨度过小,存储池过大,两者不匹配则容易造成过拟合等不利实验的结果。所以在本实验中,训练数据长度设置为1100。根据各折线情况,在β从0.1至0.4 变化过程中,误差大致呈下降趋势,而在β值增加到0.5时误差率又出现了升高。故实验中设定β=0.4,使误差率相对较低。在ESN预测景点动态质量实验中,设置参数如表1 所示。支持不同预测数据、不同计算机能力和不同场景可以修改本实施例中的例子得到。
表1ESN预测实验参数设置
参数 | ESN训练长度 | Nw | β |
取值 | 1100 | 1000 | 0.4 |
如图2a-2d所示,本发明公开的一种基于回声状态网络预测景点动态质量的景点综合质量评估方法,从网络挖掘大量具有相同属性的用户游览景点的历史轨迹,利用回声状态网络(Echo State Network,ESN),根据用户历史参观景点的概率分布,预测景点动态质量(未来景点可参观性),结合网络挖掘景点出名程度、游客感兴趣程度等景点静态质量对景点综合质量进行量化,如图1所示其具体步骤为:
步骤1:网络挖掘大量相关数据,如景点静态指标、景点地理位置和类型、大量用户参观景点历史轨迹。
本实验从GeoLife挖掘了大量用户历史轨迹,根据部分属性相似的用户(如性别、年龄、学历程度等)的一段时间(以小时为单位)内的历史轨迹,计算各类景点被参观的概率,由于该概率跟用户在不同季节日期的动态偏好紧密相关,且根据ESN的性质,存储池中的记忆单元随时更新,所以该数据可以用于后续预测景点动态质量。由于类似景点具有类似的特点,在本模型中将景点归为四类:自然景观类、人文景观类、休闲游戏类、历史建筑类。
步骤2:基于具有相同属性(相同年龄段、性别等)的用户参观景点的历史轨迹信息,使用ESN对景点动态质量进行预测。为使结果更可靠,针对部分样本数据以时长τ取平均再投入训练。本模型中τ单位为日,即取24小时各类景点参观概率的平均值作为该日各类景点动态质量情况。如实验设置中所述,本实验中选取1100天进行Wout训练,并由此预测出未来60天各类景点被参观概率分布,如2a-2d所示。为了验证本实验的可靠性,本实验采取该60天真实概率数据与预测数据进行对比。由图可见,代表真实概率的方格线与代表预测概率的三角线基本以相同的趋势变化,验证了ESN预测的准确性以及实际可用性。在已有景点静态质量数据的情况下,由于该预测数据在一定程度上表征了特定时期用户人群对一个景点的偏好情况,所以辅以该预测数据进行未来某日景点综合质量评估将更符合用户习惯和实际情况,具有实际可行性。
步骤3:结合景点动态质量结合网络挖掘景点出名程度、游客感兴趣程度等对景点静态质量进行量化。
表2北京地区各景点综合质量信息
本实验从TripAdvisor网站挖掘了用户大量有关景点信息的评价及评分,由于该评分基于大量用户长久以来的游历经验,评分中不包含时间信息,即该评分不会由于季节日期等时间更替有所改变,所以本实验中使用其作为景点静态质量指标。该指标主要由两项构成:各个景点获得的点评数作为衡量一个景点的出名程度的标准,各个景点获得的平均评分作为衡量一个景点受欢迎程度(游客感兴趣程度)的指标。另外本实验GeoDeg 挖掘了北京地区的景点以及景点归类数据信息。利用公式6计算某特定日期各景点的综合质量,结果如表2所示。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (5)
1.基于回声状态网络的景点动态质量预测方法,其特征在于:基于具有相同属性的用户参观景点的历史轨迹信息,使用ESN对景点动态质量进行预测,结合网络挖掘景点出名程度、游客感兴趣程度等景点静态质量对景点综合质量进行量化,其具体步骤为:
步骤1:网络挖掘大量相关数据,如景点静态指标、景点地理位置和类型、大量用户参观景点历史轨迹;
步骤2:基于具有相同属性的用户参观景点的历史轨迹信息,使用ESN对景点动态质量进行预测;
步骤3:结合景点静态质量如出名程度、用户感兴趣程度,计算景点综合质量。
2.根据权利要求1所述的基于回声状态网络的景点动态质量预测方法,其特征在于:步骤2所述的获得景点动态质量信息的方法,具体步骤如下:
步骤2.1:网络数据挖掘大量具有相似属性的用户各类景点参观历史轨迹,并计算各类景点被参观的频率数据样本以作为训练数据;
步骤2.2:利用输入用户属性向量xτ=[xτ,1,...,xτ,K]T计算τ时刻存储池状态vτ:
vτ=f(W·vτ-1+Win·xτ); (公式1);
步骤2.3:根据输入用户属性结合存储池状态输出τ时刻景点动态质量预测值:
yτ(xτ)=[proτ,1,proτ,2,...,proτ,N]:
步骤2.4:根据真实值更新输出权重矩阵以实现预测值与真实值之间的逼近:
或:
上述公式中,为输入权重矩阵,Nw为存储池单元数量;W为存储池循环矩阵;Wout是唯一需要随时间训练更替的输出权重矩阵,包含了输出与输入的关系;β为调制系数。
3.根据权利要求1所述的基于回声状态网络的景点动态质量预测方法,其特征在于:步骤3所述的景点动态质量结合网络挖掘景点出名程度、游客感兴趣程度对景点静态质量进行量化的方法,如下所述:
景点pi获得的点评数量作为景点出名程度的指标,以标准化形式表述:通过分析景点pi获得的评论和评分作为用户感兴趣程度的指标,以标准化形式表述:
从而获得景点综合质量:
<mrow>
<msub>
<mi>r</mi>
<mi>&tau;</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>&eta;</mi>
<mo>&CenterDot;</mo>
<mfrac>
<mrow>
<msub>
<mi>num</mi>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
</msub>
</mrow>
<mrow>
<munder>
<mi>max</mi>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
</munder>
<msub>
<mi>num</mi>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
</msub>
</mrow>
</mfrac>
<mo>+</mo>
<mi>&mu;</mi>
<mo>&CenterDot;</mo>
<mfrac>
<msub>
<mi>int</mi>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
</msub>
<mrow>
<munder>
<mi>max</mi>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
</munder>
<msub>
<mi>int</mi>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
</msub>
</mrow>
</mfrac>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>&eta;</mi>
<mo>-</mo>
<mi>&mu;</mi>
</mrow>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>pro</mi>
<mrow>
<mi>&tau;</mi>
<mo>,</mo>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
</mrow>
</msub>
<mo>,</mo>
<mo>;</mo>
</mrow>
其中,η、μ为权重。
4.根据权利要求2所述的基于回声状态网络的景点动态质量预测方法,其特征在于:步骤2.4中W为存储池循环矩阵,为了使该神经网络具有回声状态网络性质,循环矩阵W是权值谱半径小于1的稀疏矩阵,也就是说该矩阵的最大绝对特征值小于1,表示如下:ρ(W)<1。当实际情况依赖较长时间的历史记忆数据的时候,ρ(W)需要被设置得大一些;当实际情况较依赖近期情况时,ρ(W)则需要小一些。
5.根据权利要求2所述的基于回声状态网络的景点动态质量预测方法,其特征在于:步骤2.4中输出权重矩阵包含了大量用户信息与游览景点之间的关系,被训练以用来输出预测数据,有如公式3和公式4两种训练方式,其中,公式3为岭回归方式进行巡览,由如下公式求导得来:
即实现预测值与真实值的逼近。该方法对比于最小化均方根误差方法来说,添加了偏置有利于控制Wout的变化幅度,防止过拟合以及调节反馈不稳定带来的影响;
公式4为线性梯度下降方法,其中,λα是学习速率,eτ是日期τ真实的各类景点被参观概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710410788.7A CN107316103A (zh) | 2017-06-04 | 2017-06-04 | 基于回声状态网络的景点动态质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710410788.7A CN107316103A (zh) | 2017-06-04 | 2017-06-04 | 基于回声状态网络的景点动态质量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107316103A true CN107316103A (zh) | 2017-11-03 |
Family
ID=60184027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710410788.7A Pending CN107316103A (zh) | 2017-06-04 | 2017-06-04 | 基于回声状态网络的景点动态质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107316103A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108376260A (zh) * | 2018-01-30 | 2018-08-07 | 陕西师范大学 | 一种基于最优子集优化的svr旅游需求预测方法 |
CN109978238A (zh) * | 2019-03-05 | 2019-07-05 | 电子科技大学 | 基于深度回声状态网络的目的地预测方法 |
CN110110243A (zh) * | 2019-04-27 | 2019-08-09 | 华南理工大学 | 一种基于回声状态网络的历史轨迹目的地预测方法 |
CN110188490A (zh) * | 2019-06-03 | 2019-08-30 | 珠海格力电器股份有限公司 | 提高数据仿真效率的方法及装置、存储介质和电子装置 |
-
2017
- 2017-06-04 CN CN201710410788.7A patent/CN107316103A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108376260A (zh) * | 2018-01-30 | 2018-08-07 | 陕西师范大学 | 一种基于最优子集优化的svr旅游需求预测方法 |
CN109978238A (zh) * | 2019-03-05 | 2019-07-05 | 电子科技大学 | 基于深度回声状态网络的目的地预测方法 |
CN109978238B (zh) * | 2019-03-05 | 2022-05-03 | 电子科技大学 | 基于深度回声状态网络的目的地预测方法 |
CN110110243A (zh) * | 2019-04-27 | 2019-08-09 | 华南理工大学 | 一种基于回声状态网络的历史轨迹目的地预测方法 |
CN110188490A (zh) * | 2019-06-03 | 2019-08-30 | 珠海格力电器股份有限公司 | 提高数据仿真效率的方法及装置、存储介质和电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
He et al. | Mining transition rules of cellular automata for simulating urban expansion by using the deep learning techniques | |
Zhang et al. | Probabilistic framework with bayesian optimization for predicting typhoon-induced dynamic responses of a long-span bridge | |
Halgamuge et al. | Best optimizer selection for predicting bushfire occurrences using deep learning | |
Russo et al. | Air quality prediction using optimal neural networks with stochastic variables | |
CN107316103A (zh) | 基于回声状态网络的景点动态质量预测方法 | |
Jalalkamali | Using of hybrid fuzzy models to predict spatiotemporal groundwater quality parameters | |
Tefek et al. | A new hybrid gravitational search–teaching–learning-based optimization method for energy demand estimation of Turkey | |
CN109242149A (zh) | 一种基于教育数据挖掘的学生成绩早期预警方法及系统 | |
Gadhavi et al. | Student final grade prediction based on linear regression | |
Li et al. | Knowledge transfer and adaptation for land-use simulation with a logistic cellular automaton | |
Wang et al. | Design and implementation of early warning system based on educational big data | |
Karimi Ghaleh Jough et al. | Steel moment-resisting frame reliability via the interval analysis by FCM-PSO approach considering various uncertainties | |
Gao | Forecast model of perceived demand of museum tourists based on neural network integration | |
Semero et al. | A GA-PSO hybrid algorithm based neural network modeling technique for short-term wind power forecasting | |
Moustris et al. | One‐Day Prediction of Biometeorological Conditions in a Mediterranean Urban Environment Using Artificial Neural Networks Modeling | |
Amador-Jiménez et al. | Roads performance modeling and management system from two condition data points: case study of Costa Rica | |
Zhang et al. | A nested modelling approach to infrastructure performance characterisation | |
Lu et al. | A self-learning system for local ramp metering with queue management | |
Naderianfar et al. | Pre-processing data to predict groundwater levels using the fuzzy standardized evapotranspiration and precipitation index (SEPI) | |
Dong et al. | Research on academic early warning model based on improved SVM algorithm | |
Xinliang et al. | University restaurant sales forecast based on bp neural network–in shanghai jiao tong university case | |
Chaabouni | Modeling and forecasting 3E in Eastern Asia: a comparison of linear and nonlinear models | |
You et al. | Optimal placement of wireless sensor nodes for bridge dynamic monitoring based on improved particle swarm algorithm | |
Li | Prediction of rural tourism suitability based on multi-dimensional evaluation model | |
Makropoulos et al. | A neurofuzzy spatial decision support system for pipe replacement prioritisation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171103 |
|
RJ01 | Rejection of invention patent application after publication |