CN117611397A - 基于多维数据分析的文旅综合管理平台 - Google Patents
基于多维数据分析的文旅综合管理平台 Download PDFInfo
- Publication number
- CN117611397A CN117611397A CN202311737536.7A CN202311737536A CN117611397A CN 117611397 A CN117611397 A CN 117611397A CN 202311737536 A CN202311737536 A CN 202311737536A CN 117611397 A CN117611397 A CN 117611397A
- Authority
- CN
- China
- Prior art keywords
- data
- cultural
- tourist
- class
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 7
- 238000011156 evaluation Methods 0.000 claims description 69
- 238000007726 management method Methods 0.000 claims description 41
- 238000013499 data model Methods 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000002452 interceptive effect Effects 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 8
- 230000005587 bubbling Effects 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000011158 quantitative evaluation Methods 0.000 claims description 4
- 238000012800 visualization Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 21
- 238000011161 development Methods 0.000 abstract description 13
- 238000004458 analytical method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000003203 everyday effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000004382 visual function Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于多维数据分析的文旅综合管理平台,涉及文旅管理技术领域,基于排序算法对一类数据集、二类数据集以及三类数据集中的数据点进行排序后,依据排序结果通过梯度分级方法分级处理所有数据点,NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合,可视化处理后的服务集合信息向旅游企业进行展示,排序结果向决策者以及用户进行展示。该管理平台将管理区域内的所有景区、文化场馆和旅游企业进行排序以及分级处理,不仅有效发展好的景区、文化场馆进行推广,提高文旅引流量,而且向决策者提供景区、文化场馆和旅游企业的发展状况以及决策支持,便于决策者进行管理,提高对区域的文旅管理效率和效果。
Description
技术领域
本发明涉及文旅管理技术领域,具体涉及基于多维数据分析的文旅综合管理平台。
背景技术
随着社会经济的发展和人们生活水平的提高,文化旅游产业逐渐成为经济的重要支柱之一,政府和企业开始重视文化和旅游资源的开发与利用,以推动地方经济的发展,在信息时代,数字化转型成为推动各行业发展的关键因素之一,文旅综合管理平台顺应了数字化转型的趋势,通过信息技术的应用,实现对文化和旅游资源的全面管理和服务优化,文化和旅游资源涉及多个方面,包括景区、文化场馆、旅游企业等,为了更好地整合这些资源,提高资源的利用效率,文旅综合管理平台应运而生,平台整合各类资源,提供全方位的服务。
现有技术存在以下不足:
1、对于每个城市区域而言,与文旅发展相关的数据多维化,现有管理平台对与文旅发展相关多维数据没有整合处理,使得多维数据之间的关联性差,不便于用户查询,增加用户查询负担;
2、城市区域内包括多个景区、文化场馆、旅游企业,现有管理平台对这些景区、文化场馆、旅游企业没有排序和分级处理,从而无法向决策者提供有效的决策支持,降低对城市区域文旅发展的管理效率;
3、对多个景区、文化场馆、旅游企业不进行分级处理,一是容易使用户选择评级差的旅游企业服务评级高的景区或文化场馆,导致旅游企业的服务不到位,从而降低用户对景区或文化场馆体验指数,二是容易时用户选择评级高的旅游企业服务评级差的景区或文化场馆,增加用户消费成本的同时,造成服务资源的浪费。
发明内容
本发明的目的是提供基于多维数据分析的文旅综合管理平台,以解决背景技术中不足。
为了实现上述目的,本发明提供如下技术方案:基于多维数据分析的文旅综合管理平台,所述管理平台端口从需要被管理区域内的各个景区、文化场馆和旅游企业收集数据;
NoSQL数据库将收集的数据划分为一类数据集、二类数据集、三类数据集,使用Open-Refine工具对一类数据集、二类数据集以及三类数据集中的属性数据进行清洗;
一类数据集、二类数据集以及三类数据集整合到数据仓库中,并在数据仓库中建立多维数据模型;
建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询;
基于排序算法对一类数据集、二类数据集以及三类数据集中的数据点进行排序后,依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业;
NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合;
通过Microsoft-Power-BI可视化工具将所有服务集合以及一类数据集、二类数据集以及三类数据集的排序结果可视化处理;
可视化处理后的服务集合信息向旅游企业进行展示,排序结果向决策者以及用户进行展示。
在一个优选的实施方式中,所述一类数据集中每个景区为独立的数据点,在一类数据集中每个数据点均包含景区属性数据,所述二类数据集中每个文化场馆为独立的数据点,在二类数据集中每个数据点均包含文化场馆属性数据,所述三类数据集中每个旅游企业为独立的数据点,在三类数据集中每个数据点均包含旅游企业属性数据。
在一个优选的实施方式中,所述一类数据集、二类数据集、三类数据集的划分包括以下步骤:
一类数据集:将从各个景区收集到的数据整合到数据库中,将每个景区的数据导入到对应的数据库表中,数据库表包含景区属性,每一行代表一个景区的数据点,列包括景区的各种属性数据;
二类数据集:将从各个文化场馆收集到的数据整合到数据库中,将每个文化场馆的数据导入到对应的数据库表中,数据库表包含文化场馆属性,每一行代表一个文化场馆的数据点,列包括文化场馆的各种属性数据;
三类数据集:将从各个旅游企业收集到的数据整合到数据库中,将每个旅游企业的数据导入到对应的数据库表中,数据库表包含旅游企业属性,每一行代表一个旅游企业的数据点,列包括旅游企业的各种属性数据。
在一个优选的实施方式中,对一类数据集中所有的景区进行排序包括以下步骤:
获取景区的游客满意度、景区设施、服务质量指标,将定量的评估指标转化为模糊集;
将模糊化后的游客满意度、景区设施、服务质量分别标记为μA(x)、μB(x)、μC(x),其中,x是输入的值,则通过模糊化后的游客满意度、景区设施、服务质量输出综合评估隶属度,表达式为:
μJQ(x)=min(μA(x),μB(x),μC(x));μA(x)、μB(x)、μC(x)分别为模糊化后的游客满意度、景区设施、服务质量,μJQ(x)为综合评估隶属度;
获取景区不同时期的综合评估隶属度μJQ(x)后,通过平均值法将综合评估隶属度转化为数值,表达式为:式中,μJQavg表示景区的综合评估平均隶属度,i=1、2、3、、、、n,n为景区不同时期样本数量,μJQ(xi)表示景区第i个时期样本的综合评估隶属度,ωi表示第i个时期样本的综合评估隶属度的权重,且ωi大于0;
获取区域中所有景区的综合评估平均隶属度μJQavg后,通过冒泡法依据综合评估平均隶属度μJQavg由大到小对所有景区进行排序获取景区列表。
在一个优选的实施方式中,对二类数据集中所有的文化场馆进行排序包括以下步骤:
获取文化场馆的人流量幅值、文化维度指数、经济维度指数以及社会维度指数;
将人流量幅值、文化维度指数、经济维度指数以及社会维度指数进行归一化处理后综合计算获取场馆系数cgx,表达式为:
式中,rf为人流量幅值,whd为文化维度指数,jwd为经济维度指数,shd为社会维度指数,α、β、γ分别为文化维度指数、经济维度指数以及社会维度指数的比例系数,且α、β、γ均大于0;
获取所有文化场馆的场馆系数cgx值后,将所有文化场馆依据场馆系数cgx值由大到小进行排序获取文化场馆列表;
人流量幅值的计算逻辑为:
计算文化场馆的历史每天的平均人流量以及人流量标准差;
平均人流量的计算表达式为:人流量标准差的计算表达式为:式中,j={1、2、3、...、m},m表示采集的历史天数,且m大于1并为正整数,trj表示第j天的人流量,ravg表示平均人流量,RQ为人流量标准差;
综合分析文化场馆的历史每天的平均人流量以及人流量标准差获取人流量幅值;
若平均人流量<人流量阈值,且人流量标准差≤标准差阈值,分析文化场馆的历史人流量少且稳定,人流量幅值rf=1.50;
若平均人流量<人流量阈值,且人流量标准差>标准差阈值,分析文化场馆的历史人流量少且不稳定(即存在部分天数的人流量较多),人流量幅值rf=1.40;
若平均人流量≥人流量阈值,且人流量标准差>标准差阈值,分析文化场馆的历史人流量多且不稳定(即存在部分天数的人流量较少),人流量幅值rf=1.20;
若平均人流量≥人流量阈值,且人流量标准差≤标准差阈值,分析文化场馆的历史人流量多且稳定,人流量幅值rf=1.00;
综上所述人流量幅值rf的值较大,表明文化场馆的历史人流量每天都处于较少的状态。
文化维度指数whd的计算表达式为:式中,WZ为文化活动值,CZ为藏品展览值,文化活动值=通过(文化活动数量+教育项目数量)/区域中所有文化场馆数量,藏品展览值=(藏品数量+展览数量)/区域中所有文化场馆数量,文化维度指数whd越大,表明文化场馆的文化底蕴越高。
经济维度指数jwd的计算表达式为:式中,GX为经济贡献值,HZ为企业合作值,经济贡献值=文化场馆经济贡献总和/区域中所有文化场馆数量,企业合作值=文化场馆与企业合作数量/区域中所有文化场馆数量,经济维度指数jwd越大,表明文化场馆为区域带来的经济效益越好。
社会维度指数shd的计算表达式为:式中,JY为社会就业值,SZ为社会责任值,社会就业值=文化场馆就业人数/区域中所有文化场馆数量,社会责任值=文化场馆的社会责任活动数量/区域中所有文化场馆数量,社会维度指数shd越大,表明文化场馆对区域的社会影响越大。
在一个优选的实施方式中,依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业包括以下步骤:
获取景区列表、文化场馆列表以及旅游企业列表,在景区列表、文化场馆列表以及旅游企业列表中,景区、文化场馆或旅游企业的排名越靠前,表明该景区、文化场馆或旅游企业在区域中的重要度越大;
本实施例通过等分法对景区列表、文化场馆列表、旅游企业列表中的景区、文化场馆、旅游企业进行分级,预设一个等分数k,k为大于1的正整数;
获取景区列表中的景区数量,通过k等分数将景区列表中的景区划分为k组,每个组内的景区对应一个级别;
获取文化场馆列表中的文化场馆数量,通过k等分数将文化场馆列表中的文化场馆划分为k组,每个组内的文化场馆对应一个级别;
获取旅游企业列表中的旅游企业数量,通过k等分数将旅游企业列表中的旅游企业划分为k组,每个组内的旅游企业对应一个级别;
NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合。
在一个优选的实施方式中,依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业,包括以下步骤:
获取景区列表后,依据预设的第一隶属度阈值以及第二隶属度阈值对景区列表中的所有景区进行等级划分,具体为:
获取景区列表中每个景区的综合评估平均隶属度μJQavg;
将所有综合评估平均隶属度μJQavg≥第二隶属度阈值的景区划入第一等级,将所有第一隶属度阈值≤综合评估平均隶属度μJQavg<第二隶属度阈值的景区划入第二等级,将所有综合评估平均隶属度μJQavg<第一隶属度阈值的景区划入第三等级;
获取文化场馆列表后,依据预设的第一重要度阈值以及第二重要度阈值对文化场馆列表中的所有文化场馆进行等级划分,具体为:
获取文化场馆列表中每个文化场馆的场馆系数cgx;
将所有场馆系数cgx≥第二重要度阈值的文化场馆划入第一等级,将所有第一重要度阈值≤场馆系数cgx<第二重要度阈值的文化场馆划入第二等级,将所有场馆系数cgx<第一重要度阈值的文化场馆划入第三等级;
获取旅游企业列表后,依据预设的第一服务阈值以及第二服务阈值对旅游企业列表中的所有旅游企业进行等级划分,具体为:
获取旅游企业列表中每个旅游企业的企业指数qyz;
将所有企业指数qyz≥第二服务阈值的旅游企业划入第一等级,将所有第一服务阈值≤企业指数qyz<第二服务阈值的旅游企业划入第二等级,将所有企业指数qyz<第一服务阈值的旅游企业划入第三等级。
在一个优选的实施方式中,获取区域中所有景区的综合评估平均隶属度μJQavg后,通过冒泡法依据综合评估平均隶属度μJQavg由大到小对所有景区进行排序包括以下步骤:
将每个景区的信息及其对应的综合评估平均隶属度构建为一个数组;
从数组的第一个元素开始,比较相邻的两个元素的综合评估平均隶属度,若前一个元素的综合评估平均隶属度小于后一个元素的综合评估平均隶属度,则交换这两个元素的位置,继续进行比较和交换,直到整个数组被遍历一次;
进行多次遍历,每次遍历都会将数组中最大的综合评估平均隶属度移到数组的最前;
遍历完成后,数组中的景区按照综合评估平均隶属度从大到小排列,从排序后的数组中获取排序完成的景区列表。
在一个优选的实施方式中,一类数据集、二类数据集以及三类数据集整合到数据仓库中,并在数据仓库中建立多维数据模型包括以下步骤:
定义维度表和事实表后数据库结构和模式,并创建数据仓库;
将一类数据集、二类数据集和三类数据集导入到相应的数据仓库中,为每类数据集中的独立属性创建相应的维度表;
通过在事实表中添加与维度表关联的外键定义维度表与事实表之间的关系;
使用数据仓库工具基于维度表与事实表建立多维数据模型,并为每个维度表定义层次结构。
在一个优选的实施方式中,建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询包括以下步骤:
OLAP工具中建立与数据仓库的连接,提供连接信息,连接信息包括数据库类型、地址、用户名和密码;
数据仓库中建立的多维数据模型导入到OLAP工具中,在OLAP工具中配置多维数据模型;
基于多维数据模型的逻辑结构在OLAP工具中定义多维立方体,并为每个多维立方体定义维度和度量,维度用于分析的属性,度量为分析的数据值;
通过OLAP工具创建报表和仪表板,报表包括各种图表、表格,用户通过配置后的OLAP工具交互式界面进行查询。
在上述技术方案中,本发明提供的技术效果和优点:
1、本发明通过在数据仓库中建立多维数据模型,建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询,基于排序算法对一类数据集、二类数据集以及三类数据集中的数据点进行排序后,依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业,NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合,可视化处理后的服务集合信息向旅游企业进行展示,排序结果向决策者以及用户进行展示。该管理平台能够有效将管理区域内与文旅发展相关的多维数据整合展示,从而便于用户进行数据查询,并将管理区域内的所有景区、文化场馆和旅游企业进行排序以及分级处理,不仅有效发展好的景区、文化场馆进行推广,提高文旅引流量,而且向决策者提供景区、文化场馆和旅游企业的发展状况以及决策支持,便于决策者进行管理,提高对区域的文旅管理效率和效果;
2、本发明通过将人流量幅值、文化维度指数、经济维度指数以及社会维度指数进行归一化处理后综合计算获取场馆系数cgx,并且将所有文化场馆依据场馆系数cgx值由大到小进行排序获取文化场馆列表,不仅有效提高对数据的处理效率,而且综合分析更为全面,准确性更高。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还根据这些附图获得其他的附图。
图1为本发明的方法流程图。
图2为本发明的思维导图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:请参阅图1和图2所示,本实施例所述基于多维数据分析的文旅综合管理平台,具体为:
管理平台端口从需要被管理区域内的各个景区、文化场馆和旅游企业收集数据,将景区收集的数据划分为一类数据集,一类数据集中每个景区为独立的数据点,在一类数据集中每个数据点均包含景区属性数据,将文化场馆收集的数据划分为二类数据集,二类数据集中每个文化场馆为独立的数据点,在二类数据集中每个数据点均包含文化场馆属性数据,将旅游企业收集的数据划分为三类数据集,三类数据集中每个旅游企业为独立的数据点,在三类数据集中每个数据点均包含旅游企业属性数据,对一类数据集、二类数据集以及三类数据集中的属性数据进行清洗,解决数据质量问题,确保数据的一致性和准确性;
将一类数据集、二类数据集以及三类数据集整合到数据仓库中,并在数据仓库中建立多维数据模型,多维数据模型包括维度和度量,维度包括时间、地理位置、类型等,度量包括销售额、游客数量等,并将建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询,例如,查询某个景区在过去一年内的游客数量和门票销售情况,比较不同文化场馆的展览参与度和受欢迎程度,获取各个旅游企业的综合数据等;
对一类数据集、二类数据集以及三类数据集中的数据点进行排序后,依据排序结果通过梯度分级方法分级处理所有数据点,并将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合,通过可视化工具将所有服务集合以及一类数据集、二类数据集以及三类数据集的排序结果可视化处理后,将服务集合信息向旅游企业进行展示,将排序结果向决策者以及用户进行展示。
本申请通过在数据仓库中建立多维数据模型,建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询,基于排序算法对一类数据集、二类数据集以及三类数据集中的数据点进行排序后,依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业,NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合,可视化处理后的服务集合信息向旅游企业进行展示,排序结果向决策者以及用户进行展示。该管理平台能够有效将管理区域内与文旅发展相关的多维数据整合展示,从而便于用户进行数据查询,并将管理区域内的所有景区、文化场馆和旅游企业进行排序以及分级处理,不仅有效发展好的景区、文化场馆进行推广,提高文旅引流量,而且向决策者提供景区、文化场馆和旅游企业的发展状况以及决策支持,便于决策者进行管理,提高对区域的文旅管理效率和效果。
所述管理平台端口从需要被管理区域内的各个景区、文化场馆和旅游企业收集数据,包括以下步骤:
确保只有经过授权的景区、文化场馆和旅游企业能够接入平台,采用安全的身份验证和授权机制,确保不同来源的数据能够以统一的格式进行传输和存储,以方便后续处理和分析,制定数据采集计划,确定需要收集的数据类型、频率和来源,这包括游客数量、销售数据、服务反馈等,设计合适的API或数据接口,使得景区、文化场馆和旅游企业方便地将数据发送到管理平台,这通常需要遵循标准的API设计原则,选择合适的数据传输方式,是HTTPS、FTP等,确保数据在传输过程中的安全性和完整性,将收集到的数据存储在安全、可靠的存储系统中,是关系型数据库、NoSQL数据库或云存储服务。
NoSQL数据库将收集的数据划分为一类数据集、二类数据集、三类数据集,将景区收集的数据划分为一类数据集,一类数据集中每个景区为独立的数据点,在一类数据集中每个数据点均包含景区属性数据,将文化场馆收集的数据划分为二类数据集,二类数据集中每个文化场馆为独立的数据点,在二类数据集中每个数据点均包含文化场馆属性数据,将旅游企业收集的数据划分为三类数据集,三类数据集中每个旅游企业为独立的数据点,在三类数据集中每个数据点均包含旅游企业属性数据,包括以下步骤:
一类数据集(景区数据集):
将从各个景区收集到的数据整合到一个数据库中,确保数据格式一致,设计一个包含景区属性的数据库表,每一行代表一个景区的数据点,列包括景区的各种属性数据,将每个景区的数据导入到对应的数据库表中,确保每一行数据都包含景区的相关属性;
二类数据集(文化场馆数据集):
将从各个文化场馆收集到的数据整合到数据库中,确保数据格式一致,设计一个包含文化场馆属性的数据库表,每一行代表一个文化场馆的数据点,列包括文化场馆的各种属性数据,将每个文化场馆的数据导入到对应的数据库表中,确保每一行数据都包含文化场馆的相关属性;
三类数据集(旅游企业数据集):
将从各个旅游企业收集到的数据整合到数据库中,确保数据格式一致,设计一个包含旅游企业属性的数据库表,每一行代表一个旅游企业的数据点,列包括旅游企业的各种属性数据,将每个旅游企业的数据导入到对应的数据库表中,确保每一行数据都包含旅游企业的相关属性;
在数据导入过程中进行数据质量检查,确保数据的准确性和完整性,如果有不同数据集之间的关联关系,建立关系,确保通过数据库查询获取跨数据集的信息,设置数据库的访问权限,确保只有经过授权的用户或系统能够访问和修改数据,制定数据库的备份和恢复策略,以防止数据丢失或损坏。
使用Open-Refine工具对一类数据集、二类数据集以及三类数据集中的属性数据进行清洗,包括以下步骤:
打开Open-Refine,导入包含景区数据、文化场馆数据以及旅游企业数据的文件或从数据库中查询数据,检查列名是否一致,进行必要的列名清洗和标准化,识别并处理数据中的缺失值,使用Open-Refine提供的功能填充或删除缺失值,使用Open-Refine的去重功能,清除数据中的重复记录,根据需要,将列的数据类型转换为正确的格式,例如将日期转换为标准日期格式,对文本数据进行清理,去除多余的空格、标点符号,进行大小写转换等。
一类数据集、二类数据集以及三类数据集整合到数据仓库中,并在数据仓库中建立多维数据模型,包括以下步骤:
创建数据仓库,确定数据库结构和模式,这包括定义维度表(Dimension-Tables)和事实表(Fact-Tables)等,将一类数据集、二类数据集和三类数据集导入到相应的数据库表中,确保数据导入过程中的一致性和准确性,为每个数据集中的独立属性(景区属性、文化场馆属性、旅游企业属性)创建相应的维度表,维度表包含唯一的、描述性的属性,创建事实表,其中包含从不同数据集中提取的度量或数值数据,确保事实表的结构和列与业务需求相匹配,定义维度表与事实表之间的关系,通常,这是通过在事实表中添加与维度表关联的外键来实现的,使用数据仓库工具或查询语言,建立多维数据模型,多维模型应该反映业务中的关键性能指标和维度,为每个维度表定义层次结构,以支持更高层次的分析和查询。
建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询,包括以下步骤:
在OLAP工具中,建立与数据仓库的连接,提供连接信息,包括数据库类型、地址、用户名和密码等,将在数据仓库中建立的多维数据模型导入到OLAP工具中,这通常涉及选择维度、事实表以及定义层次结构,在OLAP工具中配置多维数据模型,确保维度之间的关系正确,维度表和事实表的连接有效,在OLAP工具中定义多维立方体(Cubes),这是基于多维数据模型的逻辑结构,用于存储和组织数据,为每个多维立方体定义维度和度量,维度是用于分析的属性,而度量是要分析的数据值,利用OLAP工具的可视化功能,创建报表和仪表板,这些报表包含各种图表、表格和其他可视化元素,配置OLAP工具以支持用户通过交互式界面进行查询,包括设置筛选器、切片、切块等功能,以便用户灵活地选择和分析数据,设置OLAP工具以支持数据的钻取(Drill-Down)和切换(Sliceand-Dice),这使得用户深入到更详细的数据或在不同维度之间切换视角,对OLAP查询进行性能调优,确保查询的响应时间在合理范围内,包括索引优化、缓存配置等。
实施例2:基于排序算法对一类数据集、二类数据集以及三类数据集中的数据点进行排序,具体为:
对一类数据集中所有的景区进行排序包括以下步骤:
获取景区的游客满意度、景区设施、服务质量等多个方面的指标,将定量的评估指标转化为模糊集,模糊化过程考虑到指标的模糊性,例如将“服务质量”这个指标模糊化为“良好”、“一般”、“差”等隶属度,基于预设的模糊规则描述不同模糊指标之间的关系,例如,如果游客满意度高且服务质量好,则景区评分高;
将模糊化后的游客满意度、景区设施、服务质量分别标记为μA(x)、μB(x)、μC(x),其中x是输入的值,则通过模糊化后的游客满意度、景区设施、服务质量输出综合评估隶属度,表达式为:
μJQ(x)=min(μA(x),μB(x),μC(x));μA(x)、μB(x)、μC(x)分别为模糊化后的游客满意度、景区设施、服务质量,μJQ(x)为综合评估隶属度,这表示游客满意度、景区设施、服务质量三个指标的模糊AND操作的输出隶属度为游客满意度、景区设施、服务质量隶属度的最大值,这是因为在模糊AND中,我们希望取三者的最小值,以确保输出的隶属度不超过输入中最弱的一方,综合评估隶属度越大,表明景区在多个指标上表现越好,越得认可;
获取景区不同时期的综合评估隶属度μJQ(x)后,通过平均值法将综合评估隶属度转化为数值,表达式为:式中,μJQavg表示景区的综合评估平均隶属度,i=1、2、3、、、、n,n为景区不同时期样本数量,μJQ(xi)表示景区第i个时期样本的综合评估隶属度,ωi表示第i个个时期样本的综合评估隶属度的权重,且ωi大于0;
获取区域中所有景区的综合评估平均隶属度μJQavg后,通过冒泡法依据综合评估平均隶属度μJQavg由大到小对所有景区进行排序,包括以下步骤:
将每个景区的信息及其对应的综合评估平均隶属度构建为一个数组,每个元素包含景区信息和其对应的综合评估平均隶属度,从数组的第一个元素开始,比较相邻的两个元素的综合评估平均隶属度,如果前一个元素的综合评估平均隶属度小于后一个元素,则交换这两个元素的位置,继续进行上述比较和交换,直到整个数组被遍历一次;
进行多次遍历,每次遍历都会将数组中最大的综合评估平均隶属度移到数组的最前,每次遍历都可以减少比较的次数,因为最大的元素已经在正确的位置上,当遍历完成后,数组中的景区按照综合评估平均隶属度从大到小排列,从排序后的数组中获取排序完成的景区列表。
对二类数据集中所有的文化场馆进行排序包括以下步骤:
获取文化场馆的人流量幅值、文化维度指数、经济维度指数以及社会维度指数;
将人流量幅值、文化维度指数、经济维度指数以及社会维度指数进行归一化处理后综合计算获取场馆系数cgx,表达式为:
式中,rf为人流量幅值,whd为文化维度指数,jwd为经济维度指数,shd为社会维度指数,α、β、γ分别为文化维度指数、经济维度指数以及社会维度指数的比例系数,且α、β、γ均大于0,比例系数α、β、γ的具体取值依据城市区域看重文化场馆哪方面发展的重要性来具体设定,在此不做限定,例如,城市区域看重文化场馆的文化方面,其次是社会方面,则α>γ>β>0;
人流量幅值的计算逻辑为:
计算文化场馆的历史每天的平均人流量以及人流量标准差;
平均人流量的计算表达式为:人流量标准差的计算表达式为:式中,j={1、2、3、...、m},m表示采集的历史天数,且m大于1并为正整数,trj表示第j天的人流量,ravg表示平均人流量,RQ为人流量标准差;
综合分析文化场馆的历史每天的平均人流量以及人流量标准差获取人流量幅值;
若平均人流量<人流量阈值,且人流量标准差≤标准差阈值,分析文化场馆的历史人流量少且稳定,人流量幅值rf=1.50;
若平均人流量<人流量阈值,且人流量标准差>标准差阈值,分析文化场馆的历史人流量少且不稳定(即存在部分天数的人流量较多),人流量幅值rf=1.40;
若平均人流量≥人流量阈值,且人流量标准差>标准差阈值,分析文化场馆的历史人流量多且不稳定(即存在部分天数的人流量较少),人流量幅值rf=1.20;
若平均人流量≥人流量阈值,且人流量标准差≤标准差阈值,分析文化场馆的历史人流量多且稳定,人流量幅值rf=1.00;
综上所述人流量幅值rf的值较大,表明文化场馆的历史人流量每天都处于较少的状态。
文化维度指数whd的计算表达式为:式中,WZ为文化活动值,CZ为藏品展览值,文化活动值=通过(文化活动数量+教育项目数量)/区域中所有文化场馆数量,藏品展览值=(藏品数量+展览数量)/区域中所有文化场馆数量,文化维度指数whd越大,表明文化场馆的文化底蕴越高。
经济维度指数jwd的计算表达式为:式中,GX为经济贡献值,HZ为企业合作值,经济贡献值=文化场馆经济贡献总和/区域中所有文化场馆数量,企业合作值=文化场馆与企业合作数量/区域中所有文化场馆数量,经济维度指数jwd越大,表明文化场馆为区域带来的经济效益越好。
社会维度指数shd的计算表达式为:式中,JY为社会就业值,SZ为社会责任值,社会就业值=文化场馆就业人数/区域中所有文化场馆数量,社会责任值=文化场馆的社会责任活动数量/区域中所有文化场馆数量,社会维度指数shd越大,表明文化场馆对区域的社会影响越大。
由场馆系数cgx的计算表达式可知,场馆系数cgx值越大,表明该文化场馆对城市区域的重要性越大,因此,获取所有文化场馆的场馆系数cgx值后,将所有文化场馆依据场馆系数cgx值由大到小进行排序获取文化场馆列表;
本申请通过将人流量幅值、文化维度指数、经济维度指数以及社会维度指数进行归一化处理后综合计算获取场馆系数cgx,并且将所有文化场馆依据场馆系数cgx值由大到小进行排序获取文化场馆列表,不仅有效提高对数据的处理效率,而且综合分析更为全面,准确性更高。
对三类数据集中所有的旅游企业进行排序包括以下步骤:
获取旅游企业的总消费人数赋值、投诉数量以及好评数量;
通过总消费人数赋值、投诉数量以及好评数量计算企业指数qyz,表达式为:qyz=ZXR*(0.3*HPR-0.7*TSR),式中,TSR为投诉数量,HPR为好评数量,ZXR为旅游企业的总消费人数赋值,企业指数qyz越大,表明企业的消费人数越多,且服务质量越好;
总消费人数赋值的获取逻辑为:若总消费人数大于等于人数阈值,则总消费人数赋值ZXR=5,若总消费人数<人数阈值,则总消费人数赋值ZXR=1;
获取企业指数qyz后,将所有的旅游企业依据企业指数qyz由大到小进行排序,生成旅游企业列表。
依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业,包括以下步骤:
获取景区列表、文化场馆列表以及旅游企业列表,在景区列表、文化场馆列表以及旅游企业列表中,景区、文化场馆或旅游企业的排名越靠前,表明该景区、文化场馆或旅游企业在区域中的重要度越大;
本实施例通过等分法对景区列表、文化场馆列表、旅游企业列表中的景区、文化场馆、旅游企业进行分级,预设一个等分数k,k为大于1的正整数;
获取景区列表中的景区数量,通过k等分数将景区列表中的景区划分为k组,每个组内的景区对应一个级别;
获取文化场馆列表中的文化场馆数量,通过k等分数将文化场馆列表中的文化场馆划分为k组,每个组内的文化场馆对应一个级别;
获取旅游企业列表中的旅游企业数量,通过k等分数将旅游企业列表中的旅游企业划分为k组,每个组内的旅游企业对应一个级别;
NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合;
由于景区列表、文化场馆列表以及旅游企业列表中的景区、文化场馆、旅游企业数量是不定的,为了避免景区列表、文化场馆列表以及旅游企业列表出现小数,举例如下:
假设k等分数预设为3,即划分为三个等级,且景区列表的数量16,文化场馆列表为23,旅游企业列表为26;
景区等级划分:通过16比上3得到余数1,将景区列表排序最后的景区取出补入第三等级,第一等级中的景区数为5,第二等级中的景区数为5,第三等级中的景区数为6;
文化场馆等级划分:通过23比上3得到余数2,将文化场馆列表排序最后的两个文化场馆取出补入第三等级,第一等级中的文化场馆数为7,第二等级中的文化场馆数为7,第三等级中的文化场馆数为9;
旅游企业等级划分:通过26比上3得到余数2,将旅游企业列表排序最后的两个旅游企业取出补入第三等级,第一等级中的旅游企业数为8,第二等级中的旅游企业数为8,第三等级中的旅游企业数为10;
通过Microsoft-Power-BI可视化工具将所有服务集合以及一类数据集、二类数据集以及三类数据集的排序结果可视化处理后,可视化处理后的服务集合信息向旅游企业进行展示,排序结果向决策者以及用户进行展示,包括以下步骤:
将服务集合和各类数据集的排序结果导入Power BI,在Power BI中进行必要的数据清理,包括处理缺失值、去除异常数据等,将数据连接和关联,确保不同数据集之间的一致性,在Power BI中创建数据模型,将不同数据集关联起来,使用Power BI的图表、表格和其他可视化元素创建报表,将服务集合和排序结果以直观的方式呈现,使用合适的图表,如条形图、雷达图等,展示一类数据集、二类数据集和三类数据集的排序结果,利用地图、表格或其他图表展示服务集合的信息,使用Power BI的交互式功能,添加过滤器、切片器等元素,使用户可以根据需要自定义视图,将创建的可视化元素整合到仪表板中,仪表板具有清晰的布局和易于理解的导航。
实施例3:由于上述实施例2中,是通过等分的方法对各个列表中的景区、文化场馆以及旅游企业进行等级划分,该种划分方式存在以下缺陷:
假设旅游企业列表中的所有旅游企业的服务质量均差,此时通过等分法划分一样会导致服务质量差的旅游企业去服务高重要度的景区和文化场馆,为了避免该问题,我们提出以下方案:
基于排序算法对一类数据集、二类数据集以及三类数据集中的数据点进行排序,具体为:
对一类数据集中所有的景区进行排序包括以下步骤:
获取景区的游客满意度、景区设施、服务质量等多个方面的指标,将定量的评估指标转化为模糊集,模糊化过程考虑到指标的模糊性,例如将“服务质量”这个指标模糊化为“良好”、“一般”、“差”等隶属度,基于预设的模糊规则描述不同模糊指标之间的关系,例如,如果游客满意度高且服务质量好,则景区评分高;
将模糊化后的游客满意度、景区设施、服务质量分别标记为μA(x)、μB(x)、μC(x),其中x是输入的值,则通过模糊化后的游客满意度、景区设施、服务质量输出综合评估隶属度,表达式为:
μJQ(x)=min(μA(x),μB(x),μC(x));μA(x)、μB(x)、μC(x)分别为模糊化后的游客满意度、景区设施、服务质量,μJQ(x)为综合评估隶属度,这表示游客满意度、景区设施、服务质量三个指标的模糊AND操作的输出隶属度为游客满意度、景区设施、服务质量隶属度的最大值,这是因为在模糊AND中,我们希望取三者的最小值,以确保输出的隶属度不超过输入中最弱的一方,综合评估隶属度越大,表明景区在多个指标上表现越好,越得认可;
获取景区不同时期的综合评估隶属度μJQ(x)后,通过平均值法将综合评估隶属度转化为数值,表达式为:式中,μJQavg表示景区的综合评估平均隶属度,i=1、2、3、、、、n,n为景区不同时期样本数量,μJQ(xi)表示景区第i个时期样本的综合评估隶属度,ωi表示第i个个时期样本的综合评估隶属度的权重,且ωi大于0;
获取区域中所有景区的综合评估平均隶属度μJQavg后,通过冒泡法依据综合评估平均隶属度μJQavg由大到小对所有景区进行排序,包括以下步骤:
将每个景区的信息及其对应的综合评估平均隶属度构建为一个数组,每个元素包含景区信息和其对应的综合评估平均隶属度,从数组的第一个元素开始,比较相邻的两个元素的综合评估平均隶属度,如果前一个元素的综合评估平均隶属度小于后一个元素,则交换这两个元素的位置,继续进行上述比较和交换,直到整个数组被遍历一次;
进行多次遍历,每次遍历都会将数组中最大的综合评估平均隶属度移到数组的最前,每次遍历都可以减少比较的次数,因为最大的元素已经在正确的位置上,当遍历完成后,数组中的景区按照综合评估平均隶属度从大到小排列,从排序后的数组中获取排序完成的景区列表。
对二类数据集中所有的文化场馆进行排序包括以下步骤:
获取文化场馆的人流量幅值、文化维度指数、经济维度指数以及社会维度指数;
将人流量幅值、文化维度指数、经济维度指数以及社会维度指数进行归一化处理后综合计算获取场馆系数cgx,表达式为:
式中,rf为人流量幅值,whd为文化维度指数,jwd为经济维度指数,shd为社会维度指数,α、β、γ分别为文化维度指数、经济维度指数以及社会维度指数的比例系数,且α、β、γ均大于0,比例系数α、β、γ的具体取值依据城市区域看重文化场馆哪方面发展的重要性来具体设定,在此不做限定,例如,城市区域看重文化场馆的文化方面,其次是社会方面,则α>γ>β>0;
人流量幅值的计算逻辑为:
计算文化场馆的历史每天的平均人流量以及人流量标准差;
平均人流量的计算表达式为:人流量标准差的计算表达式为:式中,j={1、2、3、...、m},m表示采集的历史天数,且m大于1并为正整数,trj表示第j天的人流量,ravg表示平均人流量,RQ为人流量标准差;
综合分析文化场馆的历史每天的平均人流量以及人流量标准差获取人流量幅值;
若平均人流量<人流量阈值,且人流量标准差≤标准差阈值,分析文化场馆的历史人流量少且稳定,人流量幅值rf=1.50;
若平均人流量<人流量阈值,且人流量标准差>标准差阈值,分析文化场馆的历史人流量少且不稳定(即存在部分天数的人流量较多),人流量幅值rf=1.40;
若平均人流量≥人流量阈值,且人流量标准差>标准差阈值,分析文化场馆的历史人流量多且不稳定(即存在部分天数的人流量较少),人流量幅值rf=1.20;
若平均人流量≥人流量阈值,且人流量标准差≤标准差阈值,分析文化场馆的历史人流量多且稳定,人流量幅值rf=1.00;
综上所述人流量幅值rf的值较大,表明文化场馆的历史人流量每天都处于较少的状态。
文化维度指数whd的计算表达式为:式中,WZ为文化活动值,CZ为藏品展览值,文化活动值=通过(文化活动数量+教育项目数量)/区域中所有文化场馆数量,藏品展览值=(藏品数量+展览数量)/区域中所有文化场馆数量,文化维度指数whd越大,表明文化场馆的文化底蕴越高。
经济维度指数jwd的计算表达式为:式中,GX为经济贡献值,HZ为企业合作值,经济贡献值=文化场馆经济贡献总和/区域中所有文化场馆数量,企业合作值=文化场馆与企业合作数量/区域中所有文化场馆数量,经济维度指数jwd越大,表明文化场馆为区域带来的经济效益越好。/>
社会维度指数shd的计算表达式为:式中,JY为社会就业值,SZ为社会责任值,社会就业值=文化场馆就业人数/区域中所有文化场馆数量,社会责任值=文化场馆的社会责任活动数量/区域中所有文化场馆数量,社会维度指数shd越大,表明文化场馆对区域的社会影响越大。
由场馆系数cgx的计算表达式可知,场馆系数cgx值越大,表明该文化场馆对城市区域的重要性越大,因此,获取所有文化场馆的场馆系数cgx值后,将所有文化场馆依据场馆系数cgx值由大到小进行排序获取文化场馆列表;
本申请通过将人流量幅值、文化维度指数、经济维度指数以及社会维度指数进行归一化处理后综合计算获取场馆系数cgx,并且将所有文化场馆依据场馆系数cgx值由大到小进行排序获取文化场馆列表,不仅有效提高对数据的处理效率,而且综合分析更为全面,准确性更高。
对三类数据集中所有的旅游企业进行排序包括以下步骤:
获取旅游企业的总消费人数赋值、投诉数量以及好评数量;
通过总消费人数赋值、投诉数量以及好评数量计算企业指数qyz,表达式为:qyz=ZXR*(0.3*HPR-0.7*TSR),式中,TSR为投诉数量,HPR为好评数量,ZXR为旅游企业的总消费人数赋值,企业指数qyz越大,表明企业的消费人数越多,且服务质量越好;
总消费人数赋值的获取逻辑为:若总消费人数大于等于人数阈值,则总消费人数赋值ZXR=5,若总消费人数<人数阈值,则总消费人数赋值ZXR=1;
获取企业指数qyz后,将所有的旅游企业依据企业指数qyz由大到小进行排序,生成旅游企业列表;
依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业,包括以下步骤:
获取景区列表后,依据预设的第一隶属度阈值以及第二隶属度阈值对景区列表中的所有景区进行等级划分,具体为:
获取景区列表中每个景区的综合评估平均隶属度μJQavg;
将所有综合评估平均隶属度μJQavg≥第二隶属度阈值的景区划入第一等级,将所有第一隶属度阈值≤综合评估平均隶属度μJQavg<第二隶属度阈值的景区划入第二等级,将所有综合评估平均隶属度μJQavg<第一隶属度阈值的景区划入第三等级;
获取文化场馆列表后,依据预设的第一重要度阈值以及第二重要度阈值对文化场馆列表中的所有文化场馆进行等级划分,具体为:
获取文化场馆列表中每个文化场馆的场馆系数cgx;
将所有场馆系数cgx≥第二重要度阈值的文化场馆划入第一等级,将所有第一重要度阈值≤场馆系数cgx<第二重要度阈值的文化场馆划入第二等级,将所有场馆系数cgx<第一重要度阈值的文化场馆划入第三等级;
获取旅游企业列表后,依据预设的第一服务阈值以及第二服务阈值对旅游企业列表中的所有旅游企业进行等级划分,具体为:
获取旅游企业列表中每个旅游企业的企业指数qyz;
将所有企业指数qyz≥第二服务阈值的旅游企业划入第一等级,将所有第一服务阈值≤企业指数qyz<第二服务阈值的旅游企业划入第二等级,将所有企业指数qyz<第一服务阈值的旅游企业划入第三等级;
NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合,即将第一等级的景区、文化场馆和旅游企业划入一个服务集合,将第二等级的景区、文化场馆和旅游企业划入一个服务集合,将第三等级的景区、文化场馆和旅游企业划入一个服务集合;
本实施例通过梯度阈值的对比方法对排序后的景区、文化场馆和旅游企业进行等级划分,划分的准确度更高。
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数由本领域的技术人员根据实际情况进行设置。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.基于多维数据分析的文旅综合管理平台,其特征在于:所述管理平台端口从需要被管理区域内的各个景区、文化场馆和旅游企业收集数据;
NoSQL数据库将收集的数据划分为一类数据集、二类数据集、三类数据集,使用Open-Refine工具对一类数据集、二类数据集以及三类数据集中的属性数据进行清洗;
一类数据集、二类数据集以及三类数据集整合到数据仓库中,并在数据仓库中建立多维数据模型;
建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询;
基于排序算法对一类数据集、二类数据集以及三类数据集中的数据点进行排序后,依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业;
NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合;
通过Microsoft-Power-BI可视化工具将所有服务集合以及一类数据集、二类数据集以及三类数据集的排序结果可视化处理;
可视化处理后的服务集合信息向旅游企业进行展示,排序结果向决策者以及用户进行展示。
2.根据权利要求1所述的基于多维数据分析的文旅综合管理平台,其特征在于:所述一类数据集中每个景区为独立的数据点,在一类数据集中每个数据点均包含景区属性数据,所述二类数据集中每个文化场馆为独立的数据点,在二类数据集中每个数据点均包含文化场馆属性数据,所述三类数据集中每个旅游企业为独立的数据点,在三类数据集中每个数据点均包含旅游企业属性数据。
3.根据权利要求2所述的基于多维数据分析的文旅综合管理平台,其特征在于:所述一类数据集、二类数据集、三类数据集的划分包括以下步骤:
一类数据集:将从各个景区收集到的数据整合到数据库中,将每个景区的数据导入到对应的数据库表中,数据库表包含景区属性,每一行代表一个景区的数据点,列包括景区的各种属性数据;
二类数据集:将从各个文化场馆收集到的数据整合到数据库中,将每个文化场馆的数据导入到对应的数据库表中,数据库表包含文化场馆属性,每一行代表一个文化场馆的数据点,列包括文化场馆的各种属性数据;
三类数据集:将从各个旅游企业收集到的数据整合到数据库中,将每个旅游企业的数据导入到对应的数据库表中,数据库表包含旅游企业属性,每一行代表一个旅游企业的数据点,列包括旅游企业的各种属性数据。
4.根据权利要求3所述的基于多维数据分析的文旅综合管理平台,其特征在于:对一类数据集中所有的景区进行排序包括以下步骤:
获取景区的游客满意度、景区设施、服务质量指标,将定量的评估指标转化为模糊集;
将模糊化后的游客满意度、景区设施、服务质量分别标记为μA(x)、μB(x)、μC(x),其中,x是输入的值,则通过模糊化后的游客满意度、景区设施、服务质量输出综合评估隶属度,表达式为:
μJQ(x)=min(μA(x),μB(x),μC(x));μA(x)、μB(x)、μC(x)分别为模糊化后的游客满意度、景区设施、服务质量,μJQ(x)为综合评估隶属度;
获取景区不同时期的综合评估隶属度μJQ(x)后,通过平均值法将综合评估隶属度转化为数值,表达式为:式中,μJQavg表示景区的综合评估平均隶属度,i=1、2、3、、、、n,n为景区不同时期样本数量,μJQ(xi)表示景区第i个时期样本的综合评估隶属度,ωi表示第i个时期样本的综合评估隶属度的权重,且ωi大于0;
获取区域中所有景区的综合评估平均隶属度μJQavg后,通过冒泡法依据综合评估平均隶属度μJQavg由大到小对所有景区进行排序获取景区列表。
5.根据权利要求4所述的基于多维数据分析的文旅综合管理平台,其特征在于:对二类数据集中所有的文化场馆进行排序包括以下步骤:
获取文化场馆的人流量幅值、文化维度指数、经济维度指数以及社会维度指数;
将人流量幅值、文化维度指数、经济维度指数以及社会维度指数进行归一化处理后综合计算获取场馆系数cgx,表达式为:
式中,rf为人流量幅值,whd为文化维度指数,jwd为经济维度指数,shd为社会维度指数,α、β、γ分别为文化维度指数、经济维度指数以及社会维度指数的比例系数,且α、β、γ均大于0;
获取所有文化场馆的场馆系数cgx值后,将所有文化场馆依据场馆系数cgx值由大到小进行排序获取文化场馆列表。
6.根据权利要求5所述的基于多维数据分析的文旅综合管理平台,其特征在于:依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业包括以下步骤:
获取景区列表、文化场馆列表以及旅游企业列表,在景区列表、文化场馆列表以及旅游企业列表中,景区、文化场馆或旅游企业的排名越靠前,表明该景区、文化场馆或旅游企业在区域中的重要度越大;
本实施例通过等分法对景区列表、文化场馆列表、旅游企业列表中的景区、文化场馆、旅游企业进行分级,预设一个等分数k,k为大于1的正整数;
获取景区列表中的景区数量,通过k等分数将景区列表中的景区划分为k组,每个组内的景区对应一个级别;
获取文化场馆列表中的文化场馆数量,通过k等分数将文化场馆列表中的文化场馆划分为k组,每个组内的文化场馆对应一个级别;
获取旅游企业列表中的旅游企业数量,通过k等分数将旅游企业列表中的旅游企业划分为k组,每个组内的旅游企业对应一个级别;
NoSQL数据库将处于同一级别的景区、文化场馆和旅游企业划入一个服务集合。
7.根据权利要求5所述的基于多维数据分析的文旅综合管理平台,其特征在于:依据排序结果通过梯度分级方法分级处理所有景区、文化场馆和旅游企业,包括以下步骤:
获取景区列表后,依据预设的第一隶属度阈值以及第二隶属度阈值对景区列表中的所有景区进行等级划分:
获取景区列表中每个景区的综合评估平均隶属度μJQavg;
将所有综合评估平均隶属度μJQavg≥第二隶属度阈值的景区划入第一等级,将所有第一隶属度阈值≤综合评估平均隶属度μJQavg<第二隶属度阈值的景区划入第二等级,将所有综合评估平均隶属度μJQavg<第一隶属度阈值的景区划入第三等级;
获取文化场馆列表后,依据预设的第一重要度阈值以及第二重要度阈值对文化场馆列表中的所有文化场馆进行等级划分:
获取文化场馆列表中每个文化场馆的场馆系数cgx;
将所有场馆系数cgx≥第二重要度阈值的文化场馆划入第一等级,将所有第一重要度阈值≤场馆系数cgx<第二重要度阈值的文化场馆划入第二等级,将所有场馆系数cgx<第一重要度阈值的文化场馆划入第三等级;
获取旅游企业列表后,依据预设的第一服务阈值以及第二服务阈值对旅游企业列表中的所有旅游企业进行等级划分:
获取旅游企业列表中每个旅游企业的企业指数qyz;
将所有企业指数qyz≥第二服务阈值的旅游企业划入第一等级,将所有第一服务阈值≤企业指数qyz<第二服务阈值的旅游企业划入第二等级,将所有企业指数qyz<第一服务阈值的旅游企业划入第三等级。
8.根据权利要求4所述的基于多维数据分析的文旅综合管理平台,其特征在于:获取区域中所有景区的综合评估平均隶属度μJQavg后,通过冒泡法依据综合评估平均隶属度μJQavg由大到小对所有景区进行排序包括以下步骤:
将每个景区的信息及其对应的综合评估平均隶属度构建为一个数组;
从数组的第一个元素开始,比较相邻的两个元素的综合评估平均隶属度,若前一个元素的综合评估平均隶属度小于后一个元素的综合评估平均隶属度,则交换这两个元素的位置,继续进行比较和交换,直到整个数组被遍历一次;
进行多次遍历,每次遍历都会将数组中最大的综合评估平均隶属度移到数组的最前;
遍历完成后,数组中的景区按照综合评估平均隶属度从大到小排列,从排序后的数组中获取排序完成的景区列表。
9.根据权利要求8所述的基于多维数据分析的文旅综合管理平台,其特征在于:一类数据集、二类数据集以及三类数据集整合到数据仓库中,并在数据仓库中建立多维数据模型包括以下步骤:
定义维度表和事实表后数据库结构和模式,并创建数据仓库;
将一类数据集、二类数据集和三类数据集导入到相应的数据仓库中,为每类数据集中的独立属性创建相应的维度表;
通过在事实表中添加与维度表关联的外键定义维度表与事实表之间的关系;
使用数据仓库工具基于维度表与事实表建立多维数据模型,并为每个维度表定义层次结构。
10.根据权利要求9所述的基于多维数据分析的文旅综合管理平台,其特征在于:建立完成的多维数据模型嵌入OLAP工具,用户通过OLAP工具的交互式界面对管理区域的文旅数据进行查询包括以下步骤:
OLAP工具中建立与数据仓库的连接,提供连接信息,连接信息包括数据库类型、地址、用户名和密码;
数据仓库中建立的多维数据模型导入到OLAP工具中,在OLAP工具中配置多维数据模型;
基于多维数据模型的逻辑结构在OLAP工具中定义多维立方体,并为每个多维立方体定义维度和度量,维度用于分析的属性,度量为分析的数据值;
通过OLAP工具创建报表和仪表板,报表包括各种图表、表格,用户通过配置后的OLAP工具交互式界面进行查询。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311737536.7A CN117611397A (zh) | 2023-12-18 | 2023-12-18 | 基于多维数据分析的文旅综合管理平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311737536.7A CN117611397A (zh) | 2023-12-18 | 2023-12-18 | 基于多维数据分析的文旅综合管理平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117611397A true CN117611397A (zh) | 2024-02-27 |
Family
ID=89951599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311737536.7A Pending CN117611397A (zh) | 2023-12-18 | 2023-12-18 | 基于多维数据分析的文旅综合管理平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117611397A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117852324A (zh) * | 2024-03-08 | 2024-04-09 | 云南云金地科技有限公司 | 一种基于数据孪生的场景构建方法 |
-
2023
- 2023-12-18 CN CN202311737536.7A patent/CN117611397A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117852324A (zh) * | 2024-03-08 | 2024-04-09 | 云南云金地科技有限公司 | 一种基于数据孪生的场景构建方法 |
CN117852324B (zh) * | 2024-03-08 | 2024-05-10 | 云南云金地科技有限公司 | 一种基于数据孪生的场景构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bansak et al. | Using conjoint experiments to analyze election outcomes: The essential role of the average marginal component effect | |
CN107239892B (zh) | 基于大数据的区域人才供需平衡量化分析方法 | |
Ballard et al. | Data modeling techniques for data warehousing | |
CN107203872B (zh) | 基于大数据的区域人才需求量化分析方法 | |
CN109784721B (zh) | 一种就业数据分析与数据挖掘分析的平台系统 | |
US7571182B1 (en) | Emulation of a balanced hierarchy from a nonbalanced hierarchy | |
CN111222661A (zh) | 一种城市规划实施效果分析评估方法 | |
CN107203849B (zh) | 基于大数据的区域人才供给量化分析方法 | |
CN112231333A (zh) | 一种生态环境数据共享交换方法和系统 | |
CN117611397A (zh) | 基于多维数据分析的文旅综合管理平台 | |
CN110737805A (zh) | 图模型数据的处理方法、装置和终端设备 | |
Cai-Ming et al. | Preprocessing method of structured big data in human resource archives database | |
Jeljeli et al. | Potential applications of geographic information systems to construction industry | |
KR102260591B1 (ko) | 데이터 기반의 의사결정 지원시스템 및 동작 방법 | |
CN112231380A (zh) | 采集数据的综合处理方法、系统、存储介质及电子设备 | |
CN103559585A (zh) | 图书馆综合绩效评价的实现方法及系统 | |
CN116151632A (zh) | 一种数据架构方法 | |
Ariawan et al. | Design of Library Data Warehouse Using OLTP Result of Services Analysis | |
Aljumaili et al. | Data quality assessment using multi-attribute maintenance perspective | |
Fauzi et al. | Spatial data warehouse: An analysis in tourism sector of west java province | |
Planting | Developing a data repository for the Climate Adaptive City Enschede | |
Asrani et al. | Designing a Framework to Standardize Data Warehouse Development Process for Effective Data Warehousing Practices | |
CN117370448B (zh) | 品牌数字资产洞察分析方法 | |
RU2555232C2 (ru) | Способ формирования и эксплуатации базы данных | |
RU2744625C1 (ru) | Способ формирования отчетов по базовым показателям системы отображения показателей предприятия |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |