CN115984044A - 一种旅游发展高潜力村落的挖掘方法 - Google Patents
一种旅游发展高潜力村落的挖掘方法 Download PDFInfo
- Publication number
- CN115984044A CN115984044A CN202310161580.1A CN202310161580A CN115984044A CN 115984044 A CN115984044 A CN 115984044A CN 202310161580 A CN202310161580 A CN 202310161580A CN 115984044 A CN115984044 A CN 115984044A
- Authority
- CN
- China
- Prior art keywords
- villages
- tourism
- data
- village
- potential
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种旅游发展高潜力村落的挖掘方法,属于人工智能领域。该方法为:先初步处理;训练随机森林模型并调优,并利用训练好的模型得到所有栅格预测为乡村旅游重点村的概率;对所有非乡村旅游重点村的行政村进行预测概率的分区统计,依据归一化后的分区统计结果对所有行政村进行排序,视为旅游发展潜力排名;计算研究区域内的乡村旅游重点村服务范围,并排除服务范围和现有重点村有冲突的村落。本发明构建了可量化的乡村旅游发展适宜性评估模型,为识别旅游发展高潜力村落提供指导。
Description
技术领域
本发明属于人工智能领域,涉及一种旅游发展高潜力村落的挖掘方法。
背景技术
随着县域、村级高分辨率数据以及网络平台信息被越来越多的收集,使用GIS和人工智能技术能够准确识别乡村旅游重点村的影响因素,急需基于这些因素对旅游发展高潜力村落进行挖掘。
发明内容
有鉴于此,本发明的目的在于提供一种旅游发展高潜力村落的挖掘方法。
为达到上述目的,本发明提供如下技术方案:
一种旅游发展高潜力村落的挖掘方法,该方法包括以下步骤:
S1:采集区域内的村级行政区划信息、官方发布的已入选全国乡村旅游重点村名单、影响旅游发展的基础驱动因子数据以及根据全国乡村旅游重点村选拔标准选取的特色驱动因子数据,并进行初步处理;
S2:训练随机森林模型并调优,并利用训练好的模型得到所有栅格预测为乡村旅游重点村的概率;
S3:对所有非乡村旅游重点村的行政村进行预测概率的分区统计,依据归一化后的分区统计结果对所有行政村进行排序,视为旅游发展潜力排名;
S4:计算研究区域内的乡村旅游重点村服务范围,并排除服务范围和现有重点村有冲突的村落。
可选的,所述S1中,影响旅游发展的基础驱动因子数据包括:
马里兰大学地球科学数据集GLCF的DEM数据、中国科学院资源环境科学与数据中心的土地利用类型遥感栅格数据、中国气象要素平均状况空间插值数据集DOI:10.12078/2017121301、中国人口空间分布公里网格数据集DOI:10.12078/2017121101及中国GDP空间分布公里网格数据集DOI:10.12078/2017121102、OSM的水系、公路遥感矢量数据、北京大学新农村发展研究院发布的县域数字乡村指数结构化文本数据、各地方统计局的铁路客运量结构化文本数据和百度搜索指数平台的网络搜索指数数据;
所述根据全国乡村旅游重点村选拔标准选取的特色驱动因子数据包括:
中国县域统计年鉴和各地方统计局的第三产业从业人数、旅游从业人数、国内及外汇旅游收入结构化文本数据、中国科学院资源环境科学与数据中心的中国陆地生态系统服务价值空间分布数据集DOI:10.12078/2018060503、国内在线旅游网站的近半年旅游产品评论数据、高德开放平台的民宿、超市和餐饮分布遥感矢量数据、国家文物局官方网站和各省文化和旅游官方网站的A级旅游景区、全国重点文物保护单位结构化文本数据;
所述初步处理包括:
S11:对DEM数据进行ArcGIS中的坡度分析,得出坡度数据;
S12:对于驱动因子数据中数据格式为结构化文本的数据,在ArcGIS中精确分配到每个行政村的栅格单元中,生成遥感栅格图层;
S13:对于驱动因子数据中数据格式为遥感矢量的数据,使用ArcGIS空间分析中的欧氏距离功能得到每一个栅格距离对应矢量元素的欧氏距离;
S14:对于驱动因子数据中的网络搜索指数,其获取所使用到的搜索关键词为目的地村庄+“旅游”,对于缺失的数据,使用上一级行政区名称+“旅游”的关键词,最终在ArcGIS中精确分配到每个行政村的栅格单元中,生成遥感栅格图层;
S15:对于驱动因子数据中的在线旅游网站旅游产品评论数据,使用LDA模型进行情感分析,最后使用消费者信心指数编制法的计算结果作为目的地旅游产品评价指数,最后以S12的操作,生成遥感栅格图层;
消费者信心指数编制法完整的表达式为:
式中,X表示目的地旅游产品评价指数,X正面表示旅游产品正面评价的数量,X负面表示旅游产品负面评价的数量。
可选的,所述S2中,随机森林模型将每一个栅格作为一个样本,标签通过S1中采集的村级行政区划信息、政府发布的已入选全国乡村旅游重点村名单匹配生成,重点村栅格为1,非重点村为0。
可选的,所述S3中,分区统计使用ArcGIS分区统计工具计算得到,将行政村内部所有栅格的概率进行求和,归一化后,为S3中的旅游发展潜力;
归一化公式如下所示:
其中,Amax是所有村庄的分区统计结果最大值,Amin是最小值,a'是归一化结果;
可选的,所述S4中,乡村旅游重点村服务范围是已有重点村的平均间隔距离;
所述排除服务范围和现有重点村有冲突的村落使用的是ArcGIS中的缓冲区分析工具。
本发明的有益效果在于:本发明构建了可量化的乡村旅游发展适宜性评估模型,识别旅游发展高潜力村落,有利于推动乡村旅游质量升级。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明的挖掘示意图;
图2为本发明原理图;
图3为本发明中F1分数来衡量精度调优过程图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
如图1所示,本实施例以重庆市为研究区域,利用四批共41个全国乡村旅游重点村为数据支撑,高程、坡度、距道路欧氏距离、民宿点密度、餐饮服务点密度、超市点密度等11个数据作为驱动因子,对旅游发展高潜力村落进行旅游适宜性评价。
所述基础驱动因子包括来源于马里兰大学地球科学数据集(GLCF)的DEM数据,来源于中国科学院资源环境科学与数据中心的土地利用类型遥感栅格数据、中国气象要素平均状况空间插值数据集(DOI:10.12078/2017121301)、中国人口空间分布公里网格数据集(DOI:10.12078/2017121101)及中国GDP空间分布公里网格数据集(DOI:10.12078/2017121102),来源于OSM(Open Street Map)的水系、公路遥感矢量数据,来源于北京大学新农村发展研究院发布的县域数字乡村指数结构化文本数据,来源于各地方统计局的铁路客运量结构化文本数据,来源于百度搜索指数平台的网络搜索指数数据;
所述特色驱动因子包括来源于中国县域统计年鉴和各地方统计局的第三产业从业人数、旅游从业人数、国内及外汇旅游收入结构化文本数据,来源于中国科学院资源环境科学与数据中心的中国陆地生态系统服务价值空间分布数据集(DOI:10.12078/2018060503),来源于国内在线旅游网站的近半年旅游产品评论数据,来源于高德开放平台的民宿、超市和餐饮分布遥感矢量数据,来源于国家文物局官方网站和各省文化和旅游官方网站的A级旅游景区、全国重点文物保护单位结构化文本数据
由于重庆市范围的研究数据量较大,本实施例决定通过ArcGIS重采样的方式将土地分辨率统一为1000米土地分辨率,这样基本保证每个行政村包含一个以上的栅格。
如图2所示,本实施例首先对非遥感栅格数据的各驱动因子进行预处理,对DEM数据进行ArcGIS中的坡度分析,从而得出坡度数据,对于驱动因子数据中数据格式为结构化文本的数据,在ArcGIS中精确分配到每个行政村的栅格单元中,生成遥感栅格图层。对于驱动因子数据中数据格式为遥感矢量的数据,使用ArcGIS空间分析中的欧氏距离功能得到每一个栅格距离对应矢量元素的欧氏距离;对于驱动因子数据中的网络搜索指数,其获取所使用到的搜索关键词为目的地村庄+“旅游”,对于缺失的数据,使用上一级行政区名称+“旅游”的关键词,最终在ArcGIS中精确分配到每个行政村的栅格单元中,生成遥感栅格图层。对于驱动因子数据中的在线旅游网站旅游产品评论数据,其LDA模型和消费者信心指数编制法使用Gensim和Numpy等库函数实现。之后保证所有驱动因子图层大小一致,使用ArcGIS中的导出为ASCII工具,将图层作为像素矩阵导出为文本文件。接着在Python环境下,将数据融合成数据矩阵,具体操作是将每个驱动因子的栅格矩阵扁平化为一维向量,再将它们横向合并成一个输入矩阵。该矩阵满足行与行之间是不同的栅格,列与列之间是不同的驱动因子,最后一列使用是否为重点村范围内的栅格(0和1,0代表非重点村,1代表重点村),作为数据标签。最后将该矩阵输入到随机森林模型进行拟合与调优,最终生成乡村旅游发展高潜力地图。
本实施例使用的随机森林模型主要运用基于Python的Sklearn机器学习库进行构建,模型以提高精度为目的,需要选择合适的参数。使用F1分数来衡量精度,调优过程如图3所示。最终调整模型子树的数量为100,子树的最大深度为20。
本实施例使用分区统计,将行政村内部所有栅格的发展潜力进行求和,同时分析了重庆市已有重点村之间的平均间隔距离为28.19km,结合缓冲区分析工具,最终生成旅游发展高潜力村落排名。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种旅游发展高潜力村落的挖掘方法,其特征在于:该方法包括以下步骤:
S1:采集区域内的村级行政区划信息、官方发布的已入选全国乡村旅游重点村名单、影响旅游发展的基础驱动因子数据以及根据全国乡村旅游重点村选拔标准选取的特色驱动因子数据,并进行初步处理;
S2:训练随机森林模型并调优,并利用训练好的模型得到所有栅格预测为乡村旅游重点村的概率;
S3:对所有非乡村旅游重点村的行政村进行预测概率的分区统计,依据归一化后的分区统计结果对所有行政村进行排序,视为旅游发展潜力排名;
S4:计算研究区域内的乡村旅游重点村服务范围,并排除服务范围和现有重点村有冲突的村落。
2.根据权利要求1所述的一种旅游发展高潜力村落的挖掘方法,其特征在于:所述S1中,影响旅游发展的基础驱动因子数据包括:
马里兰大学地球科学数据集GLCF的DEM数据、中国科学院资源环境科学与数据中心的土地利用类型遥感栅格数据、中国气象要素平均状况空间插值数据集DOI:
10.12078/2017121301、中国人口空间分布公里网格数据集DOI:10.12078/2017121101及中国GDP空间分布公里网格数据集DOI:10.12078/2017121102、OSM的水系、公路遥感矢量数据、北京大学新农村发展研究院发布的县域数字乡村指数结构化文本数据、各地方统计局的铁路客运量结构化文本数据和百度搜索指数平台的网络搜索指数数据;
所述根据全国乡村旅游重点村选拔标准选取的特色驱动因子数据包括:
中国县域统计年鉴和各地方统计局的第三产业从业人数、旅游从业人数、国内及外汇旅游收入结构化文本数据、中国科学院资源环境科学与数据中心的中国陆地生态系统服务价值空间分布数据集DOI:10.12078/2018060503、国内在线旅游网站的近半年旅游产品评论数据、高德开放平台的民宿、超市和餐饮分布遥感矢量数据、国家文物局官方网站和各省文化和旅游官方网站的A级旅游景区、全国重点文物保护单位结构化文本数据;
所述初步处理包括:
S11:对DEM数据进行ArcGIS中的坡度分析,得出坡度数据;
S12:对于驱动因子数据中数据格式为结构化文本的数据,在ArcGIS中精确分配到每个行政村的栅格单元中,生成遥感栅格图层;
S13:对于驱动因子数据中数据格式为遥感矢量的数据,使用ArcGIS空间分析中的欧氏距离功能得到每一个栅格距离对应矢量元素的欧氏距离;
S14:对于驱动因子数据中的网络搜索指数,其获取所使用到的搜索关键词为目的地村庄+“旅游”,对于缺失的数据,使用上一级行政区名称+“旅游”的关键词,最终在ArcGIS中精确分配到每个行政村的栅格单元中,生成遥感栅格图层;
S15:对于驱动因子数据中的在线旅游网站旅游产品评论数据,使用LDA模型进行情感分析,最后使用消费者信心指数编制法的计算结果作为目的地旅游产品评价指数,最后以S12的操作,生成遥感栅格图层;
消费者信心指数编制法完整的表达式为:
式中,X表示目的地旅游产品评价指数,X正面表示旅游产品正面评价的数量,X负面表示旅游产品负面评价的数量。
3.根据权利要求2所述的一种旅游发展高潜力村落的挖掘方法,其特征在于:所述S2中,随机森林模型将每一个栅格作为一个样本,标签通过S1中采集的村级行政区划信息、政府发布的已入选全国乡村旅游重点村名单匹配生成,重点村栅格为1,非重点村为0。
5.根据权利要求4所述的一种旅游发展高潜力村落的挖掘方法,其特征在于:所述S4中,乡村旅游重点村服务范围是已有重点村的平均间隔距离;
所述排除服务范围和现有重点村有冲突的村落使用的是ArcGIS中的缓冲区分析工具。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310161580.1A CN115984044A (zh) | 2023-02-24 | 2023-02-24 | 一种旅游发展高潜力村落的挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310161580.1A CN115984044A (zh) | 2023-02-24 | 2023-02-24 | 一种旅游发展高潜力村落的挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115984044A true CN115984044A (zh) | 2023-04-18 |
Family
ID=85970484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310161580.1A Pending CN115984044A (zh) | 2023-02-24 | 2023-02-24 | 一种旅游发展高潜力村落的挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115984044A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116882843A (zh) * | 2023-08-11 | 2023-10-13 | 中国科学院地理科学与资源研究所 | 一种县域道路村村通评价方法 |
CN117454319A (zh) * | 2023-09-13 | 2024-01-26 | 中国科学院地理科学与资源研究所 | 一种基于gps大数据的旅游流数据分析方法 |
-
2023
- 2023-02-24 CN CN202310161580.1A patent/CN115984044A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116882843A (zh) * | 2023-08-11 | 2023-10-13 | 中国科学院地理科学与资源研究所 | 一种县域道路村村通评价方法 |
CN116882843B (zh) * | 2023-08-11 | 2024-03-22 | 中国科学院地理科学与资源研究所 | 一种县域道路村村通评价方法 |
CN117454319A (zh) * | 2023-09-13 | 2024-01-26 | 中国科学院地理科学与资源研究所 | 一种基于gps大数据的旅游流数据分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Demuzere et al. | LCZ Generator: a web application to create Local Climate Zone maps | |
Biljecki et al. | Generating 3D city models without elevation data | |
Niu et al. | Measuring urban poverty using multi-source data and a random forest algorithm: A case study in Guangzhou | |
Lim et al. | Understanding the linkages of smart-city technologies and applications: Key lessons from a text mining approach and a call for future research | |
Abrantes et al. | Modelling urban form: A multidimensional typology of urban occupation for spatial analysis | |
CN115984044A (zh) | 一种旅游发展高潜力村落的挖掘方法 | |
CN107133900B (zh) | 城市土地混合利用特征格网计算方法及装置 | |
Zhang et al. | Heuristic sample learning for complex urban scenes: Application to urban functional-zone mapping with VHR images and POI data | |
Wieczorek et al. | Geographic information systems | |
Chen et al. | A new method for building-level population estimation by integrating LiDAR, nighttime light, and POI data | |
Lloyd et al. | Using GIS and machine learning to classify residential status of urban buildings in low and middle income settings | |
Su et al. | Urban scene understanding based on semantic and socioeconomic features: From high-resolution remote sensing imagery to multi-source geographic datasets | |
Zhang et al. | Using street view images to identify road noise barriers with ensemble classification model and geospatial analysis | |
Deng et al. | Identify urban building functions with multisource data: A case study in Guangzhou, China | |
Alahmadi et al. | A comparison of small-area population estimation techniques using built-area and height data, Riyadh, Saudi Arabia | |
CN114398951A (zh) | 一种基于随机森林和众源地理信息的土地利用变化驱动因子挖掘方法 | |
CN111984701A (zh) | 乡村聚落演化的预测方法、装置、设备及存储介质 | |
Li et al. | Identification of undocumented buildings in cadastral data using remote sensing: Construction period, morphology, and landscape | |
Ye et al. | Land use classification from social media data and satellite imagery | |
de Smet et al. | Characterising the morphology of suburban settlements: A method based on a semi-automatic classification of building clusters | |
Lin et al. | An MIU-based deep embedded clustering model for urban functional zoning from remote sensing images and VGI data | |
CN109636194B (zh) | 一种输变电项目重大变动多源协同检测方法与系统 | |
Louail et al. | A dominance tree approach to systems of cities | |
Li | Mapping urban land use by combining multi-source social sensing data and remote sensing images | |
McCarty et al. | A standardized European hexagon gridded dataset based on OpenStreetMap POIs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |