CN113377913A - 一种基于游客行为的旅游城市网络关联度评估方法 - Google Patents
一种基于游客行为的旅游城市网络关联度评估方法 Download PDFInfo
- Publication number
- CN113377913A CN113377913A CN202110646826.5A CN202110646826A CN113377913A CN 113377913 A CN113377913 A CN 113377913A CN 202110646826 A CN202110646826 A CN 202110646826A CN 113377913 A CN113377913 A CN 113377913A
- Authority
- CN
- China
- Prior art keywords
- tourist
- network association
- travel
- tourism
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 20
- 238000011156 evaluation Methods 0.000 title claims abstract description 18
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 11
- 230000002159 abnormal effect Effects 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 238000013480 data collection Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 2
- 239000002994 raw material Substances 0.000 claims description 2
- 238000007726 management method Methods 0.000 abstract description 4
- 238000005259 measurement Methods 0.000 abstract description 3
- 230000008859 change Effects 0.000 abstract description 2
- 238000013210 evaluation model Methods 0.000 abstract description 2
- 238000012097 association analysis method Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于游客行为的旅游城市网络关联度评估方法,该方法主要是通过收集游客数据,并经过异常值处理,去报旅游数据收集的完备性,同时基于全国旅游电子合同数据,建立省际间的旅游联系度,利用网络关联分析方法,形成多个年份的31×31客流关系网,测算省际间双向网络关联指数。通过不同年份关联指数的对比,获取旅游市场聚集效应变化趋势,从而对省际间旅游客流动关系进行评估,能够为旅行社下一年的规划做评估,能够有效的解决其管理混乱的问题。本发明构建了基于游客行为的旅游城市网络关联度评估模型,通过网络关联指数测算,同时结合“互联网+旅游大数据”时代机遇和挑战,在很大程度上改变了传统旅游业的经营模式,未来前景广阔。
Description
技术领域
本发明属于旅游信息服务技术领域,具体涉及一种基于游客行为的旅游城市网络关联度评估方法。
背景技术
随着生活水平的提高,旅游逐渐成为人们娱乐消遣的一种方式,近年来我国旅游人数不断攀升,甚至越来越多的人开始选择境外游,在一定程度上带动了我国的经济发展和消费。而且新一代的年轻消费群体正在逐渐崛起,他们在旅游方面具备极大的消费潜力,因此需要对旅游的喜好或区域进行预判;
专利201910162410.9公开了基于梯度提升决策树的用户旅游出行意向及类型预测方法,该专利包括以下步骤:步骤1、采集移动运营商提供的用户基本信息、业务使用、亲情网亲密度和出行行为数据表,并进行脱敏;步骤2、对数据表进行数据预处理;步骤3、根据样本数据中出行类别的数量,构造向量表示对应的类别;步骤4、对样本数据中每个可能的类别都训练一个分类回归树;步骤5、计算得到每个特征在各个特征值上的损失函数值,取损失函数值最小的情况构造预测函数;步骤6、生成待预测的用户在各个特征上的详细数据,使用预测函数进行预测。该发明使用梯度提升决策树算法预测用户的旅游出行意向以及目的地的类型,具有较高的准确性。该发明在预测游客出行意向时并没有将各省之间的联系进行进一步的预测,导致旅行社无法做出一个长远的规划。
由于中国面积比较大,有31个省及自治区,每个省及自治区都有自己的旅游景点,因此各个省及自治区之间的游客会相互流动,对于旅行社来说,游客之间的流动,对旅行社的客运交通以及酒店住宿都有相对重要的影响,因此如何去评判下一年度的与酒店和交通的安排需要一种关联度来评估;而现在还没有相关的技术能够处理,因此造成了旅行社的规划管理混乱。
发明内容
针对上述背景技术所提出的问题,本发明的目的是:旨在提供一种基于游客行为的旅游城市网络关联度评估方法。
一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:包括,
S1:收集游客电子合同数据;
S2:处理游客非结构化文本旅游数据;
S3:异常值处理及游客完备性旅游数据归集;
S4:构建省际间旅游联系度模型;
S5:计算省际间网络关联指数;
S6:获取省际间旅游网络关联指数表。
作为本发明的一种优选方案,所述步骤S1中,游客电子合同数据来源于全国旅游电子合同数据库。
作为本发明的一种优选方案,所述步骤S2中,从游客非结构化文本旅游数据进行基于自然语言处理NLP算法的语义文本识别,提取出游客行程出发地、目的地、游玩时间信息。
作为本发明的一种优选方案,所述步骤S3中,将S2中提取出的游客行程出发地、目的地、游玩时间信息与S1中电子合同备案数据库数据进行比较,剔除掉异常值旅游数据,确保游客旅游数据的完备性。
作为本发明的一种优选方案,所述步骤S4中,省际间的旅游联系度模型如下:
公式(1)中,NCIj→i表示出发地j到目的地i的单向旅游联系度;
Tj→i表示出发地j到目的地i的游客数量;
K代表观察对象个数;且
i≠j,i、j∈[1,m],i、j∈[1,n]。
作为本发明的一种优选方案,所述步骤S5中,由于省际间旅游客流存在双向空间流动关系,在最后的省际间网络关联指数计算中,将“省份j→省份i”和“省份i→省份j”的各自单向旅游联系度相加得到两个省份双向网络关联指数,即为
NCIij=NCIj→i+NCIi→j (2)
作为本发明的一种优选方案,所述省际间网络关联指数的大小反映的是旅游省份间的密切程度,省际间网络关联指数越大,两座旅游省份间的旅游密切度越高,旅游要素互动越频繁;相反,省际间网络关联指数越小,则两座旅游省份间的旅游密切度越低,旅游要素互动越不活跃。
作为本发明的一种优选方案,所述步骤S6中,通过计算本省市与其他31个省市的省际间网络关联指数,构建本省与外界旅游网络关联指数情况表,并通过计算不同年份的省际间网络关联指数,最终构成31×31的省际间旅游网络关联指数表。
本发明的有益效果:
1、通过本发明的评估方法,能够为旅行社下一年的规划做评估,能够有效的解决其管理混乱的问题。
2、本发明构建了基于游客行为的旅游城市网络关联度评估模型,通过网络关联指数测算,在很大程度上改变了传统旅游业的经营模式。
附图说明
本发明可以通过附图给出的非限定性实施例进一步说明;
图1为本发明一种基于游客行为的旅游城市网络关联度评估方法的流程示意图;
图2为本发明一种基于游客行为的旅游城市网络关联度评估方法的城市间游客轨迹联系度网络图。
具体实施方式
为了使本领域的技术人员可以更好地理解本发明,下面结合附图和实施例对本发明技术方案进一步说明。
一种基于游客行为的旅游城市网络关联度评估方法,包括,
S1:收集游客电子合同数据;
S2:处理游客非结构化文本旅游数据;
S3:异常值处理及游客完备性旅游数据归集;
S4:构建省际间旅游联系度模型;
S5:计算省际间网络关联指数;
S6:获取省际间旅游网络关联指数表。
其中,所述步骤S1中游客电子合同数据来源于全国旅游电子合同数据库。
其中,所述步骤S2中从游客非结构化文本旅游数据进行基于自然语言处理NLP算法的语义文本识别,提取出游客行程出发地、目的地、游玩时间信息。
其中,所述步骤S3中,将S2中提取出的游客行程出发地、目的地、游玩时间信息与S1中电子合同备案数据库数据进行比较,剔除掉异常值旅游数据,确保游客旅游数据的完备性。
通过网络关联指数测算,得到省际间双向网络关联指数。
具体实施例,
S1:收集2019年和2020年的游客数据,游客数据是基于全国旅游电子合同中的游客合同数据,游客合同是游客出行前与旅行社签订的合同;
S2:从游客非结构化文本旅游数据进行基于自然语言处理NLP算法的语义文本识别,提取出游客行程出发地、目的地、游玩时间信息。
S3:将S2中提取出的游客行程出发地、目的地、游玩时间信息与S1中电子合同备案数据库数据进行比较,剔除掉异常值旅游数据,确保游客旅游数据的完备性。
S4:通过所述S2得到的数据,建立省际间的旅游联系度模型
公式(1)中,NCIj→i表示出发地j到目的地i的单向旅游联系度;
Tj→i表示出发地j到目的地i的游客数量;
K代表观察对象个数;且
i≠j,i、j∈[1,m],i、j∈[1,n]。
S5:由于省际间旅游客流存在双向空间流动关系,在最后的计算中,将“省份j→省份i”和“省份i→省份j”的各自单向旅游联系度相加得到两个省份双向网络关联指数,即为:
NCIij=NCIj→i+NCIi→j (2)
如北京到天津的单向旅游联系度为NCI北京→天津;
其中:
北京至天津的双向网络关联指数为;
NCI北京天津=NCI北京→天津+NCI天津→北京;
北京至全国其他省及自治区的双向网络关联指数;
NCI北京=NCI北京天津+NCI北京重庆+…+NCI北京新疆;同理可以计算其它省及自治区的数据;
通过本发明的方法对2020年度关联指数和2019年关联指数进行计算,得到本省与外界(其它省及自治区)旅游网络关联指数情况表,如表1所示;
表1本省与外界旅游网络关联指数情况表(示例)
表1中,外界指境内,除本省(自治区)之外的其余30省及自治区;“差值”是“2020年关联指数”与“2019年关联指数”的系数之差;通过2020年关联指数和2019年关联指数的关联指数以及差值,可以预判2021的年的关联指数,从而对2021年的旅游情况做预判;
通过表1可以看出,2020年湖北、福建、江苏、陕西、广东和河南的旅游发展较好,2019年福建、陕西、江苏、新疆、广东的旅游的发展较好;从通过2020年关联指数和2019年关联指数的关联指数以及差值可以看出湖北、河南、山西、湖南和辽宁都呈现了较好的增长趋势,因此在对2021年的旅游情况做预判的时候,可以适当的增加旅游车辆及酒店等。
表2 2020年省际间旅游网络关联指数表(表中的数字单位为*10-4)
表2中省际间旅游网络关联指数为双向旅游联系度,从表2可以看出,某两个城市之间的旅游联系度的关系,从而可以规划两城市间的旅游车辆及酒店信息等;同样的根据此方法可以计算2019、2018以及更早之前的省际间旅游网络关联指数,通过这些旅游网络关联指数,能够更佳有效的为对旅行社2021年做评估,从而来规划2021年的情况。
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (8)
1.一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:包括,
S1:收集游客电子合同数据;
S2:处理游客非结构化文本旅游数据;
S3:异常值处理及游客完备性旅游数据归集;
S4:构建省际间旅游联系度模型;
S5:计算省际间网络关联指数;
S6:获取省际间旅游网络关联指数表。
2.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S1中,游客电子合同数据来源于全国旅游电子合同数据库。
3.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S2中,从游客非结构化文本旅游数据进行基于自然语言处理NLP算法的语义文本识别,提取出游客行程出发地、目的地、游玩时间信息。
4.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S3中,将S2中提取出的游客行程出发地、目的地、游玩时间信息与S1中电子合同备案数据库数据进行比较,剔除掉异常值旅游数据,确保游客旅游数据的完备性。
6.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S5中,由于省际间旅游客流存在双向空间流动关系,在最后的省际间网络关联指数计算中,将“省份j→省份i”和“省份i→省份j”的各自单向旅游联系度相加得到两个省份双向网络关联指数,即为
NCIij=NCIj→i+NCIi→j (2)
7.根据权利要求6所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述省际间网络关联指数的大小反映的是旅游省份间的密切程度,省际间网络关联指数越大,两座旅游省份间的旅游密切度越高,旅游要素互动越频繁;相反,省际间网络关联指数越小,则两座旅游省份间的旅游密切度越低,旅游要素互动越不活跃。
8.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S6中,通过计算本省市与其他31个省市的省际间网络关联指数,构建本省与外界旅游网络关联指数情况表,并通过计算不同年份的省际间网络关联指数,最终构成31×31的省际间旅游网络关联指数表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110646826.5A CN113377913B (zh) | 2021-06-10 | 2021-06-10 | 一种基于游客行为的旅游城市网络关联度评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110646826.5A CN113377913B (zh) | 2021-06-10 | 2021-06-10 | 一种基于游客行为的旅游城市网络关联度评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113377913A true CN113377913A (zh) | 2021-09-10 |
CN113377913B CN113377913B (zh) | 2023-08-29 |
Family
ID=77573503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110646826.5A Active CN113377913B (zh) | 2021-06-10 | 2021-06-10 | 一种基于游客行为的旅游城市网络关联度评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113377913B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298777A (zh) * | 2014-11-03 | 2015-01-21 | 厦门欣欣信息有限公司 | 一种旅游线路搜索推荐的方法及装置 |
CN104809633A (zh) * | 2015-05-11 | 2015-07-29 | 中国旅游研究院 | 旅游游客满意度调查方法 |
CN109118130A (zh) * | 2018-11-02 | 2019-01-01 | 成都中科大旗软件有限公司 | 一种全域旅游公共服务平台及其管理系统 |
CN109214952A (zh) * | 2017-06-29 | 2019-01-15 | 辽宁工程技术大学 | 一种旅游者决策模型构建方法 |
KR102225704B1 (ko) * | 2020-03-20 | 2021-03-12 | 최지웅 | 국내 거주 외국인 및 내국인 연계 기반 관광 서비스 제공 시스템 |
-
2021
- 2021-06-10 CN CN202110646826.5A patent/CN113377913B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298777A (zh) * | 2014-11-03 | 2015-01-21 | 厦门欣欣信息有限公司 | 一种旅游线路搜索推荐的方法及装置 |
CN104809633A (zh) * | 2015-05-11 | 2015-07-29 | 中国旅游研究院 | 旅游游客满意度调查方法 |
CN109214952A (zh) * | 2017-06-29 | 2019-01-15 | 辽宁工程技术大学 | 一种旅游者决策模型构建方法 |
CN109118130A (zh) * | 2018-11-02 | 2019-01-01 | 成都中科大旗软件有限公司 | 一种全域旅游公共服务平台及其管理系统 |
KR102225704B1 (ko) * | 2020-03-20 | 2021-03-12 | 최지웅 | 국내 거주 외국인 및 내국인 연계 기반 관광 서비스 제공 시스템 |
Non-Patent Citations (4)
Title |
---|
HIROKI NAKAMURA等: "tourist decision in renting various personal travel modes:a case study in Kitakyushu city,Japan", TOURISM MANAGEMENT, vol. 55, pages 85 - 93 * |
任宇杰;郭乃静;马坤;唐晓岚;: "基于大数据观察的中国国家地质公园的热度分析――以携程旅游网为例", 苏州科技大学学报(工程技术版), vol. 31, no. 04, pages 71 - 76 * |
倪维秋;廖茂林;: "高速铁路对中国省会城市旅游经济联系的空间影响", 中国人口・资源与环境, vol. 28, no. 03, pages 160 - 168 * |
马威;张耀南;敏玉芳;陈;: "基于互联网搜索数据的甘肃省旅游客源地时空分析", 中国沙漠, vol. 36, no. 03, pages 857 - 864 * |
Also Published As
Publication number | Publication date |
---|---|
CN113377913B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Grinberger et al. | Typologies of tourists' time–space consumption: A new approach using GPS data and GIS tools | |
Frejinger | Route choice analysis: data, models, algorithms and applications | |
Peng et al. | Model research on forecast of second-hand house price in Chengdu based on XGboost algorithm | |
CN106488405B (zh) | 一种融合个体与近邻移动规律的位置预测方法 | |
CN104346438B (zh) | 基于大数据数据管理服务系统 | |
CN104424231B (zh) | 多维数据的处理方法及装置 | |
CN105069717A (zh) | 一种基于游客信任度的个性化旅游线路推荐方法 | |
CN103995837A (zh) | 一种基于群体足迹的个性化旅游路线规划方法 | |
CN108460499B (zh) | 一种融合用户时间信息的微博客用户影响力排名方法 | |
Ye | Air pollutants prediction in shenzhen based on arima and prophet method | |
CN111931998B (zh) | 一种基于移动定位数据的个体出行模式预测方法及系统 | |
CN112232483A (zh) | 一种结合cnn和lstm的航班平均票价预测方法 | |
Wang et al. | Personalized route recommendation with neural network enhanced search algorithm | |
CN111951037A (zh) | 一种基于大数据的客流预测与旅游营销方法 | |
CN106202377A (zh) | 一种基于随机梯度下降的在线协同排序方法 | |
CN109949174A (zh) | 一种异构社交网络用户实体锚链接识别方法 | |
CN114819589A (zh) | 城市空间高质量利用测定方法、系统、计算机设备及终端 | |
CN108038734A (zh) | 基于点评数据的城市商业设施空间分布探测方法及系统 | |
CN114723596A (zh) | 一种基于多源交通出行数据和主题模型的城市功能区识别方法 | |
CN113377913B (zh) | 一种基于游客行为的旅游城市网络关联度评估方法 | |
Yang et al. | Optimization of tourism information analysis system based on big data algorithm | |
CN117312578A (zh) | 一种非遗传承图谱的构建方法与系统 | |
Ye et al. | Analyzing asymmetric city connectivity by toponym on social media in China | |
Kou et al. | A Dynamic Assessment Method for Urban Eco‐environmental Quality Evaluation | |
CN111678531B (zh) | 一种基于LightGBM的地铁路径规划方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |