CN111475702B - 基于爬虫技术的航司价格预警的方法、系统、设备和介质 - Google Patents
基于爬虫技术的航司价格预警的方法、系统、设备和介质 Download PDFInfo
- Publication number
- CN111475702B CN111475702B CN202010213766.3A CN202010213766A CN111475702B CN 111475702 B CN111475702 B CN 111475702B CN 202010213766 A CN202010213766 A CN 202010213766A CN 111475702 B CN111475702 B CN 111475702B
- Authority
- CN
- China
- Prior art keywords
- price
- data
- difference data
- voyage
- navigation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000009193 crawling Effects 0.000 claims abstract description 31
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013524 data verification Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 6
- 230000007547 defect Effects 0.000 abstract description 5
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 241000270322 Lepidosauria Species 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 4
- 230000002860 competitive effect Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于爬虫技术的航司价格预警的方法及系统,包括:预设爬虫爬取的粒度、范围及频率;以所述频率爬取所述粒度和所述范围内的竞飞航司的第一价格数据;根据所述第一价格数据生成各航司的价格的排名报表;当所述排名报表中对象航司的排名发生变化时发出预警信息。本发明的基于爬虫技术的航司价格预警的方法及系统能实时地监控各航司价格的变化情况,并设立报警机制,在对象航司排名发生变化时可随时做出预警;能验证爬取的数据,提高数据的准确性;将价差变量与现有变量结合建模,实时调整航司价格,弥补了现有模型的不足,使模型的普适性更强;同时对调整后的对象航司的产量及利润进行评估,确定模型调整的效果,形成闭环。
Description
技术领域
本发明涉及爬虫技术领域,具体涉及基于爬虫技术的航司价格预警的方法、系统、设备和介质。
背景技术
随着社会的发展,国际旅游越来越普遍,旅行者经常是通过查看各个航司的价格排名决定订哪家航司的机票。因此,准确及时地获取各个航司的价格排名,并在价格排名发生变化时进行及时预警对各个航司来说是非常重要的。现有技术中通常是通过人工方式搜索各个航司的价格并进行人工排名比较和预警,人工预警的方式及时性差,成本和效率都较低。
发明内容
本发明要解决的技术问题是为了克服现有技术中人工预警的方式及时性差,成本和效率偏低的缺陷,提供一种基于爬虫数据的航司价格预警方法、系统、设备和介质。
本发明是通过下述技术方案来解决上述技术问题:
一种基于爬虫技术的航司价格预警的方法,包括以下步骤:
预设爬虫爬取的粒度、范围及频率;
以所述频率爬取所述粒度和所述范围内的竞飞航司的第一价格数据;
根据所述第一价格数据生成各航司的价格的排名报表;
当所述排名报表中对象航司的排名发生变化时发出预警信息。
较佳地,所述根据所述第一价格数据生成各航司的价格的排名报表的步骤包括:
验证所述第一价格数据准确度后得到第二价格数据;
根据所述第二价格数据生成各航司的价格的排名报表。
较佳地,所述方法还包括以下步骤:
根据所述第二价格数据生成对象航司与竞飞航司的价差数据;
判断所述价差数据是否在预设范围内,所述预设范围包括最大价差数据和最小价差数据;
当所述价差数据大于所述最大价差数据时降低所述对象航司的价格,当所述价差数据小于所述最小价差数据时提高所述对象航司的价格。
较佳地,所述方法还包括以下步骤:
获取对象航司的现有变量;
将所述现有变量与所述价差数据结合建立模型;
通过所述模型动态调整对象航司的价格。
较佳地,所述方法还包括以下步骤:
对所述模型调整后的对象航司的价格进行评估。
一种基于爬虫技术的航司价格预警的系统,包括以下模块:
预设模块,所述预设模块用于预设爬虫爬取的粒度、范围及频率;
第一价格数据获取模块,所述第一价格数据获取模块用于以所述频率爬取所述粒度和所述范围内的竞飞航司的第一价格数据;
第一报表生成模块,所述第一报表生成模块用于根据所述第一价格数据生成各航司的价格的排名报表;
预警信息发出模块,所述预警信息发出模块用于当所述排名报表中对象航司的排名发生变化时发出预警信息。
较佳地,所述第一报表生成模块包括:
数据验证单元,用于验证所述第一价格数据准确度后得到第二价格数据;
第二报表生成单元,用于根据所述第二价格数据生成各航司的价格的排名报表。
较佳地,所述系统还包括以下模块:
价差数据生成模块,所述价差数据生成模块用于根据所述第二价格数据生成对象航司与竞飞航司的价差数据;
价差判断模块,所述价差判断模块用于判断所述价差数据是否在预设范围内,所述预设范围包括最大价差数据和最小价差数据;
第一价格调整模块,所述第一价格调整模块用于当所述价差数据大于所述最大价差数据时降低所述对象航司的价格,当所述价差数据小于所述最小价差数据时提高所述对象航司的价格。
较佳地,所述系统还包括以下模块:
现有变量获取模块,所述现有变量获取模块用于获取对象航司的现有变量;
模型建立模块,所述模型建立模块用于将所述现有变量与所述价差数据结合建立模型;
第二价格调整模块,所述第二价格调整模块用于通过所述模型动态调整对象航司的价格。
较佳地,所述系统还包括以下模块:
价格评估模块,所述价格评估模块用于对所述模型调整后的对象航司的价格进行评估。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一种基于爬虫技术的航司价格预警的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时上述任一种基于爬虫技术的航司价格预警的方法的步骤。
本发明的积极进步效果在于:通过爬虫技术获取竞飞航司价格,制成价格的排名报表,实时地监控各航司价格的变化情况,并设立报警机制,在对象航司排名发生变化时可随时做出预警;进一步地,验证爬取的数据,提高数据的准确性;进一步地,将价差变量与现有变量结合建模,实时调整航司价格,弥补了现有模型的不足,使模型的普适性更强;同时对调整后的对象航司的产量及利润进行评估,确定模型调整的效果,形成闭环,使对象航司的价格在市场中更具有竞争力,提升客座率和收益。
附图说明
图1为本发明实施例1的基于爬虫技术的航司价格预警的方法的流程示意图。
图2为本发明实施例2的基于爬虫技术的航司价格预警的方法的流程示意图。
图3为本发明实施例2的对象航司航段量随竞飞航司的价差波动图。
图4为本发明实施例3的基于爬虫技术的航司价格预警的系统的结构示意图。
图5为本发明实施例4的基于爬虫技术的航司价格预警的系统的结构示意图。
图6为本发明较佳实施例5的实现基于爬虫技术的航司价格预警的方法的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
如图1所示,本发明的实施例1的基于爬虫技术的航司价格预警的方法的流程示意图,该基于爬虫技术的航司价格预警的方法包括以下步骤:
步骤S100、预设爬虫爬取的粒度、范围及频率;
步骤S101、以预设的频率、爬取粒度和范围内的竞飞航司的第一价格数据;
步骤S102、根据第一价格数据生成各航司的价格的排名报表;
步骤S103、当排名报表中对象航司的排名发生变化时发出预警信息。
本实施例的基于爬虫技术的航司价格预警的方法通过爬虫技术获取竞飞航司价格,制成价格的排名报表,并设立报警机制,在对象航司排名发生变化时可随时做出预警,以实时地监控各航司价格的变化情况,方便掌握全局。
实施例2
如图2所示,本实施例的基于爬虫技术的航司价格预警的方法是对实施例1的进一步的限定,具体地:
步骤S100中爬虫爬取的粒度,主要指竞飞航司的价格。爬虫爬取的具体粒度包含:航线、航司、航班号、起飞日期、回程日期、舱等、子舱位、航程类型(单程/往返/多程)等。爬虫爬取的范围指针对性的选取十条航线(产量大或搜索热度高的航线),并根据各航线的特性,动态的确定起飞日期及回程日期,如短线(港澳台日韩)的预定提前期较短:0-45天;长线(欧美澳新)的预定提前期较长:45-90天。频率是为保证爬取数据的新鲜度,爬取价格的时间频率,因航空公司舱位变动频繁,价格也是实时波动的,爬取频率为每半小时工作一次,每日爬取48次数据,以确保数据的及时性。
本实施例的爬虫爬取的粒度、范围及频率不限于以上内容。
步骤S101中第一价格数据包含最低价在内的所有价格。除爬取第一价格数据外还会爬取对应的退改政策和行李额度。
步骤S102具体包括:
步骤S1021、验证第一价格数据准确度后得到第二价格数据;
步骤S1022、根据第二价格数据生成各航司的价格的排名报表。
具体地,通过机器方式验证第一价格数据准确度得到第二价格数据,以提高爬取数据的准确度。或者,通过机器与人工的结合的方式进行验证,通过机器方式验证第一价格数据准确度得到第二价格数据后,人工验证即手动比对第二数据与外网展示的价格是否一致,以进一步提高爬取数据的准确度。
步骤S103具体包括:以航线/航司/舱位/票价等作为维度,监控每日/每小时/每30分(根据需要调整频率)竞飞航司的价格及对象航司与之的价差变动情况,并根据以上维度,定制各航司价格排名的报表,当对象航司价格的排名上升(价格优势力增大)或下降(价格优势力减弱)时,可第一时间发出警报(邮件通知),以方便掌控全局。为了提高数据的准确性,由于FSC(全服务航空公司)及LCC(低成本航空公司)受航司本身定位不同的限制,一般不会横向比较;两舱(头等舱、商务舱)及经济舱购买的客户群体不同,也不能横向比较;考虑到航司的运力有限,综合考虑主力的航线及时间段,选择与其相似度较高的航司对比,使得数据的参考性更强。
本实施例的基于爬虫技术的航司价格预警的方法还包括以下步骤:
步骤S104、根据第二价格数据生成对象航司与竞飞航司的价差数据;
步骤S105、判断价差数据是否在预设范围内,预设范围包括最大价差数据和最小价差数据;
步骤S106、当价差数据大于最大价差数据时降低对象航司的价格,当价差数据小于最小价差数据时提高对象航司的价格。
具体地,根据历史数据,确定正常范围内的价差[-a%,b%](对象航司的价格/竞飞航司的价格-1),最大价差数据和最小价差数据分别为-a%和b%,当价差数据>b%时,可进行减价,价差数据<-a%时,可进行加价。
步骤S107、获取对象航司的现有变量;
步骤S108、将现有变量与价差数据结合建立模型;
步骤S109、通过模型动态调整对象航司的价格。
具体的,现有变量举例:预订出行时间差、搜索热度、搜索星期、舱等、航程类型、价格段等。可仅针对单变量,或多变量结合的方法,建立模型,动态调整价格。
步骤S110、对模型调整后的对象航司的价格进行评估。
具体地,根据调整前后的数据,确认产量及利润指标的变化情况。具体指标包含:航段量、航段量同比、客座率、利润率等。并根据各产量指标每日的波动情况,确定最能反应调价影响的航段量指标,折算调价带来的航段量及利润的变动,并计算ROI(Δ利润/Δ航段),评估该调整是否划算。如划算,维持;如不划算,修改模型,迭代上述步骤,形成闭环。
下面以上海-台北为例,具体说明本实施例的基于爬虫技术的航司价格预警的方法的具体应用。
1.明确该航线需爬取的价格粒度及范围的信息参照表1:
表1
起飞预定时间差 | 0-30天每天,45天,60天,90天 |
回程与去程时间差 | 1-7天每天,10天,14天,21天,30天 |
航程类型 | 单程,往返 |
航司类型 | 四大航、FSC、LCC |
舱等 | 经济舱、头等舱、商务舱 |
2.对爬取后价格的准确度及新鲜度进行验证。
3.定制化报表监控及预警。
以下为按照起飞日期及具体起飞时间维度,定制的上海-台北线单程,经济舱,对象航司A与竞飞航司B、竞飞航司C的价差波动情况的报表(表2)。
表2
而下表(表3)则是按照舱等类别,对三个航司的价格进行排序(做在定制的系统里),当对象航司的排名出现变化时(如下表五角星标记处),会发出邮件提醒。
表3
4.模型动态调价
参照历史数据(航段量与价差的相对关系),如图3所示,对象航司航段量随竞飞航司的价差波动图,可确认该条航线,对象航司与竞飞航司的正常价差区间为[-2%,4%],同时结合其他变量考虑,建立模型,确定的一条加价策略如下表(表4),并上线分天A/B测试,查看效果。
表4
5.评估航段量及利润指标的变化情况,计算ROI(投入产出比)
ROI=Δ总利润/Δ航段量=(调整后总利润-调整前总利润)/
(调整后总航段-调整前总航段);
单段利润=单段票价*利润率;总利润=单段利润*航段量
加价:|ROI|>单段利润,调整有效;反之,无效
将调整前后的数据整理,可知调整后对象航司航段量下降12段,利润率上涨0.15%,日利润增加2,723元,|ROI|=227>35(单段利润),说明该调整是有效的,可保留,见(表5)。
表5
周末对周末 | 航司航段量 | 同比 | 客座率 | 单段票价(真实值) | 航司利润率 |
调整前 | 2,084 | 11.9% | 62.3% | 1000 | 3.51% |
调整后 | 2,073 | 11.4% | 66.8% | 1000 | 3.66% |
差值 | -12 | -0.5% | 4.5% | —— | 0.15% |
注:日利润增加=1000*3.66%*2073–1000*3.51%*2084=2,723元
|ROI|=2723/12=227
单段利润=1000*3.51%=35
调整前的利润率才能反应真实情况。
本实施例的基于爬虫技术的航司价格预警的方法通过爬虫技术获取竞飞航司价格,制成价格的排名报表,实时地监控各航司价格的变化情况,并设立报警机制,在对象航司排名发生变化时可随时做出预警;进一步地,验证爬取的数据,提高数据的准确性;将价差变量与现有变量结合建模,实时调整航司价格,弥补了现有模型的不足,使模型的普适性更强;同时对调整后的对象航司的产量及利润进行评估,确定模型调整的效果,形成闭环,使对象航司的价格在市场中更具有竞争力,提升客座率和收益。
实施例3
如图4所示,本发明的实施例3的基于爬虫技术的航司价格预警的系统的结构示意图,该基于爬虫技术的航司价格预警的系统包括以下模块:
预设模块1,用于预设爬虫爬取的粒度、范围及频率;
第一价格数据获取模块2,用于以所述频率爬取所述粒度和所述范围内的竞飞航司的第一价格数据;
第一报表生成模块3,用于根据所述第一价格数据生成各航司的价格的排名报表;
预警信息发出模块4,用于当所述排名报表中对象航司的排名发生变化时发出预警信息。
本实施例的基于爬虫技术的航司价格预警的系统通过爬虫技术获取竞飞航司价格,制成价格的排名报表,并设立报警机制,在对象航司排名发生变化时可随时做出预警,以实时地监控各航司价格的变化情况,方便掌握全局。
实施例4
如图5所示,本实施例的基于爬虫技术的航司价格预警的系统是对实施例3的进一步的限定,具体地:
预设模块1中爬虫爬取的粒度,主要指竞飞航司的价格。爬虫爬取的具体粒度包含:航线、航司、航班号、起飞日期、回程日期、舱等、子舱位、航程类型(单程/往返/多程)等。爬虫爬取的范围指针对性的选取十条航线(产量大或搜索热度高的航线),并根据各航线的特性,动态的确定起飞日期及回程日期,如短线(港澳台日韩)的预定提前期较短:0-45天;长线(欧美澳新)的预定提前期较长:45-90天。频率是为保证爬取数据的新鲜度,爬取价格的时间频率,因航空公司舱位变动频繁,价格也是实时波动的,爬取频率为每半小时工作一次,每日爬取48次数据,以确保数据的及时性。
本实施例的爬虫爬取的粒度、范围及频率不限于以上内容。
第一价格数据获取模块2中第一价格数据包含最低价在内的所有价格。除爬取第一价格数据外还会爬取对应的退改政策和行李额度。
第一报表生成模块3具体包括:
数据验证单元31,用于验证第一价格数据准确度后得到第二价格数据;
第二报表生成单元32,用于根据第二价格数据生成各航司的价格的排名报表。
具体地,通过机器方式验证第一价格数据准确度得到第二价格数据,以提高爬取数据的准确度。或者,通过机器与人工的结合的方式进行验证,通过机器方式验证第一价格数据准确度得到第二价格数据后,人工验证即手动比对第二数据与外网展示的价格是否一致,以进一步提高爬取数据的准确度。
预警信息发出模块4中以航线/航司/舱位/票价等作为维度,监控每日/每小时/每30分(根据需要调整频率)竞飞航司的价格及对象航司与之的价差变动情况,并根据以上维度,定制各航司价格排名的报表,当对象航司价格的排名上升(价格优势力增大)或下降(价格优势力减弱)时,可第一时间发出警报(邮件通知),以方便掌控全局。为了提高数据的准确性,由于FSC(全服务航空公司)及LCC(低成本航空公司)受航司本身定位不同的限制,一般不会横向比较;两舱(头等舱、商务舱)及经济舱购买的客户群体不同,也不能横向比较;考虑到航司的运力有限,综合考虑主力的航线及时间段,选择与其相似度较高的航司对比,使得数据的参考性更强。
本实施例的基于爬虫技术的航司价格预警的系统还包括以下模块:
价差数据生成模块5,用于根据第二价格数据生成对象航司与竞飞航司的价差数据;
价差判断模块6,用于判断价差数据是否在预设范围内,预设范围包括最大价差数据和最小价差数据;
第一价格调整模块7,用于当价差数据大于最大价差数据时降低对象航司的价格,当价差数据小于最小价差数据时提高对象航司的价格。
具体地,根据历史数据,确定正常范围内的价差[-a%,b%](对象航司的价格/竞飞航司的价格-1),最大价差数据和最小价差数据分别为-a%和b%,当价差数据>b%时,可进行减价,价差数据<-a%时,可进行加价。
现有变量获取模块8,用于获取对象航司的现有变量;
模型建立模块9,用于将现有变量与价差数据结合建立模型;
第二价格调整模块10,用于通过模型动态调整对象航司的价格。
具体的,现有变量举例:预订出行时间差、搜索热度、搜索星期、舱等、航程类型、价格段等。可仅针对单变量,或多变量结合的方法,建立模型,动态调整价格。
价格评估模块11,用于对模型调整后的对象航司的价格进行评估。
具体地,根据调整前后的数据,确认产量及利润指标的变化情况。具体指标包含:航段量、航段量同比、客座率、利润率等。并根据各产量指标每日的波动情况,确定最能反应调价影响的航段量指标,折算调价带来的航段量及利润的变动,并计算ROI(Δ利润/Δ航段),评估该调整是否划算。如划算,维持;如不划算,修改模型,迭代上述步骤,形成闭环。
以上海-台北为例,具体说明本实施例的基于爬虫技术的航司价格预警的系统的具体应用。具体应用内容与实施例2中基于爬虫技术的航司价格预警的方法的具体应用类似,此处不再赘述。
本实施例的基于爬虫技术的航司价格预警的系统通过爬虫技术获取竞飞航司价格,制成价格的排名报表,实时地监控各航司价格的变化情况,并设立报警机制,在对象航司排名发生变化时可随时做出预警;进一步地,验证爬取的数据,提高数据的准确性;进一步地,将价差变量与现有变量结合建模,实时调整航司价格,弥补了现有模型的不足,使模型的普适性更强;同时对调整后的对象航司的产量及利润进行评估,确定模型调整的效果,形成闭环,使对象航司的价格在市场中更具有竞争力,提升客座率和收益。
实施例5
图6为本发明实施例5提供的一种电子设备的结构示意图。电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现实施例1或2的基于爬虫技术的航司价格预警的方法。图6显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1或2所提供的基于爬虫技术的航司价格预警的方法。
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现实施例1或2所提供的基于爬虫技术的航司价格预警的方法步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现实施例1或2的基于爬虫技术的航司价格预警的方法中的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (8)
1.一种基于爬虫技术的航司价格预警的方法,其特征在于,包括以下步骤:
预设爬虫爬取的粒度、范围及频率;
以所述频率爬取所述粒度和所述范围内的竞飞航司的第一价格数据;
根据所述第一价格数据生成各航司的价格的排名报表;
当所述排名报表中对象航司的排名发生变化时发出预警信息;
所述根据所述第一价格数据生成各航司的价格的排名报表的步骤包括:
验证所述第一价格数据准确度后得到第二价格数据;
根据所述第二价格数据生成各航司的价格的排名报表;
所述方法还包括以下步骤:
根据所述第二价格数据生成对象航司与竞飞航司的价差数据;
判断所述价差数据是否在预设范围内,所述预设范围包括最大价差数据和最小价差数据;
当所述价差数据大于所述最大价差数据时降低所述对象航司的价格,当所述价差数据小于所述最小价差数据时提高所述对象航司的价格;
所述粒度包括航线、航司、航班号、起飞日期、回程日期、舱等、子舱位、航程类型中的至少一种;
所述范围包括根据预设条件选取的十条航线。
2.如权利要求1所述的基于爬虫技术的航司价格预警的方法,其特征在于,所述方法还包括以下步骤:
获取对象航司的现有变量;
将所述现有变量与所述价差数据结合建立模型;
通过所述模型动态调整对象航司的价格。
3.如权利要求2所述的基于爬虫技术的航司价格预警的方法,其特征在于,所述方法还包括以下步骤:
对所述模型调整后的对象航司的价格进行评估。
4.一种基于爬虫技术的航司价格预警的系统,其特征在于,包括以下模块:
预设模块,所述预设模块用于预设爬虫爬取的粒度、范围及频率;
第一价格数据获取模块,所述第一价格数据获取模块用于以所述频率爬取所述粒度和所述范围内的竞飞航司的第一价格数据;
第一报表生成模块,所述第一报表生成模块用于根据所述第一价格数据生成各航司的价格的排名报表;
预警信息发出模块,所述预警信息发出模块用于当所述排名报表中对象航司的排名发生变化时发出预警信息;
所述第一报表生成模块包括:
数据验证单元,用于验证所述第一价格数据准确度后得到第二价格数据;
第二报表生成单元,用于根据所述第二价格数据生成各航司的价格的排名报表;
所述系统还包括以下模块:
价差数据生成模块,所述价差数据生成模块用于根据所述第二价格数据生成对象航司与竞飞航司的价差数据;
价差判断模块,所述价差判断模块用于判断所述价差数据是否在预设范围内,所述预设范围包括最大价差数据和最小价差数据;
第一价格调整模块,所述第一价格调整模块用于当所述价差数据大于所述最大价差数据时降低所述对象航司的价格,当所述价差数据小于所述最小价差数据时提高所述对象航司的价格;
所述粒度包括航线、航司、航班号、起飞日期、回程日期、舱等、子舱位、航程类型中的至少一种;
所述范围包括根据预设条件选取的十条航线。
5.如权利要求4所述的基于爬虫技术的航司价格预警的系统,其特征在于,所述系统还包括以下模块:
现有变量获取模块,所述现有变量获取模块用于获取对象航司的现有变量;
模型建立模块,所述模型建立模块用于将所述现有变量与所述价差数据结合建立模型;
第二价格调整模块,所述第二价格调整模块用于通过所述模型动态调整对象航司的价格。
6.如权利要求5所述的基于爬虫技术的航司价格预警的系统,其特征在于,所述系统还包括以下模块:
价格评估模块,所述价格评估模块用于对所述模型调整后的对象航司的价格进行评估。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至3中任一种基于爬虫技术的航司价格预警的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至3中任一种基于爬虫技术的航司价格预警的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213766.3A CN111475702B (zh) | 2020-03-24 | 2020-03-24 | 基于爬虫技术的航司价格预警的方法、系统、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213766.3A CN111475702B (zh) | 2020-03-24 | 2020-03-24 | 基于爬虫技术的航司价格预警的方法、系统、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111475702A CN111475702A (zh) | 2020-07-31 |
CN111475702B true CN111475702B (zh) | 2023-07-07 |
Family
ID=71747701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010213766.3A Active CN111475702B (zh) | 2020-03-24 | 2020-03-24 | 基于爬虫技术的航司价格预警的方法、系统、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111475702B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113900961B (zh) * | 2021-12-08 | 2022-03-01 | 深圳市活力天汇科技股份有限公司 | 一种用于自动化测试的样本生成方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779133A (zh) * | 2011-05-12 | 2012-11-14 | 苏州同程旅游网络科技有限公司 | 基于多平台、多供应商的搜索比价方法 |
US8615422B1 (en) * | 2011-11-10 | 2013-12-24 | American Airlines, Inc. | Airline pricing system and method |
CN107291901A (zh) * | 2017-06-23 | 2017-10-24 | 携程旅游网络技术(上海)有限公司 | 主被动组合获取机票数据的方法、系统、设备及存储介质 |
CN107767116A (zh) * | 2017-10-12 | 2018-03-06 | 携程旅游网络技术(上海)有限公司 | 出行产品自动化推送方法、系统、存储介质和电子设备 |
CN107798482A (zh) * | 2017-11-16 | 2018-03-13 | 中国农业科学院农业信息研究所 | 一种农产品市场异常波动风险监测方法及系统 |
CN110738528A (zh) * | 2019-10-21 | 2020-01-31 | 中国民航信息网络股份有限公司 | 一种规则运价的预处理方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060122872A1 (en) * | 2004-12-06 | 2006-06-08 | Stevens Harold L | Graphical user interface for and method of use for a computer-implemented system and method for booking travel itineraries |
-
2020
- 2020-03-24 CN CN202010213766.3A patent/CN111475702B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779133A (zh) * | 2011-05-12 | 2012-11-14 | 苏州同程旅游网络科技有限公司 | 基于多平台、多供应商的搜索比价方法 |
US8615422B1 (en) * | 2011-11-10 | 2013-12-24 | American Airlines, Inc. | Airline pricing system and method |
CN107291901A (zh) * | 2017-06-23 | 2017-10-24 | 携程旅游网络技术(上海)有限公司 | 主被动组合获取机票数据的方法、系统、设备及存储介质 |
CN107767116A (zh) * | 2017-10-12 | 2018-03-06 | 携程旅游网络技术(上海)有限公司 | 出行产品自动化推送方法、系统、存储介质和电子设备 |
CN107798482A (zh) * | 2017-11-16 | 2018-03-13 | 中国农业科学院农业信息研究所 | 一种农产品市场异常波动风险监测方法及系统 |
CN110738528A (zh) * | 2019-10-21 | 2020-01-31 | 中国民航信息网络股份有限公司 | 一种规则运价的预处理方法及系统 |
Non-Patent Citations (3)
Title |
---|
D.S. Goshi等.Recent advances in 94 GHz FMCW imaging radar development.《 2009 IEEE MTT-S International Microwave Symposium Digest》.2009,77-80. * |
基于高铁竞争模式的航线客流量评估模型;钟牧原;;中国科技信息(10);17+93-94 * |
面向机票业务的预测服务系统;刘涛;《中国优秀硕士学位论文全文数据库》;I138-58 * |
Also Published As
Publication number | Publication date |
---|---|
CN111475702A (zh) | 2020-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Scheelhaase et al. | The inclusion of aviation into the EU emission trading scheme–Impacts on competition between European and non-European network airlines | |
US6418413B2 (en) | Method and apparatus for providing availability of airline seats | |
TW202038182A (zh) | 航班調整方法、裝置、電子設備及儲存媒體 | |
US11574285B2 (en) | Intelligent prediction of bundles of spare parts | |
CN111340536A (zh) | 模型训练方法、客座率进度预测方法、系统、设备及介质 | |
US20210248481A1 (en) | Data Processing System and Data Processing Method | |
Szabo et al. | Effect of the load factor on the ticket price | |
CN111475702B (zh) | 基于爬虫技术的航司价格预警的方法、系统、设备和介质 | |
Ji et al. | Application of modified nested and dynamic class allocation models for cruise line revenue management | |
CN111028020A (zh) | 航班包机场景的收益管理方法、系统、介质和电子设备 | |
CN112966950A (zh) | 限流条件下航班排期的调整方法、系统、设备及介质 | |
CN116362788A (zh) | 一种新航线开通的预测方法、装置、设备及存储介质 | |
CN111507502B (zh) | 一种虚占航班班次的优化方法和系统 | |
CN111737634A (zh) | 航班收入预测方法、系统、电子设备和可读存储介质 | |
Muchiri | Comparing alternative strategies of aircraft maintenance | |
CN116547684A (zh) | 用于识别优化的互联网连接配置的系统和方法 | |
Ateş et al. | Reducing operational fuel costs of airlines: A model for monitoring and managing fuel consumption using unified modeling language | |
Wingrove III et al. | The asac air carrier investment model (third generation) | |
Lin et al. | Economical Efficiency Analysis for the Alternative Strategy of Regional Jets Based on System Dynamics | |
Lin et al. | An Analysis of Economical Efficiency for the Alternative Strategy of Regional Jets | |
CN118537054A (zh) | 一种运价产品的需求预测方法、装置、设备和存储介质 | |
CN116629967A (zh) | 行程票价推荐方法、系统、设备及介质 | |
CN116383269A (zh) | 处理航司数据的方法 | |
Mowery | Federal Funding of Research and Development in Transportation: The Case of Aviation | |
Iliescu et al. | Analysis of US airline passengers’ refund and exchange behavior across multiple airlines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |