CN111831904A - 一种旅客行为数据分析方法及系统 - Google Patents
一种旅客行为数据分析方法及系统 Download PDFInfo
- Publication number
- CN111831904A CN111831904A CN202010559378.0A CN202010559378A CN111831904A CN 111831904 A CN111831904 A CN 111831904A CN 202010559378 A CN202010559378 A CN 202010559378A CN 111831904 A CN111831904 A CN 111831904A
- Authority
- CN
- China
- Prior art keywords
- passenger
- score
- data
- information
- security
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000007405 data analysis Methods 0.000 title claims abstract description 46
- 238000007689 inspection Methods 0.000 claims abstract description 48
- 230000008520 organization Effects 0.000 claims abstract description 14
- 230000006399 behavior Effects 0.000 claims description 61
- 230000005540 biological transmission Effects 0.000 claims description 16
- 238000012216 screening Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 abstract description 4
- 230000008447 perception Effects 0.000 abstract description 4
- 238000011161 development Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000004140 cleaning Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 241000207961 Sesamum Species 0.000 description 3
- 235000003434 Sesamum indicum Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种旅客行为数据分析方法及系统,方法包括:大数据分析平台接收航司服务器发送的查询安检通道的请求,所述请求中携带所述旅客的信息;根据所述旅客的信息调用公安系统、航司系统、机场安检系统和第三方机构的相应数据;根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道信息并将其反馈给所述航司服务器。本发明通过与航司、公安、第三方信用机构、全国其他机场等多方系统的数据互通,大幅降低安检人力成本、提高安检服务能力、提升旅客服务感知、加快智慧机场发展、推进四型机场建设。
Description
技术领域
本发明涉及数据分析领域,尤其涉及一种旅客行为数据分析方法及系统。
背景技术
随着民航业的高速增长,安检通道客流压力和人力成本压力大,机场行业高速发展,迫切需要提升效率匹配日益扩张的客流体量。再者,旅客也面临着安检模式单一、出行体验差等问题。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种旅客行为数据分析方法及系统。
本发明解决上述技术问题的技术方案如下:一种旅客行为数据分析方法,包括:
大数据分析平台接收航司服务器发送的查询安检通道的请求,所述请求中携带所述旅客的信息;
根据所述旅客的信息调用公安系统、航司系统、机场安检系统和第三方机构的相应数据;
根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道信息并将其反馈给所述航司服务器。
本发明解决上述技术问题的另一种技术方案如下:一种旅客行为数据分析系统,包括:大数据分析平台、数据支撑系统,外部系统和终端,其中,外部系统包括:航司系统、机场安检系统、公安系统和第三方机构;
所述大数据分析平台与数据支撑系统和外部系统之间通过API接口进行数据传输;
所述数据支撑系统用于采集数据;
所述大数据分析平台在接收到所述航司系统的服务器发送的查询安检通道的请求后,根据该请求中携带的旅客的信息调用公安系统、航司系统、机场安检系统和第三方机构的相应数据,并根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道信息并将其反馈给所述航司服务器;
所述终端用于展示所述安检通道信息。
本发明的有益效果是:通过与航司、公安、第三方信用机构、全国其他机场等多方系统的数据互通,大幅降低安检人力成本、提高安检服务能力、提升旅客服务感知、加快智慧机场发展、推进四型机场建设。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种旅客行为数据分析方法的示意性流程图;
图2为本发明另一实施例提供的一种旅客行为数据分析方法的示意性流程图;
图3为图2中所示一种旅客行为数据分析方法中的评分过程的示意性流程图;
图4为图3中所示评分过程中的旅客诚信评分核心算法的示意性流程图;
图5为本发明实施例提供的一种旅客行为数据分析方法的应用实例的示意性流程图;
图6为本发明另一实施例提供的一种旅客行为数据分析系统的示意性框架图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
如图1所示的一种旅客行为数据分析方法,包括:
110、大数据分析平台接收航司服务器发送的查询安检通道的请求,所述请求中携带所述旅客的信息;其中,旅客的信息包括:旅客基本信息(旅客姓名、证件号码、联系方式)、离港信息(值机时间、购票时间、舱位、座位号)、航班信息(航班号、航班日期、始发地、目的地、预计起飞时间、实际起飞时间)。
120、根据所述旅客的信息调用公安系统、航司系统、机场安检系统和第三方机构的相应数据;其中,第三方机构包括可以提供信用分的机构,如支付宝的芝麻信用和微信信用。
130、根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道信息并将其反馈给所述航司服务器。
具体的,在一个实施例中,步骤130具体为:
131、根据公安系统和航司系统的相应数据,以及所述旅客的数据信息,判断出所述旅客是否为高危旅客,若是,则为所述旅客确定的安检通道信息为高危通道。
具体的,当所述旅客的信息与所述公安系统中的七类重点关注人员信息匹配时,所述旅客为高危旅客;
当所述旅客的信息与所述公安系统中的七类重点关注人员信息不匹配时,所述旅客为正常旅客,则调用航司系统的相应数据继续判断所述旅客是否为高危旅客;
当根据所述旅客的信息确定所述旅客出现过所述航司系统中的一类违规行为时,所述旅客为高危旅客。
其中,七类重点关注人员信息包括:涉恐人员、涉稳人员、重大刑事犯罪前科人员、涉毒人员、在逃人员、肇事肇祸精神病人和重点上访人员的信息。
一类违规行为包括:发生过恶意投诉行为、发生过挑战客规索赔行为、发生辱骂殴打工作人员、发生过破坏公司财产行为、发生过恶意延误航班行为、发生过空中非法干扰,扰乱事件,不服从机组指挥。
132、若否,结合机场安检系统和第三方机构的相应数据,以及为所述旅客设置的初始分和根据所述旅客的历史行为数据得到的加分,计算所述旅客的诚信评分。
具体的,根据所述旅客的信息确定所述旅客的航司违规需扣分;
根据所述旅客的信息确定所述旅客的安检行为需扣分;
根据所述旅客的信息确定所述旅客的第三方机构信用分;
根据所述旅客的初始分、加分、航司违规需扣分、安检行为需扣分和第三方机构信用分,计算所述旅客的诚信评分。
旅客的诚信评分=初始分-安检行为需扣分+加分+第三方机构信用分。
其中,安检行为需扣分包括:当出现行检违规或旅检违规时,安检行为需扣分为行检违规或旅检违规对应的扣除分数;当出现行旅违规时,比较行检违规和旅检违规对应的扣除分数,安检行为需扣分为按最高分扣除。
初始分的设置过程如下:
首先可以根据旅客的信息判断是否为名单旅客;若是,则继续判断是否在有效期内;若在,则为旅客设置初始分,其中,为名单旅客中的诚信旅客设置初始分为当前系统中诚信旅客分值区间的最低分,例如:80分,为名单旅客中的高危旅客设置初始分为当前系统中高危旅客分值区间的最高分,例如:19分;若该旅客不是名单旅客,或者是名单旅客但不在有效期内,则该旅客为正常旅客,为其设置初始分为60分。
其中,是否在有效期内是指该旅客在预设时段内是否为“诚信旅客”或“高危旅客”。例如:可以设置成在今年内都是诚信旅客,12月31日就变成普通旅客;也可以设置成从明年2月起,今后一直都会是高危旅客。
加分的确定过程如下:判断旅客的历史行为数据是否满足加分条件,若满足,则确定旅客的加分。加分包括:正常加分和特殊加分。
具体的,机场系统统计旅客一年内的出现数据,正常加分=2*当前日期往前推一年内的过检次数。航司系统统计旅客三年内的出现数据,若旅客满足乘机次数且无违规行为则特殊加分=20,否则为0。
133、根据所述旅客的诚信评分为所述旅客确定安检通道信息并将其反馈给所述航司服务器。
具体的,当所述旅客的诚信评分在第一评分范围内时,为所述旅客确定的安检通道信息为高危通道;
当时所述旅客的诚信评分在第二评分范围内时,为所述旅客确定的安检通道信息为普通通道;
所述旅客的诚信评分在第三评分范围内时,为所述旅客确定的安检通道信息为诚信通道;
其中,所述第一评分范围、所述第二评分范围和所述第三评分范围依次增大且互不重叠。
例如:第一评分范围为0-19分,第二评分范围为20-79分,第三评分范围为80-100分。
可选地,在一个实施例中,为了验证评分过程并保证安检质量,从通过诚信通道进行安检的旅客中选取一部分旅客,将该部分旅客的安检通道信息确定为普通通道。
例如,可以将占比10%的诚信旅客分配至普通安检通道,保留占比10%的诚信旅客在诚信安检通道。
另外,当给旅客确定好安检通道之后,还可以为旅客打印登机牌,以便旅客从为其确定的安检通道进行安检,登机牌上包括为旅客确定的安检通道信息。
应理解,在本发明各实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
下面结合附图2-5对本发明实施例提供的一种旅客行为数据分析方法进行详细的说明。
如图2所示,当航司服务器接收到旅客通过终端发送的值机请求时,向大数据分析平台发送查询安检通道的请求,该请求中携带了旅客的数据信息。然后,大数据分析平台计算旅客的信用分数,具体的计算过程如图3和4所示。
如图3所示,大数据分析平台先将旅客的数据信息发送给公安系统,由公安系统对旅客数据进行判断。具体的判断方法是匹配旅客是否属于七类重点关注人员,如果是,返回判断结果1:表示该旅客为高危旅客;如果不是,返回判断结果0:表示该旅客为正常旅客正常。对高危旅客直接分配高危通道进行安检。
对正常旅客继续跟进航司数据进行判断。具体判断方法是根据旅客信息潘旅客是否有过一类违规行为,若有,返回判断结果1:表示该旅客为高危旅客。若无,则要根据航司数据确定安检行为需扣分,安检行为需扣分包括:行检违规、旅检违规和行旅违规对应的扣除分中的一种。
另外,需要说明的是,旅客诚信评分算法的步骤流程如图4所示,包括:初始分评定和动态评分两部分。
在初始分评定过程中,需要根据旅客的类型为旅客设置了一个初设分,然后,还需要根据Hbase大数据平台的旅客乘机记录获取旅客的出行次数,算分模型对旅客的出行次数,出发地进行分析,判断是否满足加分条件,若满足,在初始分的基础上根据加分项配置进行相应加分。
然后,在动态评分过程中,综合航司、公安、安检、第三方等系统中的旅客行为数据,为旅客评分。最后根据评分将旅客划分为不同的群体并为其匹配相应的安检通道。
再对应到图2的内容中,则高危旅客对应高危安检通道,普通旅客对应普通安检通道,诚信旅客对应诚信安检通道。大数据分析平台将为旅客确定好的安检通道信息发送至航司服务器,由航司服务器转发自旅客的终端,以便旅客打印登机牌并按照为其分配的安检通道进行安检。
图5则提供了一个本发明的应用实例,可以将上述方法流程编写成算法模型并以名为“易安检”的平台供旅客使用。当旅客首次申请易安检时,需要提示旅客学习安检知识并接受安检知识考试,只有考试通过且接受易安检条款的旅客才可以进行身份登记,易安检在旅客身份登记成功后调用算法模型对旅客进行评分完成注册。
上文结合图1-5对本发明提供的一种旅客行为数据分析方法进行了详细的说明,下面结合附图6对本发明提供的一种旅客行为数据分析系统进行详细的说明。
如图6所示,本发明实施例一种旅客行为数据分析系统,其特征在于,包括:大数据分析平台、数据支撑系统,外部系统和终端,其中,外部系统包括:航司系统、机场安检系统、公安系统和第三方机构;
所述大数据分析平台与数据支撑系统和外部系统之间通过API接口进行数据传输;
所述数据支撑系统用于采集数据;
所述大数据分析平台在接收到所述航司系统的服务器发送的查询安检通道的请求后,根据该请求中携带的旅客的信息调用公安系统、航司系统、机场安检系统和第三方机构的相应数据,并根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道信息并将其反馈给所述航司服务器;
所述终端用于展示所述安检通道信息。终端包括PC、平板电脑和手持终端。
利用人脸识别,大数据技术,AI智能设备,深入“安检生态”的各个环节,构建“差异化安检”的整体解决方案,通过与航司、公安、第三方信用机构、全国其他机场等多方系统的数据互通,形成本场数据为主、外场数据为辅的常旅客行为大数据平台,结合多维信用评估模型,引入物联网等AI设备,为旅客提供高效快捷的安检服务方式,为机场打造“高安全+高效率+易感知”的安检服务品牌。
也就是说,上述应用实例中的“易安检”平台,成功注册之后,多个机场之间可以实时/准实时进行数据交换,包括:旅客注册数据、旅客行为数据等,旅客可以一地注册、多地使用,最终形成本场数据为主、外场数据为辅的诚信旅客行为大数据中心,从而可以基于算法模块实时或者周期性的更新旅客的评分,方便安检工作的进行。
本发明实施例提供的一种旅客行为数据分析系统,充分考虑了平台的可兼容性、可移植性与可拓展性,系统的整体架构适用于民航、高铁、公路、水运等公共交通行业的安检业务。本方案投入使用后能大幅降低安检人力成本、提高安检服务能力、提升旅客服务感知、加快智慧机场发展、推进四型机场建设。
下面再对本发明的构思进行解释说明。
首先,信用评分是指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。根据客户的信用分数,授信者可以分析客户安全防范意识。据此,授信者可以决定是否准予授信及授信的等级。虽然授信者通过分析客户的信用历史资料,同样可以得到这样的分析结果,但是通过利用评分模型得出的信用评分却更加快速、更加客观、更具有一致性。
因此,建立一个合理的信用评分模型是诚信安检大数据平台安检信用评分的基础,同时也是诚信安检大数据平台对旅客信用评级的依据。在信用评分的过程中,最关键的就是信用评分模型的构建。用来产生信用评分的模型不胜枚举,每一种模型均有其独特的规则。信用评分模型的基本原理是确定影响违约概率的因素,然后给予权重,计算其信用分数。
为此,本发明中通过汇集公安、航司、安检及第三方信用平台的旅客信用信息记录,采用大数据技术对旅客信息进行统计分析,通过诚信安检大数据平台对各信息来源设定的相应权重对旅客的进行信用评分,可得出一个合理的信用评分。影响评分的因素包括公安反馈、航司评分、安检评分、第三方信用评分,采用的权重分配是公安的最高,然后依次是安检、航司、第三方支付结构。
同时,占比10%的诚信旅客分配至普通安检通道的回流算法,能及时对当前的信用评估模型进行有效验证。由于影响评分的因素权重不同,每一名旅客的行为数据占比也不同,导致不同特征的概率不同,比如:一名旅客的安检行为良好,但是信用评分较低,根据安检行为的权重大于信用评分的权重,该名旅客很有可能评为诚信旅客。那么另一名旅客安检行为有过违规,但是信用评分较高,而且乘机次数较多,来自于航司的评分也较高,那么这种人也是有可能评为诚信旅客,通过对比,显然第二名旅客出现违规的风险较高,所以需要针对诚信旅客随机抽取10%分配至普通通道,一方面是对评分模型的验证,一方面也是对安检质量的保障。
其次,一个完整的信用评分体系必须要有数据依据,数据的采集挖掘将是制约信用评分准确性的重要因素。诚信安检大数据平台对旅客的最终评分依据是需要根据航空公司、公安和机场安检的数据综合分析计算出来,实现这个综合计算的过程,就需要分别与航空公司与公安的系统及第三方信用平台进行数据采集抽取。
为此,本发明中主要的数据采集方式有通过数据库直接采集抽取、通过文件进行数据对接、通过实时的服务调用方式,实现即时的信息获取和处理。服务接口方式包括WebService、Socket、Jason、JMS、URL等方式。
最后,在数据的传输过程中因为各种因为可能造成数据传输的误差,如数据缺失、数据重复等。因此,一个完善的数据传输及数据清洗融合机制是控制数据准确性的重要保障。根据数据传输的流向和时间关系,数据传输方式可以分为单工、半双工和全双工数据传输。单工数据传输是两数据站之间只能沿一个指定的方向进行数据传输。即一端的DTE固定为数据源,另一端的DTE固定为数据宿。半双工数据传输是两数据站之间可以在两个方向上进行数据传输,但不能同时进行。即每一端的DTE既可作数据源,也可作数据宿,但不能同时作为数据源与数据宿。全双工数据传输是在两数据站之间,可以在两个方向上同时进行传输。即每一端的DTE均可同时作为数据源与数据宿。通常四线线路实现全双工数据传输。
为此,在本发明中在采用频率复用、时分复用或回波抵消等技术时,二线线路也可实现全双工数据传输。在保证数据传输链路的安全性后,对接收到的数据采用轮询机制保证重复数据的融合清洗,通过握手机制保证发送端数据的接收,如有缺失,重新传输。以保障数据的完整性。
综合考虑上述问题和解决方法之后,本发明提出的一种旅客行为数据分析系统具有以下特点:
第一、分布式数据平台:
诚信安检大数据平台通过应用大数据技术,搭建分布式计算资源平台,将计算、存储以及网络变成统一的计算服务,并在此基础上提供数据库、大数据处理、分布式中间件、大数据算法等服务,为诚信安检大数据平台的旅客评分应用提供计算支撑能力;提供服务中间件、数据服务及管理、应用服务、应用质量管理等,为诚信安检大数据平台前端应用提供服务支撑能力。
数据分库设计、读写分离:诚信安检大数据库采用分库设计,通过分库设计,可为数据库的并发处理能力带来质的提升,从容面对高并发的读写访问,并有利于扩展各类型数据(基础数据库采用mysql关系型数据库,用于基础配置,专题数据库采用Habse大数据平台,用于旅客评分的核心功能),诚信安检大数据库建设分为两个部分:一部分是构建基础数据库、专题数据库,为了支持基础和专题数据的重用和共享,必须采用建模技术完成数据的形式化规范表示(旅客评分模型需要基础数据库提供参数配置以及专题数据库提供业务数据作为支撑。);另一部分是数据清洗入库,整个的数据清洗过程构成了一个从源头到目标的闭环,在准备阶段可以将结构化、半结构化、非结构化的文档导入到系统中,在系统中进行对接配置后及可以进行后续处理,配置方法可以保存,方面以后导入相同的文档。
第二、完善的数据修正措施:
导入后根据数据自动清洗规则(由于目前数据的采集方式多是通过上述描述中的接口方式,数据量庞大,数据复杂,有缺失,重复,错误等问题,所以针对这一类数据设置的自动清洗规则包括数据去重、数据补全、数据核对。)对数据进行检测,将数据分为正常、已知异常、未知异常3种情况,正常的数据可直接导入,已知异常的数据系统自动处理后可入专题数据库,未知异常的数据系统无法处理需要人手工修正。检测后生成检测报告,可定位到出错位置,并统计此文档的数据质量。经过自动修正或手动修正后将数据入库,使系统资源不断完善。
第三、高可靠旅客信用评分模型:
诚信安检大数据平台综合调用航司、公安、安检、第三方机构等多方数据,制定不同系统平台间数据的采集、评分模型分析管理的规范,总体按照“旅客信用评分=(旅客安检行为评分+第三方信用评分)&旅客安全等级”的计算公式,形成高可靠的旅客信用评分算法模型。
其中,旅客安检行为评分来自安检数据,第三方信用评分来自第三方机构数据,旅客安全等级来自航司数据,包括:旅客是否为常旅客、VIP旅客,航程中是否有异常行为、服务投诉等。安检数据包括两方面,一个是安检加分,一个时安检减分,安检加分取自旅客每一次正常过检的加分项配置。安检减分包括行检违规减分和旅检违规减分。
第四、多套机制更新旅客信用评分:
旅客诚信安检大数据平台汇集航司、公安、安检、第三方等十余个系统的旅客行为数据,因此设计实时/准实时两套机制更新旅客信用评分。当旅客有出行行为时,平台实时计算当前旅客的信用评分,否则默认以周为单位定期更新旅客信用评分。
第五、第三方信用辅助评分:
本平台的旅客信用评分模型中涉及第三方信用辅助评分,可以接入支付宝的芝麻信用,以芝麻信用分为参考对旅客的第三方信用进行评分。
第六、信用等级区间可配置:
平台按照分值区间将所有旅客分为诚信旅客、普通旅客、高危旅客三大类,其中只有诚信旅客可以分配至易安检通道,普通旅客和高危旅客分配至人工安检通道,平台提供信用等级区间配置管理模块供安检部门根据安检业务的实际情况灵活调整。
第七、诚信旅客回流算法验证:
旅客诚信安检大数据平台随机将占比10%的诚信旅客分配至人工安检通道,以此来验证评分模型的适用性,以便及时调整算法模型以适应安检实际业务。
需要说明的是,上文中出现的“信用评分模型”、“旅客评分模型”、“旅客信用评分算法模型”、“旅客信用评分模型”、“评分模型”均指“算法模型”,具体内容可以对应到图2至图4的方法流程。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种旅客行为数据分析方法,其特征在于,包括:
大数据分析平台接收航司服务器发送的查询安检通道的请求,所述请求中携带所述旅客的信息;
根据所述旅客的信息调用公安系统、航司系统、机场安检系统和第三方机构的相应数据;
根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道信息并将其反馈给所述航司服务器。
2.根据权利要求1所述的一种旅客行为数据分析方法,其特征在于,所述根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道,包括:
根据公安系统和航司系统的相应数据,以及所述旅客的数据信息,判断出所述旅客是否为高危旅客,若是,则为所述旅客确定的安检通道信息为高危通道;
若否,结合机场安检系统和第三方机构的相应数据,以及为所述旅客设置的初始分和根据所述旅客的历史行为数据得到的加分,计算所述旅客的诚信评分;
根据所述旅客的诚信评分为所述旅客确定安检通道信息并将其反馈给所述航司服务器。
3.根据权利要求2所述的一种旅客行为数据分析方法,其特征在于,所述根据公安系统和航司系统的相应数据,以及所述旅客的数据信息,判断出所述旅客是否为高危旅客,包括:
当所述旅客的信息与所述公安系统中的七类重点关注人员信息匹配时,所述旅客为高危旅客;
当所述旅客的信息与所述公安系统中的七类重点关注人员信息不匹配时,所述旅客为正常旅客,则调用航司系统的相应数据继续判断所述旅客是否为高危旅客;
当根据所述旅客的信息确定所述旅客出现过所述航司系统中的一类违规行为时,所述旅客为高危旅客。
4.根据权利要求2所述的一种旅客行为数据分析方法,其特征在于,所述结合机场安检系统和第三方机构的相应数据,以及为所述旅客设置的初始分和根据所述旅客的历史行为数据得到的加分,计算所述旅客的诚信评分,包括:
根据所述旅客的信息确定所述旅客的安检行为需扣分;
根据所述旅客的信息确定所述旅客的第三方机构信用分;
根据所述旅客的初始分、加分、安检行为需扣分和第三方机构信用分,计算所述旅客的诚信评分。
5.根据权利要求4所述的一种旅客行为数据分析方法,其特征在于,根据以下公式计算所述旅客的诚信评分:
所述旅客的诚信评分=初始分-安检行为需扣分+加分+第三方机构信用分。
6.根据权利要求2所述的一种旅客行为数据分析方法,其特征在于,根据所述旅客的诚信评分为所述旅客确定安检通道信息,包括:
当所述旅客的诚信评分在第一评分范围内时,为所述旅客确定的安检通道信息为高危通道;
当时所述旅客的诚信评分在第二评分范围内时,为所述旅客确定的安检通道信息为普通通道;
所述旅客的诚信评分在第三评分范围内时,为所述旅客确定的安检通道信息为诚信通道;
其中,所述第一评分范围、所述第二评分范围和所述第三评分范围依次增大且互不重叠。
7.根据权利要求6所述的一种旅客行为数据分析方法,其特征在于,还包括:
从通过诚信通道进行安检的旅客中选取一部分旅客,将该部分旅客的安检通道信息确定为普通通道。
8.根据权利要求1到7中任一项所述的一种旅客行为数据分析方法,其特征在于,还包括:
判断获取的所述旅客的历史行为数据是否满足加分条件,若满足,则确定所述旅客的加分。
9.根据权利要求1到7中任一项所述的一种旅客行为数据分析方法,其特征在于,还包括:
根据所述旅客的信息判断是否为名单旅客,若是,判断是否在有效期内;若在,则为该旅客设置初始分,其中,为名单旅客中的诚信旅客设置初始分为当前系统中诚信旅客分值区间的最低分,为名单旅客中的高危旅客设置初始分为当前系统中高危旅客分值区间的最高分;
若该旅客不是名单旅客,或者是名单旅客但不在有效期内,则该旅客为正常旅客,为其设置初始分为60分;
其中,是否在有效期内是指该旅客在预设时段内是否为“诚信旅客”或“高危旅客”。
10.一种旅客行为数据分析系统,其特征在于,包括:大数据分析平台、数据支撑系统,外部系统和终端,其中,外部系统包括:航司系统、机场安检系统、公安系统和第三方机构;
所述大数据分析平台与数据支撑系统和外部系统之间通过API接口进行数据传输;
所述数据支撑系统用于采集数据;
所述大数据分析平台在接收到所述航司系统的服务器发送的查询安检通道的请求后,根据该请求中携带的旅客的信息调用公安系统、航司系统、机场安检系统和第三方机构的相应数据,并根据所述旅客的数据信息和所述相应数据,为所述旅客确定安检通道信息并将其反馈给所述航司服务器;
所述终端用于展示所述安检通道信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010559378.0A CN111831904A (zh) | 2020-06-18 | 2020-06-18 | 一种旅客行为数据分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010559378.0A CN111831904A (zh) | 2020-06-18 | 2020-06-18 | 一种旅客行为数据分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111831904A true CN111831904A (zh) | 2020-10-27 |
Family
ID=72899233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010559378.0A Pending CN111831904A (zh) | 2020-06-18 | 2020-06-18 | 一种旅客行为数据分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111831904A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230186216A1 (en) * | 2021-05-25 | 2023-06-15 | The Government of the United States of America, as represented by the Secretary of Homeland Security | Anonymous screening with chain of custody sensor information |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874951A (zh) * | 2017-02-14 | 2017-06-20 | Tcl集团股份有限公司 | 一种旅客关注度评级方法及装置 |
CN109034518A (zh) * | 2018-05-31 | 2018-12-18 | 中国人民公安大学 | 一种安检分流和航班预警方法及系统 |
CN109801200A (zh) * | 2018-12-03 | 2019-05-24 | 国政通科技有限公司 | 一种分级检测的方法和系统 |
WO2020015140A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 旅客评级模型生成方法、装置、计算机设备和存储介质 |
CN111311806A (zh) * | 2019-12-04 | 2020-06-19 | 深圳市机场股份有限公司 | 机场快速安检方法、系统、电子装置及存储介质 |
-
2020
- 2020-06-18 CN CN202010559378.0A patent/CN111831904A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874951A (zh) * | 2017-02-14 | 2017-06-20 | Tcl集团股份有限公司 | 一种旅客关注度评级方法及装置 |
CN109034518A (zh) * | 2018-05-31 | 2018-12-18 | 中国人民公安大学 | 一种安检分流和航班预警方法及系统 |
WO2020015140A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 旅客评级模型生成方法、装置、计算机设备和存储介质 |
CN109801200A (zh) * | 2018-12-03 | 2019-05-24 | 国政通科技有限公司 | 一种分级检测的方法和系统 |
CN111311806A (zh) * | 2019-12-04 | 2020-06-19 | 深圳市机场股份有限公司 | 机场快速安检方法、系统、电子装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
彭凯贝;史天运;伍柳伊;吕晓军;: "基于旅客风险分类的安检流程研究", 中国安全生产科学技术, vol. 16, no. 05, pages 143 - 149 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230186216A1 (en) * | 2021-05-25 | 2023-06-15 | The Government of the United States of America, as represented by the Secretary of Homeland Security | Anonymous screening with chain of custody sensor information |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Patanakul et al. | What impacts the performance of large-scale government projects? | |
Robinson et al. | Methods for pre-processing smartcard data to improve data quality | |
Whiteford | Debt by design: The anatomy of a social policy fiasco–Or was it something worse? | |
CN111192012B (zh) | 事项处理方法、装置、服务器及存储介质 | |
US10268813B2 (en) | Physical token-less security screening using biometrics | |
US8214075B2 (en) | System and method for modelling a flight | |
US20170262852A1 (en) | Database monitoring system | |
CN105354689B (zh) | 一种基于计算机系统的民航团体管理方法及系统 | |
CN108062674B (zh) | 基于gps的订单欺诈识别方法、系统、存储介质和电子设备 | |
US20120036078A1 (en) | System and Method for Coordinating the Collection, Analysis and Storage of Payroll Information Provided to Government Agencies by Government Contractors | |
CN110008979A (zh) | 异常数据预测方法、装置、电子设备及计算机存储介质 | |
CN111709603A (zh) | 基于风控的服务请求处理方法、装置及系统 | |
CN111144697A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN110728570B (zh) | 反诈资金分析方法 | |
CN115936438A (zh) | 一种用于企业税务风控的预警方法及系统 | |
CN112734177A (zh) | 一种智能分流自动决策的风控系统及方法 | |
CN114997812A (zh) | 一种人力资源综合管理大数据监管服务系统 | |
CN111831904A (zh) | 一种旅客行为数据分析方法及系统 | |
US20140279378A1 (en) | Model performance simulator | |
CN111932368A (zh) | 一种信用卡发卡系统及其构建方法、装置 | |
CN111582878A (zh) | 一种交易风险预测方法、装置及系统 | |
US20220230165A1 (en) | Blockchain-based outlet site selection method and apparatus, device and storage medium | |
CN115564591A (zh) | 一种融资产品的确定方法及相关设备 | |
CN108959596B (zh) | 一种公交阶梯票价预测方法 | |
CN110197074B (zh) | 一种用户权限控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201027 |
|
RJ01 | Rejection of invention patent application after publication |