CN112163786A - 一种基于大数据和pagerank算法的民航旅客个人影响力评估方法 - Google Patents

一种基于大数据和pagerank算法的民航旅客个人影响力评估方法 Download PDF

Info

Publication number
CN112163786A
CN112163786A CN202011121141.0A CN202011121141A CN112163786A CN 112163786 A CN112163786 A CN 112163786A CN 202011121141 A CN202011121141 A CN 202011121141A CN 112163786 A CN112163786 A CN 112163786A
Authority
CN
China
Prior art keywords
passenger
score
relationship
value
passengers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011121141.0A
Other languages
English (en)
Other versions
CN112163786B (zh
Inventor
廖雅哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tech Valley Xiamen Information Technology Co ltd
Original Assignee
Tech Valley Xiamen Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tech Valley Xiamen Information Technology Co ltd filed Critical Tech Valley Xiamen Information Technology Co ltd
Priority to CN202011121141.0A priority Critical patent/CN112163786B/zh
Publication of CN112163786A publication Critical patent/CN112163786A/zh
Application granted granted Critical
Publication of CN112163786B publication Critical patent/CN112163786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,包括以下步骤:获取旅客出行数据,根据旅客出行数据计算旅客间最终粘度值;建立客户价值转移概率矩阵;通过建立RFMC模型进行清洗计算,获得旅客个体价值,定义个性化转移向量;基于旅客个体价值和客户社交关系网络,计算旅客影响力得分;基于旅客个体价值和客户社交关系网络,建立旅客影响力迭代模型。本发明利用民航旅客出行数据计算旅客间最终粘度值,结合pagerank算法计算旅客影响力得分,能够为旅客价值评估提供数据参考,提高旅客价值评估的准确性,极大程度上满足民航企业对于旅客价值分析的要求。

Description

一种基于大数据和pagerank算法的民航旅客个人影响力评估 方法
技术领域
本发明涉及大数据技术领域,特别涉及一种基于大数据和pagerank算法的民航旅客个人影响力评估方法。
背景技术
随着社会现代化建设高速发展,人民群众对于美好生活的追求日益增加,对于出行服务与体验的需求也更加多样化。越来越多的旅客选择搭乘飞机这一方便快捷的出行方式,因此各大航空公司的各类信息系统中存储的大量旅客出行数据呈现出爆发性增长。如何充分利用这些数据资源深耕旅客价值、拓展旅客资源,挖掘旅客潜在需求、为旅客提供优质个性化服务从而刺激收益提升,是现今民航业面临的一个巨大的机遇与挑战。
民航旅客通过订票、值机等共同出行行为中,在一定程度上体现了旅客之间的社交关系。旅客之间的社交关系对于旅客价值的评估分析具有相当重要的意义,但目前旅客价值的评估分析并未充分考虑的旅客关系所带来的影响力,导致最终旅客价值评估不够准确,无法满足民航企业对于旅客价值分析的要求。
发明内容
为解决上述问题,本发明提供了一种基于大数据和pagerank算法的民航旅客个人影响力评估方法。
本发明采用以下技术方案:
一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,包括以下步骤:
S1、获取旅客出行数据,所述旅客出行数据包括出行订单信息、值机信息、座位信息及旅客关系信息,根据旅客出行数据计算旅客间最终粘度值;
S2、建立客户价值转移概率矩阵,在客户社交关系网络G中,W为边的权重集合,Iij=Iji表示旅客i、j间的最终粘度值,客户价值转移概率矩阵具体为:
Figure BDA0002732042450000021
其中,Mij为客户价值转移概率矩阵,Ni为节点i的邻居节点集;
S3、通过建立RFMC模型进行清洗计算,获得旅客个体价值,所述RFMC模型为:
Figure BDA0002732042450000022
其中,vi表示旅客i的个体价值;
在客户社交关系网络G中,定义个性化转移向量U=[u1 u2 … un],个性化转移概率的表达式为:
Figure BDA0002732042450000023
其中,ui为旅客i的个性化转移概率,n为旅客数量,rk表示所有旅客影响力得分初始值;
S4、基于旅客个体价值和客户社交关系网络,计算旅客影响力得分:
Figure BDA0002732042450000024
其中,ri为旅客i的影响力得分,α为阻尼系数,0≤α≤1,rj为旅客j的影响力得分;
S5、基于旅客个体价值和客户社交关系网络,建立旅客影响力迭代模型:
Figure BDA0002732042450000025
其中,
Figure BDA0002732042450000026
为经过i次迭代计算后的旅客影响力得分向量,n为关系网中的客户数量,Mn×n为转移概率矩阵,Un×1为个性化转移向量;
每迭代一次进行一次规范化处理,并满足:
Figure BDA0002732042450000031
设置迭代终止条件为:
||Ri+1-Ri||2≤ε
其中,ε为阈值。
优选地,所述旅客间最终粘度值通过以下步骤计算:
S11、基于出行订单信息计算同订单关系得分,基于值机信息计算同行值机关系得分,基于座位信息计算同行座位关系得分,经归一化处理后,计算出旅客关系得分,旅客关系得分通过以下公式计算:
Vij=βp×P’ijb×B’ijs×S’ij
其中,Vij为旅客关系得分,P′ij为同订单关系得分归一化处理后的结果,B′ij为同行值机关系得分归一化处理后的结果,S′ij为同行座位关系得分归一化处理后的结果,βp为同订单关系得分权重,βb为同行值机关系得分权重,βs为同行座位关系得分权重;
S12、基于旅客关系信息确定出旅客关系系数,通过以下公式计算出旅客粘度值得分:
Wij=Vij×cij÷1.1
其中,Wij为旅客粘度值得分,cij为旅客关系系数;
S13、建立旅客相对关系得分模型,计算出旅客相对关系得分:
Figure BDA0002732042450000032
其中,V′ij为旅客相对关系得分,其代表以旅客i为中心,在旅客i的关系网中,旅客i、j关系得分与旅客i同其他旅客关系得分的对比值,Vij为旅客关系得分,VMAX表示的是以旅客i为中心,在旅客i的关系网中,与除了旅客i之外的其他旅客关系得分的最大值;
S14、基于旅客粘度值得分和旅客相对关系得分,通过以下公式计算出旅客相对关系总得分值:
Figure BDA0002732042450000033
其中,W’ij、W’ji为旅客相对关系总得分值,τ为旅客粘度值得分的权重系数,(1-τ)为旅客相对关系得分的权重系数,ρij为同行系数,其数值根据同行时间因素确定;
S15、基于旅客同行次数,对所述旅客相对关系总得分值计算方式进行优化,获得旅客间最终粘度值,优化模型为:
Figure BDA0002732042450000041
Figure BDA0002732042450000042
其中,t为旅客i、j的同行次数,μ为调整系数,xij为旅客i、j的同行人数值,xij为在同民航订座人数最大值和同值机编组人数最小值中取最小值。
优选地,所述同行系数ρij通过以下公式计算得出:
Figure BDA0002732042450000043
其中,Kij为旅客i与旅客j的同行次数,t′L为旅客i与旅客j最近一次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
优选地,所述同行值机关系得分通过以下方法计算:
Figure BDA0002732042450000044
其中,Bij为同行值机关系得分,dci[k]为旅客i和旅客j第k次同行的登机牌序号差值,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
优选地,所述同行值机关系得分通过以下方法计算:
Figure BDA0002732042450000045
其中,Bij为同行值机关系得分,D[k]为旅客i和旅客j第k次同值机编组的旅客数量,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
优选地,所述同行座位关系得分通过以下方法计算:
Figure BDA0002732042450000051
dseat[k]=αdp[k]+βdh[k]
其中,Sij为同行座位关系得分,dseat[k]为旅客i和旅客j第k次同行时座位的曼哈顿距离,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间,dp[k]为旅客i和旅客j第k次同行的座位纵向距离,dh[k]为旅客i和旅客j第k次同行的座位横向距离,α为纵向距离权重,β为横向距离权重。
优选地,所述同订单关系得分通过以下方法计算:
Figure BDA0002732042450000052
其中,S1[k]为旅客i和旅客j第k次机票同订单的订单旅客数量,S2[k]为旅客i和旅客j第k次CC平台同票号的订单旅客数量,S3[k]为旅客i和旅客j第k次旅游度假同订单的订单旅客数量,S4[k]为旅客i和旅客j第k次假期平台同订单的订单旅客数量,t1k为旅客i和旅客j第k次机票同订单的订单时间,t2k为旅客i和旅客j第k次CC平台同票号的订单时间,t3k为旅客i和旅客j第k次旅游度假同订单的订单时间,t4k为旅客i和旅客j第k次假期平台同订单的订单时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
优选地,所述步骤S11中的归一化处理通过以下方法计算得到归一化结果:
Figure BDA0002732042450000061
其中,xcenter为得分数据的中位数,所述中位数为将所有得分数据进行排序,选取的排序在中间的得分数据的值。
优选地,所述旅客关系信息包含旅客关系类型,所述旅客关系类型至少包括直系亲属、配偶、近亲属、亲戚、朋友、同学、同事、其他、无关系中的一种或多种,每种旅客关系类型唯一对应一旅客关系系数。
优选地,所述旅客关系系数取值范围为1~1.1。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明利用民航旅客出行数据计算旅客间最终粘度值,结合pagerank算法计算旅客影响力得分,能够为旅客价值评估提供数据参考,提高旅客价值评估的准确性,极大程度上满足民航企业对于旅客价值分析的要求。
附图说明
图1为本发明的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
参考图1所示,本发明公开了一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,包括以下步骤:
S1、获取旅客出行数据,旅客出行数据包括出行订单信息、值机信息、座位信息及旅客关系信息,根据旅客出行数据计算旅客间最终粘度值。旅客间最终粘度值通过以下步骤计算:
S11、基于出行订单信息计算同订单关系得分,基于值机信息计算同行值机关系得分,基于座位信息计算同行座位关系得分,经归一化处理后,计算出旅客关系得分,旅客关系得分通过以下公式计算:
Vij=βp×P’ijb×B’ijs×S’ij
其中,Vij为旅客关系得分,P′ij为同订单关系得分归一化处理后的结果,B′ij为同行值机关系得分归一化处理后的结果,S′ij为同行座位关系得分归一化处理后的结果,βp为同订单关系得分权重,βb为同行值机关系得分权重,βs为同行座位关系得分权重。
归一化处理通过以下方法计算得到归一化结果:
Figure BDA0002732042450000071
其中,xcenter为得分数据的中位数,中位数为将所有得分数据进行排序,选取的排序在中间的得分数据的值。若得分数据的总数量是偶数,则xcenter取中间两个得分数据的平均值。若中位数为0,则xcenter取非0的最小值。
同行值机关系得分通过以下方法计算:
Figure BDA0002732042450000072
其中,Bij为同行值机关系得分,dci[k]为旅客i和旅客j第k次同行的登机牌序号差值,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
在本实施例中,同行值机关系得分也可以通过以下方法计算:
Figure BDA0002732042450000073
其中,Bij为同行值机关系得分,D[k]为旅客i和旅客j第k次同值机编组的旅客数量,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
同行座位关系得分通过以下方法计算:
Figure BDA0002732042450000081
dseat[k]=αdp[k]+βdh[k]
其中,Sij为同行座位关系得分,dseat[k]为旅客i和旅客j第k次同行时座位的曼哈顿距离,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间,dp[k]为旅客i和旅客j第k次同行的座位纵向距离,dh[k]为旅客i和旅客j第k次同行的座位横向距离,α为纵向距离权重,β为横向距离权重。
同订单关系得分通过以下方法计算:
Figure BDA0002732042450000082
其中,S1[k]为旅客i和旅客j第k次机票同订单的订单旅客数量,S2[k]为旅客i和旅客j第k次CC平台同票号的订单旅客数量,S3[k]为旅客i和旅客j第k次旅游度假同订单的订单旅客数量,S4[k]为旅客i和旅客j第k次假期平台同订单的订单旅客数量,t1k为旅客i和旅客j第k次机票同订单的订单时间,t2k为旅客i和旅客j第k次CC平台同票号的订单时间,t3k为旅客i和旅客j第k次旅游度假同订单的订单时间,t4k为旅客i和旅客j第k次假期平台同订单的订单时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
S12、基于旅客关系信息确定出旅客关系系数,通过以下公式计算出旅客粘度值得分:
Wij=Vij×cij÷1.1
其中,Wij为旅客粘度值得分,cij为旅客关系系数。旅客关系信息包含旅客关系类型,旅客关系类型至少包括直系亲属、配偶、近亲属、亲戚、朋友、同学、同事、其他、无关系中的一种或多种,每种旅客关系类型唯一对应一旅客关系系数。旅客关系系数取值范围为1~1.1。
S13、建立旅客相对关系得分模型,计算出旅客相对关系得分:
Figure BDA0002732042450000091
其中,V′ij为旅客相对关系得分,其代表以旅客i为中心,在旅客i的关系网中,旅客i、j关系得分与旅客i同其他旅客关系得分的对比值,Vij为旅客关系得分,VMAX表示的是以旅客i为中心,在旅客i的关系网中,与除了旅客i之外的其他旅客关系得分的最大值。
S14、基于旅客粘度值得分和旅客相对关系得分,通过以下公式计算出旅客相对关系总得分值:
Figure BDA0002732042450000092
其中,W’ij、W’ji为旅客相对关系总得分值,τ为旅客粘度值得分的权重系数,(1-τ)为旅客相对关系得分的权重系数,ρij为同行系数,其数值根据同行时间因素确定。同行系数ρij通过以下公式计算得出:
Figure BDA0002732042450000093
其中,Kij为旅客i与旅客j的同行次数,t′L为旅客i与旅客j最近一次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
S15、基于旅客同行次数,对旅客相对关系总得分值计算方式进行优化,获得旅客间最终粘度值,优化模型为:
Figure BDA0002732042450000094
Figure BDA0002732042450000095
其中,t为旅客i、j的同行次数,μ为调整系数,xij为旅客i、j的同行人数值,xij为在同民航订座人数最大值和同值机编组人数最小值中取最小值。
S2、建立客户价值转移概率矩阵,在客户社交关系网络G中,W为边的权重集合,Iij=Iji表示旅客i、j间的最终粘度值,客户价值转移概率矩阵具体为:
Figure BDA0002732042450000101
其中,Mij为客户价值转移概率矩阵,Ni为节点i的邻居节点集。
S3、通过建立RFMC模型进行清洗计算,获得旅客个体价值,RFMC模型为:
Figure BDA0002732042450000102
其中,vi表示旅客i的个体价值;
在客户社交关系网络G中,定义个性化转移向量U=[u1 u2 … un],个性化转移概率的表达式为:
Figure BDA0002732042450000103
其中,ui为旅客i的个性化转移概率,n为旅客数量,rk表示所有旅客影响力得分初始值。
S4、基于旅客个体价值和客户社交关系网络,计算旅客影响力得分:
Figure BDA0002732042450000104
其中,ri为旅客i的影响力得分,α为阻尼系数,0≤α≤1,rj为旅客j的影响力得分。
S5、基于旅客个体价值和客户社交关系网络,建立旅客影响力迭代模型:
Figure BDA0002732042450000105
其中,
Figure BDA0002732042450000106
为经过i次迭代计算后的旅客影响力得分向量,n为关系网中的客户数量,Mn×n为转移概率矩阵,Un×1为个性化转移向量;
每迭代一次进行一次规范化处理,并满足:
Figure BDA0002732042450000111
设置迭代终止条件为:
||Ri+1-Ri||2≤ε
其中,ε为阈值。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,包括以下步骤:
S1、获取旅客出行数据,所述旅客出行数据包括出行订单信息、值机信息、座位信息及旅客关系信息,根据旅客出行数据计算旅客间最终粘度值;
S2、建立客户价值转移概率矩阵,在客户社交关系网络G中,W为边的权重集合,Iij=Iji表示旅客i、j间的最终粘度值,客户价值转移概率矩阵具体为:
Figure FDA0002732042440000011
其中,Mij为客户价值转移概率矩阵,N(i)为节点i的邻居节点集;
S3、通过建立RFMC模型进行清洗计算,获得旅客个体价值,所述RFMC模型为:
Figure FDA0002732042440000012
其中,vi表示旅客i的个体价值;
在客户社交关系网络G中,定义个性化转移向量U=[u1 u2 … un],个性化转移概率的表达式为:
Figure FDA0002732042440000013
其中,ui为旅客i的个性化转移概率,n为旅客数量,rk表示所有旅客影响力得分初始值;
S4、基于旅客个体价值和客户社交关系网络,计算旅客影响力得分:
Figure FDA0002732042440000014
其中,ri为旅客i的影响力得分,α为阻尼系数,0≤α≤1,rj为旅客j的影响力得分;
S5、基于旅客个体价值和客户社交关系网络,建立旅客影响力迭代模型:
Figure FDA0002732042440000015
其中,
Figure FDA0002732042440000021
为经过i次迭代计算后的旅客影响力得分向量,n为关系网中的客户数量,Mn×n为转移概率矩阵,Un×1为个性化转移向量;
每迭代一次进行一次规范化处理,并满足:
Figure FDA0002732042440000022
设置迭代终止条件为:
||Ri+1-Ri||2≤ε
其中,ε为阈值。
2.如权利要求1所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述旅客间最终粘度值通过以下步骤计算:
S11、基于出行订单信息计算同订单关系得分,基于值机信息计算同行值机关系得分,基于座位信息计算同行座位关系得分,经归一化处理后,计算出旅客关系得分,旅客关系得分通过以下公式计算:
Vij=βp×P′ijb×B′ijs×S′ij
其中,Vij为旅客关系得分,P′ij为同订单关系得分归一化处理后的结果,B′ij为同行值机关系得分归一化处理后的结果,S′ij为同行座位关系得分归一化处理后的结果,βp为同订单关系得分权重,βb为同行值机关系得分权重,βs为同行座位关系得分权重;
S12、基于旅客关系信息确定出旅客关系系数,通过以下公式计算出旅客粘度值得分:
Wij=Vij×cij÷1.1
其中,Wij为旅客粘度值得分,cij为旅客关系系数;
S13、建立旅客相对关系得分模型,计算出旅客相对关系得分:
Figure FDA0002732042440000023
其中,V′ij为旅客相对关系得分,其代表以旅客i为中心,在旅客i的关系网中,旅客i、j关系得分与旅客i同其他旅客关系得分的对比值,Vij为旅客关系得分,VMAX表示的是以旅客i为中心,在旅客i的关系网中,与除了旅客i之外的其他旅客关系得分的最大值;
S14、基于旅客粘度值得分和旅客相对关系得分,通过以下公式计算出旅客相对关系总得分值:
Figure FDA0002732042440000031
其中,W′ij、W′ji为旅客相对关系总得分值,τ为旅客粘度值得分的权重系数,(1-τ)为旅客相对关系得分的权重系数,ρij为同行系数,其数值根据同行时间因素确定;
S15、基于旅客同行次数,对所述旅客相对关系总得分值计算方式进行优化,获得旅客间最终粘度值,优化模型为:
Figure FDA0002732042440000032
Figure FDA0002732042440000033
其中,t为旅客i、j的同行次数,μ为调整系数,xij为旅客i、j的同行人数值,xij为在同民航订座人数最大值和同值机编组人数最小值中取最小值。
3.如权利要求2所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述同行系数ρij通过以下公式计算得出:
Figure FDA0002732042440000034
其中,Kij为旅客i与旅客j的同行次数,t′L为旅客i与旅客j最近一次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
4.如权利要求3所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述同行值机关系得分通过以下方法计算:
Figure FDA0002732042440000035
其中,Bij为同行值机关系得分,dci[k]为旅客i和旅客j第k次同行的登机牌序号差值,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
5.如权利要求3所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述同行值机关系得分通过以下方法计算:
Figure FDA0002732042440000041
其中,Bij为同行值机关系得分,D[k]为旅客i和旅客j第k次同值机编组的旅客数量,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
6.如权利要求3所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述同行座位关系得分通过以下方法计算:
Figure FDA0002732042440000042
dseat[k]=αdp[k]+βdh[k]
其中,Sij为同行座位关系得分,dseat[k]为旅客i和旅客j第k次同行时座位的曼哈顿距离,t′k为旅客i和旅客j第k次同行时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间,dp[k]为旅客i和旅客j第k次同行的座位纵向距离,dh[k]为旅客i和旅客j第k次同行的座位横向距离,α为纵向距离权重,β为横向距离权重。
7.如权利要求3所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述同订单关系得分通过以下方法计算:
Figure FDA0002732042440000043
其中,S1[k]为旅客i和旅客j第k次机票同订单的订单旅客数量,S2[k]为旅客i和旅客j第k次CC平台同票号的订单旅客数量,S3[k]为旅客i和旅客j第k次旅游度假同订单的订单旅客数量,S4[k]为旅客i和旅客j第k次假期平台同订单的订单旅客数量,t1k为旅客i和旅客j第k次机票同订单的订单时间,t2k为旅客i和旅客j第k次CC平台同票号的订单时间,t3k为旅客i和旅客j第k次旅游度假同订单的订单时间,t4k为旅客i和旅客j第k次假期平台同订单的订单时间,t′为旅客出行数据对应时间窗口的开始时间,T为旅客出行数据对应时间窗口的结束时间。
8.如权利要求3所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述步骤S11中的归一化处理通过以下方法计算得到归一化结果:
Figure FDA0002732042440000051
其中,xcenter为得分数据的中位数,所述中位数为将所有得分数据进行排序,选取的排序在中间的得分数据的值。
9.如权利要求3所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述旅客关系信息包含旅客关系类型,所述旅客关系类型至少包括直系亲属、配偶、近亲属、亲戚、朋友、同学、同事、其他、无关系中的一种或多种,每种旅客关系类型唯一对应一旅客关系系数。
10.如权利要求9所述的一种基于大数据和pagerank算法的民航旅客个人影响力评估方法,其特征在于,所述旅客关系系数取值范围为1~1.1。
CN202011121141.0A 2020-10-19 2020-10-19 一种基于大数据和pagerank算法的民航旅客个人影响力评估方法 Active CN112163786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011121141.0A CN112163786B (zh) 2020-10-19 2020-10-19 一种基于大数据和pagerank算法的民航旅客个人影响力评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011121141.0A CN112163786B (zh) 2020-10-19 2020-10-19 一种基于大数据和pagerank算法的民航旅客个人影响力评估方法

Publications (2)

Publication Number Publication Date
CN112163786A true CN112163786A (zh) 2021-01-01
CN112163786B CN112163786B (zh) 2024-05-28

Family

ID=73867578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011121141.0A Active CN112163786B (zh) 2020-10-19 2020-10-19 一种基于大数据和pagerank算法的民航旅客个人影响力评估方法

Country Status (1)

Country Link
CN (1) CN112163786B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060143081A1 (en) * 2004-12-23 2006-06-29 International Business Machines Corporation Method and system for managing customer network value
CN104021189A (zh) * 2014-06-13 2014-09-03 中国民航信息网络股份有限公司 一种民航旅客网络生成方法
CN105631750A (zh) * 2015-12-25 2016-06-01 中国民航信息网络股份有限公司 民航旅客团体发现方法
CN105654337A (zh) * 2015-12-25 2016-06-08 中国民航信息网络股份有限公司 民航旅客价值评估方法
CN107886372A (zh) * 2017-12-06 2018-04-06 中国南方航空股份有限公司 客户价值发现方法
CN108596678A (zh) * 2018-05-02 2018-09-28 陈思恩 一种航空公司旅客价值计算方法
CN109522372A (zh) * 2018-11-21 2019-03-26 北京交通大学 民航领域旅客价值的预测方法
CN110751523A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种潜在高价值旅客的发现方法及装置
KR102096419B1 (ko) * 2019-09-24 2020-04-03 주식회사 옵티마이즈 위치정보와 빅데이터 분석에 기반한 여행 동행 및 상품 제공 시스템 및 방법
CN111368213A (zh) * 2020-03-04 2020-07-03 山西大学 一种民航旅客关系网络的重叠社区结构检测方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060143081A1 (en) * 2004-12-23 2006-06-29 International Business Machines Corporation Method and system for managing customer network value
CN104021189A (zh) * 2014-06-13 2014-09-03 中国民航信息网络股份有限公司 一种民航旅客网络生成方法
CN105631750A (zh) * 2015-12-25 2016-06-01 中国民航信息网络股份有限公司 民航旅客团体发现方法
CN105654337A (zh) * 2015-12-25 2016-06-08 中国民航信息网络股份有限公司 民航旅客价值评估方法
CN107886372A (zh) * 2017-12-06 2018-04-06 中国南方航空股份有限公司 客户价值发现方法
CN108596678A (zh) * 2018-05-02 2018-09-28 陈思恩 一种航空公司旅客价值计算方法
GB201815344D0 (en) * 2018-05-02 2018-11-07 Chen Sien Machine learning system and medium for calculating passenger values of airline
CN109522372A (zh) * 2018-11-21 2019-03-26 北京交通大学 民航领域旅客价值的预测方法
KR102096419B1 (ko) * 2019-09-24 2020-04-03 주식회사 옵티마이즈 위치정보와 빅데이터 분석에 기반한 여행 동행 및 상품 제공 시스템 및 방법
CN110751523A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种潜在高价值旅客的发现方法及装置
CN111368213A (zh) * 2020-03-04 2020-07-03 山西大学 一种民航旅客关系网络的重叠社区结构检测方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
丁建立 等: "一种融合个体属性与社交关系的民航旅客价值度量方法", 《航空学报》, vol. 39, no. 02, pages 1 - 12 *
冯霞 等: "民航旅客社会网络构建方法研究", 《计算机仿真》, vol. 30, no. 06, pages 51 - 54 *
曹卫东 等: "重要节点发现算法在民航旅客社会网络中的应用研究", 《计算机应用与软件》, vol. 33, no. 02, pages 237 - 241 *
林友芳 等: "一种基于社交网络的民航新旅客成长性预测方法", 《北京交通大学学报》, vol. 38, no. 06, pages 40 - 46 *

Also Published As

Publication number Publication date
CN112163786B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN113779384B (zh) 一种基于乘客画像的航班推荐方法
CN108304974B (zh) 一种基于优化C5.0和Apriori的民航NOSHOW预测及强因子分析方法
Canelas et al. Human capital, labour market outcomes, and horizontal inequality in Guatemala
CN110688888B (zh) 一种基于深度学习的行人属性识别方法和系统
CN114595850A (zh) 基于机器学习的政务预约服务推荐方法
CN110378744A (zh) 面向不完备数据系统的民航常旅客价值分类方法及系统
KEELEY A MODEL OF MARITAL FORMATION: THE DETERMINANTS OF THE OPTIMAL AGE AT FIRST MARRIAGE.
Battiston The persistent effects of brief interactions: Evidence from immigrant ships
CN111599219B (zh) 一种基于排序学习的多数据源航班起飞时间预测方法
CN112200625A (zh) 一种航班资源推荐方法及装置
CN114782114A (zh) 一种基于CNN-GRU和SSA-GWO-LightGBM的机票价格预测方法
CN112949926B (zh) 一种基于乘客需求重识别的收入最大化票额分配方法
CN117669837A (zh) 一种机场陆侧换乘交通方式选择预测方法及系统
CN112365062A (zh) 一种民航旅客隐式交互特征挖掘与航班推荐方法及系统
CN112163786A (zh) 一种基于大数据和pagerank算法的民航旅客个人影响力评估方法
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
Jou et al. The asymmetric effects of service quality on passengers' choice of carriers for international air travel
CN111241162A (zh) 高速铁路成网条件下旅客出行行为分析方法及存储介质
CN110619422A (zh) 一种智能车站客流状况预测方法和系统
CN112163787B (zh) 一种基于大数据的旅客相对关系预测方法
CN112836996B (zh) 一种识别乘客潜在购票需求的方法
CN112163716A (zh) 一种基于大数据的旅客绝对关系预测方法
Karl et al. Mapping destination choice: set theory as a methodological tool
CN112163785A (zh) 一种基于大数据和神经网络的民航旅客个人影响力评估方法
CN114491971A (zh) 一种基于混合Logit模型和贝叶斯模型平均的出行行为建模方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant