具体实施方式
以下参考附图详细描述本公开的各个示例性实施例。虽然以下描述示例性方法、装置包括在其它组件当中硬件上执行的软件和/或固件,但应注意,这些示例仅仅是说明性的,不应看作限制。例如,考虑在硬件中独占地、在软件中独占地、或在硬件和软件的任何组合中可以实施任何或所有硬件、软件和固件组件。因此,虽然以下描述示例性方法和装置,但本领域技术人员应容易理解,提供的示例不仅仅是用于实现这些方法和装置方式。
此外,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
本文使用词语“示例性”表示“充当示例、实例或举例说明”。本文中被描述为“示例性”的任何实施例都并非必然解释为对于其它实施例而言是优选的或有优势的。
首先对本申请中用到的一些术语进行说明。赔付率是指保险产品(例如延误险)的赔款支出与保费收入的比率。覆盖率是指保险产品覆盖的保险对象(例如运载班次)与总对象(总运载班次)的比率。业务平衡参数用于指示保险产品的各种标的类型(例如延误险中的不同延误类型,其对应于特定的保费与保额)之间的均衡性。
图1示出依据本发明实施例的用于运载班次分类的示例性方法100的流程图。如流程图所示,方法100包括以下步骤:
步骤S101:通过预测模型使用影响目标时间段内多个运载班次的延误因素来确定该多个运载班次中的每个运载班次针对多个延误类型的延误可能性数据,该多个延误类型基于延误时间段进行划分,该预测模型基于与历史运载班次相对应的历史运载班次信息和历史延误因素而生成。在该步骤中,通过预测模型来确定每个运载班次对不同延误时间段的延误可能性。例如,多个延误类型可以包括延误a小时、延误b小时、延误c小时等。例如,延误可能性数据可以包括延误概率等。例如,生成预测模型的过程可以包括:基于一段历史时期的数据,包括历史运载班次信息和历史延误因素,针对不同延误时间段,以延误时间<a小时为例,将历史数据中延误时间<a小时的记录标记为1,延误时间>=a小时的记录标记为0,随后利用历史数据基于训练算法(例如,机器学习算法等)进行训练来得到预测模型,以确定相应于不同的历史延误因素下延误记录为1的可能性。预测模型可以使用但不限于某种分类或回归训练算法,例如逻辑回归(Logistic Regression)、线性判别分析以及其输出为例如可能性估计的任何算法。
步骤S102:基于延误可能性数据,对该多个运载班次进行分类。在该步骤中,利用所确定的延误可能性数据来对运载班次进行分类,以有助于后续对不同运载班次采取差异化的延误险投放。
可选地,方法100还可以包括以下步骤:基于赔付率、覆盖率、业务平衡参数、以及其它考虑因素中的一个或多个,使用延误可能性数据和历史运载班次信息来确定针对该多个延误类型的投放阈值;以及基于投放阈值和延误可能性数据,针对该多个运载班次选择性地投放延误险。在该步骤中,与现有的延误险设计中统一地投放于所有运载班次不同,基于特定准则(例如,赔付率、覆盖率、业务平衡参数及其组合满足一定条件)确定延误类型的投放阈值,并利用投放阈值来确定是否投放单个运载班次的延误险,从而实现对不同运载班次的差异化的延误险投放,增加了产品对消费者的吸引力并提供了适合长期投放的策略,同时能够满足保险产品本身对该特定准则的要求。可以基于各种优化算法来确定投放阈值,如下文在实施例中举例说明的。在该步骤中,进一步利用基于延误可能性数据和历史运载班次信息而确定的投放阈值来对运载班次进行分类。
进一步地,方法100还可以包括以下步骤:当运载班次被投放延误险时,确定选择该多个延误类型中的一个来投放针对该运载班次的延误险。与现有的延误险设计中将同一延误类型投放于所有运载班次不同,通过对不同运载班次可投放不同延误类型的延误险来实现进一步的差异化投放。
延误因素可以包括但不限于以下中的一个或多个:季节数据、天气数据、运载班次量数据、区域流量数据、以及其它可能影响运载班次延误的数据等。季节数据是与季节相关的数据,例如由于季节变化会影响运载班次的线路和安排等。天气数据可以包括刮风(例如风向风力等)、下雨下雪、气温、气压、能见度(例如雾霾等级)等各种气候因素。运载班次量数据可以包括一定时间内运载班次的数量。区域流量数据可以包括一定区域内各种交通工具的交通流量等,以航班为例,区域流量数据可以包括空域流量等。例如,延误因素可以是从利用大数据架构而存储的数据库或其它数据结构中获得的。
历史延误因素可以包括但不限于以下中的一个或多个:历史季节数据、历史天气数据、历史运载班次量数据、历史区域流量数据、以及其它可能影响历史运载班次延误的数据等。这些数据可以类似于上文针对延误因素的数据所描述的。历史运载班次信息可以确定历史运载班次的延误情况,其可以包括历史运载班次运行数据等,例如,历史运载班次运行数据可以包括历史运载班次出发和到达时间等。例如,历史延误因素和历史运载班次信息可以是从利用大数据架构而存储的数据库或其它数据结构中获得的。
可选地,方法100还可以包括以下步骤:周期性地更新与历史运载班次相对应的历史运载班次信息和历史延误因素。例如,在一时间段内产生的运载班次相关的延误因素和运载班次信息可以被收集、传输和存储转而被添加到与历史运载班次相关的历史延误因素和历史运载班次信息,使得历史数据可以周期性地进行更新,同时经更新的历史数据可以用于训练预测模型,从而实现预测模型的自动更新。通过历史数据的累积达到预测模型的自学习调整,使得预测的准确性和延误标的动态匹配的合理性都能得到不断的提升。
图2示出依据本发明实施例的用于运载班次分类的示例性装置200的示意图。装置200可以包括:存储器201和耦合到存储器201的处理器202。存储器201用于存储指令,处理器202被配置为基于存储器201存储的指令来实现针对图1所描述的方法的步骤中的任何步骤中的一个或多个。
如图2所示,装置200还可以包括通信接口203,用于与其它设备进行信息交互。此外,装置200还可以包括总线204,存储器201、处理器202和通信接口203通过总线204来彼此进行通信。
存储器201可以包括易失性存储器,也可以包括非易失性存储器。处理器202可以是中央处理器(CPU)、微控制器、专用集成电路(ASIC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、或是被配置为实现本发明的实施例的一个或多个集成电路。
为了更好地表达本发明的构思,下面结合一个具体的示例来进行说明。
图3示出依据本发明的实施例的用于运载班次分类的方法的一个具体示例300。
在示例300中,以运载班次是航班为例,与目标时间段内(例如,计划T+1(单位:天)时刻起飞)若干航班302相关的数据可以被存储在大数据设备304上,从大数据设备304中可以提取出影响航班302的延误因素306,以及与历史航班相关的历史延误因素308和历史航班信息310。延误因素306可以包括但不限于季节数据、天气数据、航班量数据、空域流量数据、以及其它可能影响航班延误的数据等中的一个或多个。历史延误因素308可以包括但不限于历史季节数据、历史天气数据、航班量数据、空域流量数据、以及其它可能影响历史航班延误的数据等中的一个或多个。历史航班信息310可以包括历史航班运行信息,诸如历史航班起飞和降落时间等。例如,可以根据机器学习算法(例如,逻辑回归、线性判别分析等),基于历史延误因素308和历史航班信息310来训练历史数据得到用于确定延误可能性的预测模型312。随后,将所提取的延误因素306输入到已生成的预测模型312,从而输出若干航班302中每个航班针对不同延误类型的延误可能性数据314,例如将不同延误类型按照时间段从小到大排列,分别为a小时、b小时、c小时等,延误可能性数据314可以包括航班延误a小时以内的概率Pa、延误b小时以内的概率Pb、延误c小时以内的概率Pc等。基于航班延误可能性数据314,对若干航班302进行分类。在一段时间上产生的航班相关数据被收集、传输和存储到大数据设备304,转而对与历史航班相关的数据进行更新,从而实现数据的闭环更新,同时经更新的数据可以用于训练预测模型312,从而实现预测模型312的自动更新。可选地,可以利用延误可能性数据314和历史航班信息310来确定针对多个延误类型的投放阈值,并基于投放阈值来针对若干航班302选择性(例如,在T时刻投放时间)投放航班延误险。也就是说,可以进一步利用基于航班延误可能性数据314和历史航班信息310而确定的投放阈值来对若干航班302进行分类(未示出)。
可以基于各种优化算法来确定针对多个延误类型的投放阈值,举例说明而非限制,下面给出三种示例性优化算法,但是应当理解,可以使用任何适当的优化算法来确定投放阈值。通常延误类型可以在3至8个,为便于说明,以两个延误类型a小时、b小时为例,确定其对应的投放阈值THa、THb,但是应当理解,这些算法以及本发明的实施例可以适用于更多或更少的延误类型。不失一般性,包含多种延误类型以及不同投放时间、投放目标时间的运载班次延误险全部适用本发明所描述的方法、装置和计算机可读介质。
贪婪算法
贪婪算法通过逐步考虑不同延误类型来确定最优的阈值。首先,寻找延误类型为a小时的延误险对应的阈值THa。设定概率区间间隔,将每一个航班的Pa值归入某一个概率区间,例如以0.005为区间间隔,所有概率大于等于0.9且小于0.905的Pa值都归入概率区间0.9,所有概率大于等于0.905且小于0.91的Pa值都归入概率区间0.905。将所有概率区间值从大到小倒序排列,计算历史参考时段内所有航班在每个概率区间内的收入与赔付(考虑从历史航班信息310确定的历史延误情况),然后按照概率区间值从大到小的顺序统计累积收入与累积赔付。由此寻找一个尽量小的概率区间值,使得累积收入与累积赔付达到期望的赔付率,该值即作为延误类型为a小时的延误险对应的阈值THa。
接着,寻找延误类型为b小时的延误险对应的阈值THb。对于所有航班中Pa<THa的航班,同上类似,将每一个航班的Pb值归入某一个概率区间,寻找一个尽量小的概率区间值,使得累积收入与累积赔付达到期望的赔付率,该值即作为延误类型为b小时的延误险对应的阈值THb。
基于所确定的投放阈值和延误概率,可以采用选择性的投放策略。例如,针对Pa>=THa的航班以及针对Pa<THa且Pb>=THb的航班投放延误险,针对Pa<THa且Pb<THb的航班不投放任何延误险。
进一步地,如果针对Pa>=THa的航班投放a小时延误险,针对Pa<THa且Pb>=THb的航班投放b小时延误险,针对Pa<THa且Pb<THb的航班不投放任何延误险,则对于贪婪算法,能在适当的赔付率下覆盖最多的航班,即使得覆盖率最大化。
模拟退火算法
模拟退火算法将不同延误类型合并考虑,通过设置目标函数并且求它的最小值,同时获得多个最优的阈值。在目标函数的设置上,可以考虑覆盖率、赔付率,并且可以设置惩罚项保证不同延误类型之间的均衡性,对赔付率做出一定的限制等。
例如,目标函数可以是如下:
f=-收益权重*(∑Pa≥THa的航班收益+∑Pa<THa且Pb≥THb的航班收益) (1)
-覆盖权重*∑Pa≥THa或(Pa<THa且Pb≥THb)的航班的数量 (2)
+级差权重*|∑Pa≥THa的航班的数量-∑Pa<THa且Pb≥THb的航班的数量| (3)
此处待求参数为阈值THa和THb,其中,收益权重、覆盖权重和级差权重可以预先设定,以用于调整目标函数各项体量之间的平衡。考虑从历史航班信息310确定的历史延误情况,对于航班收益的计算,如果赔付,航班收益=保费-保额,如果不赔付,航班收益=保费。航班总收益=保费*投放且购买的航班量-保额*需要赔付的航班量。
采用前述的投放策略,目标函数f包括三项,第一项(1),即-收益权重*(投放且购买延误类型为a小时险种的航班总收益+投放且购买延误类型为b小时险种的航班总收益),为与赔付率有关的项;第二项(2),即-覆盖权重*(投放且购买延误类型为a小时和b小时两种险种的航班总量),与覆盖率有关;第三项(3),即级差权重*(投放且购买a小时和b小时两种险种的的航班差额),为与业务平衡参数有关的项。此处第一项(1)与第二项(2)为负,表示在求目标函数的最小值时获得尽可能大的收益值(低的赔付率)与高的覆盖率,而第三项(3)为正,表示希望两个延误类型险种的航班差额尽可能小,即达到一定的业务平衡参数。对于该示例性模拟退火算法而言,其目标函数f可以基于赔付率、覆盖率和业务平衡参数来确定投放阈值。然而,也可以设计其它目标函数,使得基于赔付率、覆盖率、业务平衡参数、以及其它考虑因素等中的一个或多个来确定投放阈值。
混合整数规划算法
混合整数规划算法将是否投放某延误类型险种作为一个0或者1的整数变量与各延误类型险种的投放阈值共同求解,约束条件中体现各延误类型时间的延误概率与所求阈值的比较。
例如,目标函数可以是如下:
约束条件可以是如下:
xi,1+xi,2+xi,3=1 (5)
Pai≥THa-M*(1-xi,1) (6)
Pbi≥THb-M*(1-xi,2) (7)
Pai≤THa-ε+M*xi,1 (8)
Pbi≤THb-ε+M*(xi,1+xi,2) (9)
此处待求参数为阈值THa和THb,其中,xi,1、xi,2、xi,3分别为第i个航班投放延误类型为a小时险种、投放延误类型为b小时险种与不投放的表征值,取0或者1两个值之一,i遍历1到航班总量之间的所有整数值。如果xi,1=1,表示投放延误类型为a小时险种,如果xi,1=0,表示不投放延误类型为a小时险种,以此类推。收益i,j表示第i个航班在不同xi,j下的收益(考虑从历史航班信息310确定的历史延误情况)。M为一个较大的正数(例如100),ε为一个极小的正数(例如,10-5)。
采用前述的投放策略,在上述约束条件中,公式(5)表示第i个航班在投放a小时险种、投放b小时险种与不投放这三种方案中只能选其一且必须选其一;公式(6)表示如果投放a小时险种,即a小时险种的投放值=1,Pa>=THa;公式(7)和(8)表示如果不投放a小时险种而投放b小时险种,即a小时险种的投放值=0,b小时险种的投放值=1,Pa<THa而且Pb>=THb;公式(9)表示如果a小时险种和b小时险种均不投放,Pa<THa而且Pb<THb。对于该示例性混合整数规划算法而言,此处公式(4)的目标函数f只考虑了收益的最大化(低的赔付率),与模拟退火算法类似,可以设计其它目标函数,使得基于赔付率、覆盖率、业务平衡参数、以及其它考虑因素中的一个或多个来确定投放阈值。
应当理解,以上所描述的投放策略仅是说明性的而非限制性的。更一般而言,可以设计各种目标函数,使得一旦得到每一个延误类型的投放阈值,基于延误可能性数据(例如,延误概率)与投放阈值,以任何方式来实现针对单个航班的延误险延误类型的选择。例如,对延误概率较低的航班,选择较低延误类型时间起赔,延误概率适中的航班,以适中的延误类型起赔,延误概率较高的航班,以较高延误类型时间起赔或者不投放。
图4示出了依据本发明实施例的延误险投放的收益图,该收益图描绘了在各种投放情况下的航班延误险每日收益曲线。如上文所描述的,预测模型可以周期性地进行更新,假定在一段时间内预测模型的表现总体稳定,航班的总体延误情况不发生较大突变,客户的航班延误险购买分布较为稳定,那么可以利用过去一段时间(例如,过去1个月、过去1周等)的最优投放方式(也就是说,基于过去一段时间所确定的投放阈值)来作为简单的投放策略,即“简单策略”。如果投放阈值随时间不断更新,利用该投放阈值得到的最优投放方式为“当前策略”。作为比较,另外示出了“最优可能收益”和“无策略”情况下的收益曲线,“最优可能收益”表示在获得航班的实际延误情况下确定投放阈值得到的最佳收益,“无策略”表示不考虑航班特点统一投放延误险而不采用上述的投放策略得到的收益。从图4中可以看出,与“无策略”相比,“当前策略”和“简单策略”能获得更好的投放效果,并且“当前策略”相比“简单策略”有较大优势,特别是在整体延误率较高,收益负值比较大的时期更接近最优可能收益。
本发明通过预测模型来确定运载班次延误可能性,有助于针对不同运载班次采用选择性的延误险投放,从而在赔付率、覆盖率和业务平衡参数等方面得到改进。同时,与传统的延误险产品设计相比,本发明充分考虑到运载班次特点,有效地对运载班次有所区分,全部处理都可由计算机处理完成,不需要人工干预,时间效率较高。
此外,替代地,上述的用于运载班次分类的方法能够通过计算机程序产品,即有形的计算机可读存储介质来实现。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
此外,用于执行本公开的各个方面的计算机可读程序指令或者计算机程序产品也能够存储在云端,在需要调用时,用户能够通过移动互联网、固网或者其它网络访问存储在云端上的用于执行本公开的各个方面的计算机可读程序指令,从而实施依据本公开的各个方面所公开的技术方案。
以上所述仅为本公开的可选实施例,并不用于限制本公开的实施例,对于本领域的技术人员来说,本公开的实施例可以有各种更改和变化。凡在本公开的实施例的精神和原则之内,所作的任何修改、等效替换、改进等,均应包含在本公开的实施例的保护范围之内。
虽然已经参考若干具体实施例描述了本公开的实施例,但是应该理解,本公开的实施例并不限于所公开的具体实施例。本公开的实施例旨在涵盖在所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。