CN112819285B - 航班的匹配处理、训练方法、装置和设备 - Google Patents

航班的匹配处理、训练方法、装置和设备 Download PDF

Info

Publication number
CN112819285B
CN112819285B CN202110009544.4A CN202110009544A CN112819285B CN 112819285 B CN112819285 B CN 112819285B CN 202110009544 A CN202110009544 A CN 202110009544A CN 112819285 B CN112819285 B CN 112819285B
Authority
CN
China
Prior art keywords
information
model
branch
flight
bound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110009544.4A
Other languages
English (en)
Other versions
CN112819285A (zh
Inventor
刘颖
解鑫
许铭
刘建林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110009544.4A priority Critical patent/CN112819285B/zh
Publication of CN112819285A publication Critical patent/CN112819285A/zh
Application granted granted Critical
Publication of CN112819285B publication Critical patent/CN112819285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了航班的匹配处理、训练方法、装置和设备,涉及计算机技术中的大数据和强化学习。具体实现方案为:获取多个航班信息和多个机型信息;在采用预设的分支定界模型对多个航班信息和多个机型信息进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配;依据每一节点的状态信息,确定航班匹配关系,航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。有效、较快的得到航班信息与机型信息之间的匹配的目的;便于及时完成飞机指派,以避免飞机的延误,进一步的,便于用户的出行。

Description

航班的匹配处理、训练方法、装置和设备
技术领域
本申请涉及计算机技术中的大数据和强化学习,尤其涉及一种航班的匹配处理、训练方法、装置和设备。
背景技术
随着社会的发展和进步,飞机已经成为人们出行的重要交通工具。航空公司需要完成机型指派,各个航班上分配不同机型的飞机。
现有技术中,可以采用完全枚举的方式,对飞机进行指派,进而将航班与飞机的机型进行匹配。
然而现有技术中,在航班数量较大的时候,完全枚举的方式的计算量较大、计算时间较长,不能及时的完成飞机指派,进而导致飞机的延误,进一步的影响到用户的出行。
发明内容
本申请提供了一种用于解决飞机指派较慢的航班的匹配处理、训练方法、装置和设备。
根据本申请的第一方面,提供了一种航班的匹配处理方法,包括:
获取待处理数据,其中,所述待处理数据包括多个航班信息和多个机型信息;
在采用预设的分支定界模型对所述多个航班信息和所述多个机型信息进行匹配处理时,依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;
依据所述每一节点的状态信息,确定航班匹配关系,其中,所述航班匹配关系表征了所述多个航班信息和所述多个机型信息之间的匹配关系。
根据本申请的第二方面,提供了一种分支定界模型的训练方法,包括:
获取样本数据,其中,所述样本数据包括多个样本航班信息和多个样本机型信息;
在采用分支定界初始模型对所述样本数据进行匹配处理时,依据预设的强化学习模型确定所述分支定界初始模型中的每一节点的状态初始信息,以得到所述分支定界模型;其中,所述状态初始信息用于指示样本航班信息与样本机型信息之间的匹配关系;
其中,所述分支定界模型用于依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;所述状态信息用于确定航班匹配关系,其中,所述航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
根据本申请的第三方面,提供了一种航班的匹配处理装置,包括:
获取单元,用于获取待处理数据,其中,所述待处理数据包括多个航班信息和多个机型信息;
第一确定单元,用于在采用预设的分支定界模型对所述多个航班信息和所述多个机型信息进行匹配处理时,依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;
第二确定单元,用于依据所述每一节点的状态信息,确定航班匹配关系,其中,所述航班匹配关系表征了所述多个航班信息和所述多个机型信息之间的匹配关系。
根据本申请的第四方面,提供了一种分支定界模型的训练装置,包括:
获取单元,用于获取样本数据,其中,所述样本数据包括多个样本航班信息和多个样本机型信息;
确定单元,用于在采用分支定界初始模型对所述样本数据进行匹配处理时,依据预设的强化学习模型确定所述分支定界初始模型中的每一节点的状态初始信息,以得到所述分支定界模型;其中,所述状态初始信息用于指示样本航班信息与样本机型信息之间的匹配关系;
其中,所述分支定界模型用于依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;所述状态信息用于确定航班匹配关系,其中,所述航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
根据本申请的第五方面,提供一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一方法。
根据本申请的第六方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述任一方法。
根据本申请的第七方面,提供了一种计算机程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面或第二方面所述的方法。
根据本申请的技术方案,在采用预设的分支定界模型对多个航班信息和多个机型信息进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配;可知,基于强化学习模型去生成分支定界模型中的每一节点,每一节点具有状态信息。由于分支定界模型的每一节点的状态信息,指示出了一个航班信息与一个机型信息之间的匹配关系。进而可以基于分支定界模型,输出多个航班信息和多个机型信息之间的匹配关系,即,得到航班匹配关系。结合于分支定界模型和强化学习模型,分析出航班信息与机型信息之间的匹配关系,在航班量较大时,可以降低计算量和计算时间;进而,及时的完成飞机指派,防止飞机的延误;进一步的,便于用户的出行。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为时空网络法得到航班信息与机型信息之间的匹配的示意图;
图2是根据本申请第一实施例的示意图;
图3为本申请实施例提供的分支定界模型的示意图一
图4是根据本申请第二实施例的示意图;
图5为本申请实施例提供的分支定界模型的示意图二;
图6是根据本申请第三实施例的示意图;
图7是根据本申请第四实施例的示意图;
图8是根据本申请第五实施例的示意图;
图9是根据本申请第六实施例的示意图;
图10示出了可以用来实施本申请的实施例的示例电子设备1000的示意性框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
随着社会的发展和进步,飞机已经成为人们出行的重要交通工具。航空公司需要完成机型指派,各个航班上分配不同机型的飞机。并且,由于不同机型的飞机的成本不同(包括了运行成本、维护成本、等等),而不同机型的飞机的载客量是不同的,进而航空公司需要根据为不同的航班合理的分派不同机型的飞机,去提高飞机的资源使用率、并且控制成本。
一个示例中,可以采用完全枚举的方式,对飞机进行指派。完全枚举的方式,指的是,可以列举所有的解,然后依据所有的解,去选择最优解。具体来说,列举出所有的匹配方式,匹配方式指的是各个航班信息与各个机型信息之间的匹配,即,各个航班与飞机的各个机型之间的匹配;然后基于所有的匹配方式,基于成本最低,去确定出一种最低成本的匹配方式。
然而上述完全枚举的方式中,在航班数量较大的时候,完全枚举的方式的计算量较大、计算时间较长,不能及时的完成飞机指派,进而导致飞机的延误,进一步的影响到用户的出行。
一个示例中,可以采用连接网络法或者时空网络法,得到最优的匹配方式,其中,时空网络法是较为常用的方法。图1为时空网络法得到航班信息与机型信息之间的匹配的示意图,如图1所示,有3种机型,分别为B737-400、B757-200、B737-800;每一个城市为一个机场站点,例如分别有城市A、城市B、城市C、城市D和城市E;每一个城市具有多个航班(每一个时间为一个航班的开始起飞时间);基于现有的时空网络法可以求解出航班信息与机型信息之间的匹配。
然而上述时空网络法的方式中,也是在航班数量较大的时候,完全枚举的方式的计算量较大、计算时间较长,不能及时的完成飞机指派,进而导致飞机的延误,进一步的影响到用户的出行。
一个示例中,可以采用遗传算法求解出最优的匹配方式,最优的匹配方式,指的是在成本最低下的各个航班信息与各个机型信息之间的匹配方式。
然而上述遗传算法中,在航班数量较大的时候无法在段时间内给出最优的匹配方式。
可知,在上述各个方式中,在航班数量较大的时候,匹配的计算量较大、计算时间较长,不能及时的完成飞机指派,进而导致飞机的延误,进一步的影响到用户的出行。
本申请提供一种航班的匹配处理、训练方法、装置和设备,应用于计算机技术中的大数据和强化学习,以达到有效、较快的得到航班信息与机型信息之间的匹配的目的;便于及时完成飞机指派,以避免飞机的延误,进一步的,便于用户的出行。
图2是根据本申请第一实施例的示意图,如图2所示,本实施例提供的航班的匹配处理方法,包括:
201、获取待处理数据,其中,待处理数据包括多个航班信息和多个机型信息。
示例性地,本实施例的执行主体可以是电子设备,其中,电子设备可以是终端设备、或者服务器、或者是其他可以执行本实施例方法的装置或设备。
首先将多个航班信息和多个机型信息,构成待处理数据。其中,航班信息,可以简称为航班;机型信息,可以简称为机型。举例来说,有航班a、航班b、航班c、航班d、航班e;具有机型1、机型2、机型3、机型4、机型5。其中,各个航班可以分布在同一城市、或者分布在不同城市。
202、在采用预设的分支定界模型对多个航班信息和多个机型信息进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配。
示例性地,预先建立有分支定界模型,分支定界模型基于分支定界(Branch AndBound)方法进行实现。可以将待处理数据输入到分支定界模型中。图3为本申请实施例提供的分支定界模型的示意图一,如图3所示,分支定界模型需要生成多个节点,例如,图3中包括节点A、节点B、节点C、节点D和节点E,分支定界模型的每一个节点的状态信息,可以指示出一个航班信息与一个机型信息之间的匹配关系。
在确定分支定界模型的每一个节点的状态信息的时候,可以采用强化学习(Reinforcement Learning)模型去确定。其中,强化学习模型可以采用任一强化学习模型,例如有DQN(Deep Q Network,简称DQN)模型。
可知,在上述过程中,需要生成分支定界模型的各个节点,基于强化学习模型为每一个节点配置了状态信息,每一节点的状态信息指示出了一个航班信息与一个机型信息之间的匹配关系。
203、依据每一节点的状态信息,确定航班匹配关系,其中,航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
示例性地,由于分支定界模型的每一节点的状态信息,指示出了一个航班信息与一个机型信息之间的匹配关系。进而可以基于分支定界模型,输出多个航班信息和多个机型信息之间的匹配关系,即,得到航班匹配关系。
例如,在图3中,节点A的状态信息指示出了航班a与机型1之间匹配,节点B的状态信息指示出了航班b与机型2之间匹配,节点C的状态信息指示出了航班c与机型1之间匹配,节点D的状态信息指示出了航班d与机型2之间匹配,节点E的状态信息指示出了航班e与机型3之间匹配。
本实施例中,在采用预设的分支定界模型对多个航班信息和多个机型信息进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配;可知,基于强化学习模型去生成分支定界模型中的每一节点,每一节点具有状态信息。由于分支定界模型的每一节点的状态信息,指示出了一个航班信息与一个机型信息之间的匹配关系。进而可以基于分支定界模型,输出多个航班信息和多个机型信息之间的匹配关系,即,得到航班匹配关系。结合于分支定界模型和强化学习模型,分析出航班信息与机型信息之间的匹配关系,在航班量较大时,可以降低计算量和计算时间;进而,及时的完成飞机指派,防止飞机的延误;进一步的,便于用户的出行。
图4是根据本申请第二实施例的示意图,如图4所示,本实施例提供的航班的匹配处理方法,包括:
401、在采用分支定界初始模型对样本数据进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态初始信息,以得到分支定界模型;其中,状态初始信息用于指示样本航班信息与样本机型信息之间的匹配。
一个示例中,分支定界模型是依据强化学习模型对样本数据进行分支定界初始模型进行训练之后所得到的,样本数据包括多个样本航班信息和多个样本机型信息。
本实施例的执行主体可以是电子设备,其中,电子设备可以是终端设备、或者服务器、或者是其他可以执行本实施例方法的装置或设备。
在对待处理数据(包括多个航班信息和多个机型信息)进行匹配处理之前,可以先去生成分支定界模型。
本步骤可以参见图6的介绍,不再赘述。由于基于样本数据可以得到分支定界模型,即,对分支定界初始模型进行初步的界限值的处理。
402、获取待处理数据,其中,待处理数据包括多个航班信息和多个机型信息。
示例性地,首先将多个航班信息和多个机型信息,构成待处理数据。其中,航班信息,可以简称为航班;机型信息,可以简称为机型。
403、在采用预设的分支定界模型对多个航班信息和多个机型信息进行匹配处理时,重复以下各步骤,直至达到预设条件:针对分支定界模型中的当前节点,依据强化学习模型确定当前节点的界限值;根据当前节点的界限值,确定分支定界模型中的当前节点的状态信息,并生成分支定界模型中的当前节点的下一节点。状态信息用于指示航班信息与机型信息之间的匹配。
一个示例中,步骤403中的“针对分支定界模型中的当前节点,依据强化学习模型确定当前节点的界限值”,包括:针对分支定界模型中的当前节点,依据强化学习模型确定当前节点的奖励值,奖励值用于指示界限值的调节方式;根据当前节点的奖励值,确定分支定界模型中的当前节点的界限值。
一个示例中,预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、待处理数据均被匹配完毕。
示例性地,可以将待处理数据输入到分支定界模型中。需要确定出分支定界模型中每一个节点的状态信息。一个示例中,针对分支定界模型的第一个节点,依据强化学习模型计算出该第一个节点的界限值,界限值也可以称为节点对应的上下界值(即,上界值和下界值),然后依据该第一个节点的界限值,对第一个节点的状态信息进行约束,进而就可以得到第一个节点的状态信息。然后,生成第二个节点,针对第二个节点,参照上述方式得到第二个节点的状态信息。以此类推,求解出每一个节点的状态信息。上述过程中,基于强化学习模型确定出分支定界模型的每一个节点的界限值,界限值可以对节点的状态信息进行约束,进而便于确定出节点的状态信息。
一个示例中,分支定界模型的每一节点的状态信息包括第一匹配信息或第二匹配信息;其中,第一匹配信息用于指示航班信息与机型信息之间的匹配关系,第二匹配信息用于指示机型信息与机场站点之间的匹配关系。
可知,分支定界模型中的每一节点的状态信息,可以是第一匹配信息或第二匹配信息。可知,分支定界模型中的部分节点的状态信息,是第一匹配信息;部分节点的状态信息,是第二匹配信息。从而,在生成了分支定界模型中的每一节点的状态信息之后,就可以直接获取航班信息与机型信息之间的匹配关系、机型信息与机场站点之间的匹配关系。
一个示例中,步骤403可以执行以下过程。首先,将待处理数据输入到分支定界模型中。针对分支定界模型中的第一个节点,采用强化学习模型计算出第一个节点的奖励值,其中,奖励值用于指示界限值的调节方式,例如,奖励值用于指示将界限值的上限增大、或者将界限值的下限再降低。然后,针对于第一个节点,依据第一个节点的奖励值,确定第一个节点的界限值。接着,依据第一个节点的界限值,确定出第一个节点的状态信息,第一个节点的状态信息可以指示出航班信息与机型信息之间的匹配关系,或者,第一个节点的状态信息可以指示出机型信息与机场站点之间的匹配关系。然后生成第二个节点,针对第二个节点,重复以上过程。依次类推,直至得到各个航班信息与各个机型信息之间的匹配关系。上述过程中,强化学习模型所确定出每一个节点的奖励值,可以是一个依据强化学习模型中的函数所确定出来的,该奖励值用于约束每一个节点的上下界(即,界限值),进而约束每一个节点的选择(例如,哪一个航班信息与哪一个机型信息匹配,哪一个机型信息与哪一个机场站点匹配)。
在上述过程中,可以在重复执行了一个最大重复执行次数之后,就停止,进而防止分支定界模型的计算量过大。或者,在分支定界模型的节点总个数,已经达到最大节点个数时,就停止,进而防止分支定界模型的节点个数过大。或者,在确定待处理数据中所有的航班信息和所有的机型信息都被匹配完毕时(此时,是一种“待处理数据均被匹配完毕”的方式)就停止;或者,在确定待处理数据中所有的航班信息都被匹配了机型时(此时,是另一种“待处理数据均被匹配完毕”的方式),就停止;进而保证所有的航班信息都被匹配了机型。
举例来说,分支定界模型在每一次处理一个节点时,可以参照以下方式。图5为本申请实施例提供的分支定界模型的示意图二,如图5所示,图5中图(a)为分支定界模型处于一种状态St,此时分支定界模型中包括节点A、节点B、节点C、节点D和节点E,节点A可以为起始节点(先不具有状态信息);
节点B的状态信息为x1,1,表征航班1与机型1匹配,且节点B具有x1,1≤0,表征节点B界限值为小于等于0;节点C的状态信息为x1,1,表征航班1与机型1匹配,且节点C具有x1,1≥1,表征节点C界限值为大于等于1;节点D的状态信息为G1,2,表征机型1与机场站点2匹配,且节点D具有G1,2≤0,表征节点D界限值为小于等于0;节点E的状态信息为G1,2,表征机型1与机场站点2匹配,且节点E具有G1,2≥1,表征节点E界限值为大于等于1。然后,基于强化学习模型,得到节点E的下一个节点F和节点G,其中,节点F的状态信息为x1,2,表征航班1与机型2匹配,且节点F具有x1,2≤0,表征节点F界限值为小于等于0;节点G的状态信息为x1,2,表征航班1与机型2匹配,且节点G具有x1,2≥1,表征节点G界限值为大于等于1。可知图5中的图(b)是分支定界模型处于下一个状态St+1。其中,t为大于等于1的正整数。
其中,强化学习模型可以得到下述信息:state,表征节点的状态;
action,选择出要拆分的下一个变量,即,航班信息与机型信息之间的匹配关系,还是机型信息与机场站点之间的匹配关系。reward,表征上述奖励值。
404、依据每一节点的状态信息,确定航班匹配关系,其中,航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
示例性地,由于分支定界模型的每一节点的状态信息,指示出了一个航班信息与一个机型信息之间的匹配关系。进而可以基于分支定界模型,输出多个航班信息和多个机型信息之间的匹配关系,即,得到航班匹配关系。
405、依据航班匹配关系、以及与每一航班信息对应的预设成本信息,确定航班飞行成本;其中,每一航班信息与不同的机型信息匹配时,与每一航班信息对应的预设成本信息不同。
示例性地,在一个航班信息与不同的机型信息匹配时,该航班信息的预设成本信息是不同的,在步骤404之后,已经得到了多个航班信息和多个机型信息之间的匹配关系,然后依据各预设成本信息,可以进行求和计算,得到航班飞行成本。
在本实施例的分支定界模型中,可以得到航班飞行成本为min∑i∈Mj∈Nxi,jCi,j(称为公式1)。i用于指示航班信息(即,i用于指示航班),j用于指示机型信息(即,j用于指示机型)。M、N均为大于等于1的整数,i、j均为大于等于1的整数。其中,xi,j表征航班信息i与机型信息j之间匹配;Ci,j表征在航班信息i与机型信息j之间匹配的时候,预设成本信息是多少,Ci,j为正数。
其中,公式1具有以下约束条件:∑j∈NXi,j=1(称为公式2),xi,j取0或者1;公式2保证一个航班只能分配给一个机型。Gk-,j+∑j∈NSi,kxi,j=Gk,j(称为公式3),公式3的Gk,j表征的飞机的平衡数量;Gk-,j表征机场站点k目前停靠的飞机数量,Si,k的取值为1或者-1,其中,Si,k的取值为1则表征进入机场站点k的飞机数量,Si,k的取值为-1则表征进入离开机场站点k的飞机数量。∑k∈CGk,j≤Nj(称为公式4),表征Nj表征机型j的飞机总数量。xi,j∈{0,1}(称为公式5),表征xi,j取0或者1。Gk,j∈Z+(称为公式6),表征整数显示,Z表征自然正整数。k、C均为大于等于1的正整数。
406、根据航班飞行成本,生成并显示提示信息。
示例性地,在生成了航班飞行成本之后,可以生成并显示一个提示信息。提示信息包括有上述航班飞行成本,进而提醒工作人员成本的总数量。
本实施例中,通过针对分支定界模型中的当前节点,依据强化学习模型确定当前节点的奖励值,奖励值用于指示界限值的调节方式;根据当前节点的奖励值,确定分支定界模型中的当前节点的界限值。进而分析出述分支定界模型中的当前节点的状态信息,而状态信息用于指示航班信息与机型信息之间的匹配,进而便于确定出多个航班信息和多个机型信息之间的匹配关系。进一步的生成航班飞行成本。结合于分支定界模型和强化学习模型,分析出航班信息与机型信息之间的匹配关系,在航班量较大时,可以降低计算量和计算时间;进而,及时的完成飞机指派,防止飞机的延误;进一步的,便于用户的出行。
图6是根据本申请第三实施例的示意图,如图6所示,本实施例提供的航班的匹配处理方法,包括:
601、获取样本数据,其中,样本数据包括多个样本航班信息和多个样本机型信息。
示例性地,本实施例的执行主体可以是电子设备,其中,电子设备可以是终端设备、或者服务器、或者是其他可以执行本实施例方法的装置或设备。
首先将多个样本航班信息和多个样本机型信息,构成样本数据。其中,航班信息,可以简称为航班;机型信息,可以简称为机型。
602、在采用分支定界初始模型对样本数据进行匹配处理时,依据预设的强化学习模型确定分支定界初始模型中的每一节点的状态初始信息,以得到分支定界模型;其中,状态初始信息用于指示样本航班信息与样本机型信息之间的匹配关系;其中,分支定界模型用于依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配;状态信息用于确定航班匹配关系,其中,航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
一个示例中,步骤602中的“依据预设的强化学习模型确定分支定界初始模型中的每一节点的状态初始信息,以得到分支定界模型”,包括:重复以下各步骤,直至达到预设条件:针对分支定界初始模型中的当前节点,依据强化学习模型确定当前节点的界限值;根据当前节点的界限值,确定分支定界初始模型中的当前节点的状态初始信息,并生成分支定界初始模型中的当前节点的下一节点。
一个示例中,针对分支定界初始模型中的当前节点,依据强化学习模型确定当前节点的界限值,包括:针对分支定界初始模型中的当前节点,依据强化学习模型确定当前节点的奖励值,奖励值用于指示界限值的调节方式;根据当前节点的奖励值,确定分支定界初始模型中的当前节点的界限值。
示例性地,可以将样本数据输入到分支定界初始模型中。需要确定出分支定界初始模型中每一个节点的状态初始信息。一个示例中,针对分支定界初始模型的第一个节点,依据强化学习模型计算出该第一个节点的界限值,界限值也可以称为节点对应的上下界值(即,上界值和下界值),然后依据该第一个节点的界限值,对第一个节点的状态初始信息进行约束,进而就可以得到第一个节点的状态初始信息。然后,生成第二个节点,针对第二个节点,参照上述方式得到第二个节点的状态初始信息。以此类推,求解出每一个节点的状态初始信息。上述过程中,基于强化学习模型确定出分支定界初始模型的每一个节点的界限值,界限值可以对节点的状态初始信息进行约束,进而便于确定出节点的状态初始信息。
一个示例中,分支定界初始模型的每一节点的状态初始信息包括第一匹配状态或第二匹配状态;其中,第一匹配状态用于指示样本航班信息与样本机型信息之间的匹配关系,第二匹配状态用于指示样本机型信息与样本机场站点之间的匹配关系。从而,在生成了分支定界模型中的每一节点的状态初始信息之后,就可以直接获取样本航班信息与样本机型信息之间的匹配关系、样本机型信息与样本机场站点之间的匹配关系;本实施例的训练过程,可以为上述实施例的待处理数据的匹配过程,进行准备,即,对分支定界初始模型的各节点的界限值进行限制。
可知,分支定界初始模型中的每一节点的状态初始信息,可以是第一匹配状态或第二匹配状态。可知,分支定界初始模型中的部分节点的状态初始信息,是第一匹配状态;部分节点的状态初始信息,是第二匹配状态。
一个示例中,步骤602可以执行以下过程。首先,将样本数据输入到分支定界初始模型中。针对分支定界初始模型中的第一个节点,采用强化学习模型计算出第一个节点的奖励值,其中,奖励值用于指示界限值的调节方式,例如,奖励值用于指示将界限值的上限增大、或者将界限值的下限再降低。然后,针对于第一个节点,依据第一个节点的奖励值,确定第一个节点的界限值。接着,依据第一个节点的界限值,确定出第一个节点的状态初始信息,第一个节点的状态初始信息可以指示出样本航班信息与样本机型信息之间的匹配关系,或者,第一个节点的状态初始信息可以指示出机型信息与机场站点之间的匹配关系。然后生成第二个节点,针对第二个节点,重复以上过程。依次类推,直至得到各个样本航班信息与各个样本机型信息之间的匹配关系。上述过程中,强化学习模型所确定出每一个节点的奖励值,可以是一个依据强化学习模型中的函数所确定出来的,该奖励值用于约束每一个节点的上下界(即,界限值),进而约束每一个节点的选择(例如,哪一个样本航班信息与哪一个样本机型信息匹配,哪一个样本机型信息与哪一个样本机场站点匹配)。
一个示例中,预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、样本数据均被匹配完毕。航班匹配关系用于确定航班飞行成本。
在上述过程中,可以在重复执行了一个最大重复执行次数之后,就停止,进而防止分支定界初始模型的计算量过大。或者,在分支定界初始模型的节点总个数,已经达到最大节点个数时,就停止,进而防止分支定界初始模型的节点个数过大。或者,在确定样本数据中所有的样本航班信息和所有的样本机型信息都被匹配完毕时(此时,是一种“样本数据均被匹配完毕”的方式)就停止;或者,在确定样本数据中所有的样本航班信息都被匹配了机型时(此时,是另一种“样本数据均被匹配完毕”的方式),就停止;进而保证所有的样本航班信息都被匹配了机型。
通过本实施例的上述过程,可以得到分支定界模型,即,对分支定界初始模型进行初步的界限值的处理。然后就可以基于分支定界模型和强化学习模型,对待处理数据的航班信息和机型信息进行匹配,可以参见上述各实施例,不再赘述。
本实施例中,在采用分支定界初始模型对样本数据进行匹配处理时,依据预设的强化学习模型确定分支定界初始模型中的每一节点的状态初始信息,以得到分支定界模型;其中,状态初始信息用于指示样本航班信息与样本机型信息之间的匹配关系。进而,得到分支定界模型,即,对分支定界初始模型进行初步的界限值的处理;此时,基于样本数据,可以分支定界初始模型进行初步的界限值的处理,进而保证后续基于分支定界模型和强化学习模型,对待处理数据的航班信息和机型信息进行匹配的时候,可以加快对待处理数据的分析过程,进而,在航班量较大时,可以降低计算量和计算时间;进而,及时的完成飞机指派,防止飞机的延误;进一步的,便于用户的出行。
图7是根据本申请第四实施例的示意图,如图7所示,本实施例提供航班的匹配处理装置700,包括:
获取单元701,用于获取待处理数据,其中,待处理数据包括多个航班信息和多个机型信息。
第一确定单元702,用于在采用预设的分支定界模型对多个航班信息和多个机型信息进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配。
第二确定单元703,用于依据每一节点的状态信息,确定航班匹配关系,其中,航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
本实施例的装置,可以执行上述方法中的技术方案,其具体实现过程和技术原理相同,此处不再赘述。
图8是根据本申请第五实施例的示意图,如图8所示,本实施例提供航班的匹配处理装置800,包括:
获取单元801,用于获取待处理数据,其中,待处理数据包括多个航班信息和多个机型信息。
第一确定单元802,用于在采用预设的分支定界模型对多个航班信息和多个机型信息进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配。
第二确定单元803,用于依据每一节点的状态信息,确定航班匹配关系,其中,航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
一个示例中,第一确定单元802,包括:
执行模块8021,用于重复以下各步骤,直至达到预设条件。
第一确定模块8022,用于针对分支定界模型中的当前节点,依据强化学习模型确定当前节点的界限值。
第二确定模块8023,用于根据当前节点的界限值,确定分支定界模型中的当前节点的状态信息,并生成分支定界模型中的当前节点的下一节点。
一个示例中,第一确定模块8022,包括:
第一确定子模块,用于针对分支定界模型中的当前节点,依据强化学习模型确定当前节点的奖励值,奖励值用于指示界限值的调节方式。
第二确定子模块,用于根据当前节点的奖励值,确定分支定界模型中的当前节点的界限值。
一个示例中,分支定界模型的每一节点的状态信息包括第一匹配信息或第二匹配信息;其中,第一匹配信息用于指示航班信息与机型信息之间的匹配关系,第二匹配信息用于指示机型信息与机场站点之间的匹配关系。
一个示例中,预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、待处理数据均被匹配完毕。
一个示例中,本实施例提供航班的匹配处理装置800,还包括:
第三确定单元804,用于在第二确定单元依据每一节点的状态信息,确定航班匹配关系之后,依据航班匹配关系、以及与每一航班信息对应的预设成本信息,确定航班飞行成本;其中,每一航班信息与不同的机型信息匹配时,与每一航班信息对应的预设成本信息不同。
显示单元805,用于根据航班飞行成本,生成并显示提示信息。
一个示例中,分支定界模型是依据强化学习模型对样本数据进行分支定界初始模型进行训练之后所得到的,样本数据包括多个样本航班信息和多个样本机型信息。
一个示例中,本实施例提供航班的匹配处理装置800,还包括:
训练单元806,用于在采用分支定界初始模型对样本数据进行匹配处理时,依据预设的强化学习模型确定分支定界模型中的每一节点的状态初始信息,以得到分支定界模型;其中,状态初始信息用于指示样本航班信息与样本机型信息之间的匹配。
本实施例的装置,可以执行上述方法中的技术方案,其具体实现过程和技术原理相同,此处不再赘述。
图9是根据本申请第六实施例的示意图,如图9所示,本实施例提供分支定界模型的训练装置900,包括:
获取单元901,用于获取样本数据,其中,样本数据包括多个样本航班信息和多个样本机型信息。
确定单元902,用于在采用分支定界初始模型对样本数据进行匹配处理时,依据预设的强化学习模型确定分支定界初始模型中的每一节点的状态初始信息,以得到分支定界模型;其中,状态初始信息用于指示样本航班信息与样本机型信息之间的匹配关系。
其中,分支定界模型用于依据预设的强化学习模型确定分支定界模型中的每一节点的状态信息,状态信息用于指示航班信息与机型信息之间的匹配;状态信息用于确定航班匹配关系,其中,航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系。
一个示例中,确定单元902包括:
执行模块,用于重复以下各步骤,直至达到预设条件。
第一确定模块,用于针对分支定界初始模型中的当前节点,依据强化学习模型确定当前节点的界限值。
第二确定模块,用于根据当前节点的界限值,确定分支定界初始模型中的当前节点的状态初始信息,并生成分支定界初始模型中的当前节点的下一节点。
一个示例中,第一确定模块包括:
第一确定子模块,用于针对分支定界初始模型中的当前节点,依据强化学习模型确定当前节点的奖励值,奖励值用于指示界限值的调节方式。
第二确定子模块,用于根据当前节点的奖励值,确定分支定界初始模型中的当前节点的界限值。
一个示例中,分支定界初始模型的每一节点的状态初始信息包括第一匹配状态或第二匹配状态;其中,第一匹配状态用于指示样本航班信息与样本机型信息之间的匹配关系,第二匹配状态用于指示样本机型信息与样本机场站点之间的匹配关系。
一个示例中,预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、样本数据均被匹配完毕。
一个示例中,航班匹配关系用于确定航班飞行成本。
本实施例的装置,可以执行上述方法中的技术方案,其具体实现过程和技术原理相同,此处不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。可以实现上述任一实施例。
根据本申请的实施例,本申请还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
图10示出了可以用来实施本申请的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图10所示,电子设备1000包括计算单元1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理。例如,在一些实施例中,上述任一实施例的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM1003并由计算单元1001执行时,可以执行上文描述的上述任一实施例的方法的一个或多个步骤。备选地,在其他实施例中,计算单元1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述任一实施例的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (26)

1.一种航班的匹配处理方法,包括:
获取待处理数据,其中,所述待处理数据包括多个航班信息和多个机型信息;
在采用预设的分支定界模型对所述多个航班信息和所述多个机型信息进行匹配处理时,依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;
依据所述每一节点的状态信息,确定航班匹配关系,其中,所述航班匹配关系表征了所述多个航班信息和所述多个机型信息之间的匹配关系;
其中,依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,包括:
重复以下各步骤,直至达到预设条件:
针对所述分支定界模型中的当前节点,依据所述强化学习模型确定所述当前节点的界限值;
根据所述当前节点的界限值,确定所述分支定界模型中的当前节点的状态信息,并生成所述分支定界模型中的当前节点的下一节点。
2.根据权利要求1所述的方法,其中,针对所述分支定界模型中的当前节点,依据所述强化学习模型确定所述当前节点的界限值,包括:
针对所述分支定界模型中的当前节点,依据所述强化学习模型确定所述当前节点的奖励值,所述奖励值用于指示界限值的调节方式;
根据所述当前节点的奖励值,确定所述分支定界模型中的当前节点的界限值。
3.根据权利要求1所述的方法,其中,所述分支定界模型的每一节点的状态信息包括第一匹配信息或第二匹配信息;
其中,所述第一匹配信息用于指示航班信息与机型信息之间的匹配关系,所述第二匹配信息用于指示机型信息与机场站点之间的匹配关系。
4.根据权利要求1所述的方法,所述预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、所述待处理数据均被匹配完毕。
5.根据权利要求1所述的方法,在依据所述每一节点的状态信息,确定航班匹配关系之后,还包括:
依据所述航班匹配关系、以及与每一航班信息对应的预设成本信息,确定航班飞行成本;其中,每一航班信息与不同的机型信息匹配时,与每一航班信息对应的预设成本信息不同;
根据所述航班飞行成本,生成并显示提示信息。
6.根据权利要求1所述的方法,其中,所述分支定界模型是依据强化学习模型对样本数据进行分支定界初始模型进行训练之后所得到的,所述样本数据包括多个样本航班信息和多个样本机型信息。
7.根据权利要求6所述的方法,所述方法,还包括:
在采用分支定界初始模型对所述样本数据进行匹配处理时,依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态初始信息,以得到所述分支定界模型;其中,所述状态初始信息用于指示样本航班信息与样本机型信息之间的匹配。
8.一种分支定界模型的训练方法,包括:
获取样本数据,其中,所述样本数据包括多个样本航班信息和多个样本机型信息;
在采用分支定界初始模型对所述样本数据进行匹配处理时,依据预设的强化学习模型确定所述分支定界初始模型中的每一节点的状态初始信息,以得到所述分支定界模型;其中,所述状态初始信息用于指示样本航班信息与样本机型信息之间的匹配关系;
其中,所述分支定界模型用于依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;所述状态信息用于确定航班匹配关系,其中,所述航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系;
其中,依据预设的强化学习模型确定所述分支定界初始模型中的每一节点的状态初始信息,以得到所述分支定界模型,包括:
重复以下各步骤,直至达到预设条件:
针对所述分支定界初始模型中的当前节点,依据所述强化学习模型确定所述当前节点的界限值;
根据所述当前节点的界限值,确定所述分支定界初始模型中的当前节点的状态初始信息,并生成所述分支定界初始模型中的当前节点的下一节点。
9.根据权利要求8所述的方法,其中,针对所述分支定界初始模型中的当前节点,依据所述强化学习模型确定所述当前节点的界限值,包括:
针对所述分支定界初始模型中的当前节点,依据所述强化学习模型确定所述当前节点的奖励值,所述奖励值用于指示界限值的调节方式;
根据所述当前节点的奖励值,确定所述分支定界初始模型中的当前节点的界限值。
10.根据权利要求8所述的方法,其中,所述分支定界初始模型的每一节点的状态初始信息包括第一匹配状态或第二匹配状态;
其中,所述第一匹配状态用于指示样本航班信息与样本机型信息之间的匹配关系,所述第二匹配状态用于指示样本机型信息与样本机场站点之间的匹配关系。
11.根据权利要求8所述的方法,所述预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、所述样本数据均被匹配完毕。
12.根据权利要求8-11任一项所述的方法,所述航班匹配关系用于确定航班飞行成本。
13.一种航班的匹配处理装置,包括:
获取单元,用于获取待处理数据,其中,所述待处理数据包括多个航班信息和多个机型信息;
第一确定单元,用于在采用预设的分支定界模型对所述多个航班信息和所述多个机型信息进行匹配处理时,依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;
第二确定单元,用于依据所述每一节点的状态信息,确定航班匹配关系,其中,所述航班匹配关系表征了所述多个航班信息和所述多个机型信息之间的匹配关系;
其中,所述第一确定单元,包括:
执行模块,用于重复以下各步骤,直至达到预设条件:
第一确定模块,用于针对所述分支定界模型中的当前节点,依据所述强化学习模型确定所述当前节点的界限值;
第二确定模块,用于根据所述当前节点的界限值,确定所述分支定界模型中的当前节点的状态信息,并生成所述分支定界模型中的当前节点的下一节点。
14.根据权利要求13所述的装置,其中,所述第一确定模块,包括:
第一确定子模块,用于针对所述分支定界模型中的当前节点,依据所述强化学习模型确定所述当前节点的奖励值,所述奖励值用于指示界限值的调节方式;
第二确定子模块,用于根据所述当前节点的奖励值,确定所述分支定界模型中的当前节点的界限值。
15.根据权利要求13所述的装置,其中,所述分支定界模型的每一节点的状态信息包括第一匹配信息或第二匹配信息;
其中,所述第一匹配信息用于指示航班信息与机型信息之间的匹配关系,所述第二匹配信息用于指示机型信息与机场站点之间的匹配关系。
16.根据权利要求13所述的装置,所述预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、所述待处理数据均被匹配完毕。
17.根据权利要求13所述的装置,所述装置,还包括:
第三确定单元,用于在所述第二确定单元依据所述每一节点的状态信息,确定航班匹配关系之后,依据所述航班匹配关系、以及与每一航班信息对应的预设成本信息,确定航班飞行成本;其中,每一航班信息与不同的机型信息匹配时,与每一航班信息对应的预设成本信息不同;
显示单元,用于根据所述航班飞行成本,生成并显示提示信息。
18.根据权利要求13所述的装置,其中,所述分支定界模型是依据强化学习模型对样本数据进行分支定界初始模型进行训练之后所得到的,所述样本数据包括多个样本航班信息和多个样本机型信息。
19.根据权利要求18所述的装置,所述装置,还包括:
训练单元,用于在采用分支定界初始模型对所述样本数据进行匹配处理时,依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态初始信息,以得到所述分支定界模型;其中,所述状态初始信息用于指示样本航班信息与样本机型信息之间的匹配。
20.一种分支定界模型的训练装置,包括:
获取单元,用于获取样本数据,其中,所述样本数据包括多个样本航班信息和多个样本机型信息;
确定单元,用于在采用分支定界初始模型对所述样本数据进行匹配处理时,依据预设的强化学习模型确定所述分支定界初始模型中的每一节点的状态初始信息,以得到所述分支定界模型;其中,所述状态初始信息用于指示样本航班信息与样本机型信息之间的匹配关系;
其中,所述分支定界模型用于依据预设的强化学习模型确定所述分支定界模型中的每一节点的状态信息,所述状态信息用于指示航班信息与机型信息之间的匹配;所述状态信息用于确定航班匹配关系,其中,所述航班匹配关系表征了多个航班信息和多个机型信息之间的匹配关系;
其中,所述确定单元包括:
执行模块,用于重复以下各步骤,直至达到预设条件:
第一确定模块,用于针对所述分支定界初始模型中的当前节点,依据所述强化学习模型确定所述当前节点的界限值;
第二确定模块,用于根据所述当前节点的界限值,确定所述分支定界初始模型中的当前节点的状态初始信息,并生成所述分支定界初始模型中的当前节点的下一节点。
21.根据权利要求20所述的装置,其中,所述第一确定模块包括:
第一确定子模块,用于针对所述分支定界初始模型中的当前节点,依据所述强化学习模型确定所述当前节点的奖励值,所述奖励值用于指示界限值的调节方式;
第二确定子模块,用于根据所述当前节点的奖励值,确定所述分支定界初始模型中的当前节点的界限值。
22.根据权利要求20所述的装置,其中,所述分支定界初始模型的每一节点的状态初始信息包括第一匹配状态或第二匹配状态;
其中,所述第一匹配状态用于指示样本航班信息与样本机型信息之间的匹配关系,所述第二匹配状态用于指示样本机型信息与样本机场站点之间的匹配关系。
23.根据权利要求20所述的装置,所述预设条件为以下的一种或多种:最大重复执行次数、最大节点个数、所述样本数据均被匹配完毕。
24.根据权利要求20-23任一项所述的装置,所述航班匹配关系用于确定航班飞行成本。
25. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法,或者执行权利要求8-12中任一项所述的方法。
26.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法,或者执行权利要求8-12中任一项所述的方法。
CN202110009544.4A 2021-01-05 2021-01-05 航班的匹配处理、训练方法、装置和设备 Active CN112819285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110009544.4A CN112819285B (zh) 2021-01-05 2021-01-05 航班的匹配处理、训练方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110009544.4A CN112819285B (zh) 2021-01-05 2021-01-05 航班的匹配处理、训练方法、装置和设备

Publications (2)

Publication Number Publication Date
CN112819285A CN112819285A (zh) 2021-05-18
CN112819285B true CN112819285B (zh) 2023-09-26

Family

ID=75857516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110009544.4A Active CN112819285B (zh) 2021-01-05 2021-01-05 航班的匹配处理、训练方法、装置和设备

Country Status (1)

Country Link
CN (1) CN112819285B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751681A (zh) * 2015-03-09 2015-07-01 西安理工大学 一种基于统计学习模型的停机位分配方法
CN106981221A (zh) * 2017-03-24 2017-07-25 北京航空航天大学 基于时空间维度分解的机场停机位分配方法及系统
CN107317872A (zh) * 2017-07-20 2017-11-03 河海大学 一种空间众包中多类型任务的调度方法
EP3270335A1 (en) * 2016-07-15 2018-01-17 Honeywell International Inc. Aircraft turnaround and airport terminal status analysis
CN111079274A (zh) * 2019-12-04 2020-04-28 深圳市机场股份有限公司 机位智能分配方法、计算机装置及存储介质
CN111565419A (zh) * 2020-06-15 2020-08-21 河海大学常州校区 一种超密集网络中面向延迟优化的协作式边缘缓存算法
CN111627255A (zh) * 2019-02-27 2020-09-04 阿里巴巴集团控股有限公司 信息处理方法、装置和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751681A (zh) * 2015-03-09 2015-07-01 西安理工大学 一种基于统计学习模型的停机位分配方法
EP3270335A1 (en) * 2016-07-15 2018-01-17 Honeywell International Inc. Aircraft turnaround and airport terminal status analysis
CN106981221A (zh) * 2017-03-24 2017-07-25 北京航空航天大学 基于时空间维度分解的机场停机位分配方法及系统
CN107317872A (zh) * 2017-07-20 2017-11-03 河海大学 一种空间众包中多类型任务的调度方法
CN111627255A (zh) * 2019-02-27 2020-09-04 阿里巴巴集团控股有限公司 信息处理方法、装置和系统
CN111079274A (zh) * 2019-12-04 2020-04-28 深圳市机场股份有限公司 机位智能分配方法、计算机装置及存储介质
CN111565419A (zh) * 2020-06-15 2020-08-21 河海大学常州校区 一种超密集网络中面向延迟优化的协作式边缘缓存算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Wang Li-heng ; Li Yue-zhong ; Li Chang-xi.Monocular Vision Measuring System for Flight Spin Based on Geometric Feature.《2009 Asia-Pacific Conference on Information Processing》.2009,摘要. *
多机型航班恢复问题研究;潘卫军;叶右军;李肖琳;张庆宇;董兵;;数学的实践与认识(15);全文 *

Also Published As

Publication number Publication date
CN112819285A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN112561079A (zh) 分布式的模型训练装置、方法及计算机程序产品
CN112669867B (zh) 噪声消除算法的调试方法、装置和电子设备
CN114841315A (zh) 混合专家模型实现方法、系统、电子设备及存储介质
CN113641829A (zh) 图神经网络的训练与知识图谱的补全方法、装置
CN113627536A (zh) 模型训练、视频分类方法,装置,设备以及存储介质
CN114462350B (zh) 集成电路芯片验证方法、装置、电子设备及存储介质
CN114818913A (zh) 决策生成方法和装置
JP2022095895A (ja) 交通データ予測方法、交通データ予測装置、電子機器、記憶媒体、コンピュータプログラム製品及びコンピュータプログラム
CN113554180A (zh) 信息预测方法、装置、电子设备及存储介质
CN112819285B (zh) 航班的匹配处理、训练方法、装置和设备
CN115759209B (zh) 神经网络模型的量化方法、装置、电子设备及介质
CN113570067B (zh) 分布式系统的同步方法、装置
CN113361575B (zh) 模型训练方法、装置和电子设备
CN113408641B (zh) 资源生成模型的训练与服务资源的生成方法、装置
CN114998649A (zh) 图像分类模型的训练方法、图像分类方法及装置
CN114386577A (zh) 用于执行深度学习模型的方法、设备和存储介质
CN114139605A (zh) 分布式的模型训练方法、系统、设备以及存储介质
CN113361574A (zh) 数据处理模型的训练方法、装置、电子设备及存储介质
CN112560987A (zh) 图像样本处理方法、装置、设备、存储介质和程序产品
CN114816758B (zh) 资源分配方法和装置
CN113963433B (zh) 运动搜索方法、装置、电子设备及存储介质
CN113361712B (zh) 特征确定模型的训练方法、语义分析方法、装置及电子设备
CN117493639A (zh) 一种兴趣点处理方法、装置、电子设备和存储介质
CN114418084A (zh) 非结构化剪枝模型获取方法、装置、电子设备及存储介质
CN117933390A (zh) 模型混合精度确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant