CN112214520A - 一种重复订座识别方法及装置 - Google Patents

一种重复订座识别方法及装置 Download PDF

Info

Publication number
CN112214520A
CN112214520A CN202011302293.0A CN202011302293A CN112214520A CN 112214520 A CN112214520 A CN 112214520A CN 202011302293 A CN202011302293 A CN 202011302293A CN 112214520 A CN112214520 A CN 112214520A
Authority
CN
China
Prior art keywords
passenger
pnr
flight
repeated
cache database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011302293.0A
Other languages
English (en)
Inventor
曾进进
余真真
林彤
郜美华
高宁宁
王晓逸
王汉博
付英茂
韩楠
郭鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Technology Co Ltd
China Travelsky Holding Co
Original Assignee
China Travelsky Holding Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Holding Co filed Critical China Travelsky Holding Co
Priority to CN202011302293.0A priority Critical patent/CN112214520A/zh
Publication of CN112214520A publication Critical patent/CN112214520A/zh
Priority to PCT/CN2021/130027 priority patent/WO2022105666A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • G06Q10/025Coordination of plural reservations, e.g. plural trip segments, transportation combined with accommodation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种重复订座识别方法及装置,对获取的PNR数据进行解析,并从PNR数据中提取出旅客身份信息和航班信息,从缓存数据库中查找到与旅客身份信息对应的旅客ID,本发明引入了缓存数据库来保存当前有效的PNR数据,并在旅客第一次订座时直接在缓存数据库中生成与旅客身份信息对应的旅客ID,当接收到实时的PNR数据时,会在重复订座识别之前,优先将PNR数据放到缓存数据库中,使旅客ID可以与所有相关联的PNR数据对应,从而通过将同一旅客ID关联的所有的有效的PNR数据重复订单比对,即可实现对重复订座的识别。

Description

一种重复订座识别方法及装置
技术领域
本发明涉及民航机票预订技术领域,更具体的说,涉及一种重复订座识别方法及装置。
背景技术
在同一航班或者航线上,经常出现某一位旅客在不同PNR(Passenger NameRecord,旅客订座记录)中都预订了同一航班或临近航班的座位,或者同一个PNR中预订了多个同一航班或临近航班上的座位。由于旅客的主观意愿是使用其中一个座位,因此重复预订座位会造成航空公司的座位虚占,使得航空公司无法尽快将虚占座位销售给真正需要的旅客,从而导致航班上座率低,使航空公司的收益收到损失。
综上,如何提供一种重复订座识别方法成为了本领域技术人员亟需解决的技术问题。
发明内容
有鉴于此,本发明公开一种重复订座识别方法及装置,以实现对重复订座的识别。
一种重复订座识别方法,包括:
获取PNR数据,所述PNR数据包括:PNR号码;
解析所述PNR数据,从所述PNR数据中提取出旅客身份信息和航班信息;
从缓存数据库中查找到与所述旅客身份信息对应的旅客ID,所述旅客ID为旅客第一次订座时在所述缓存数据库中生成;
将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库中;
基于所述旅客ID以及相关联的PNR号码,从所述缓存数据库中提取出所有有效的目标PNR数据;
按照预设重复订座识别规则,将所有的所述目标PNR数据进行重复订单比对,判断旅客是否存在重复订单;
如果是,则将所述重复订单保存在主数据库中。
一种重复订座识别装置,包括:
获取单元,用于获取PNR数据,所述PNR数据包括:PNR号码;
解析单元,用于解析所述PNR数据,从所述PNR数据中提取出旅客身份信息和航班信息;
查找单元,用于从缓存数据库中查找到与所述旅客身份信息对应的旅客ID,所述旅客ID为旅客第一次订座时在所述缓存数据库中生成;
第一存储单元,用于将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库中;
提取单元,用于基于所述旅客ID以及相关联的PNR号码,从所述缓存数据库中提取出所有有效的目标PNR数据;
重复订单判断单元,用于按照预设重复订座识别规则,将所有的所述目标PNR数据进行重复订单比对,判断旅客是否存在重复订单;
第二存储单元,用于在所述重复订单判断单元判断为是的情况下,将所述重复订单保存在主数据库中。
从上述的技术方案可知,本发明公开了一种重复订座识别方法及装置,对获取的PNR数据进行解析,从PNR数据中提取出旅客身份信息和航班信息,从缓存数据库中查找到与旅客身份信息对应的旅客ID,该旅客ID为旅客第一次订座时在所述缓存数据库中生成,将PNR号码放至缓存数据库中,并与旅客ID以对应关系的形式存储,同时将PNR号码对应的PNR数据存储至缓存数据库中,基于旅客ID以及相关联的PNR号码,从缓存数据库中提取出所有有效的目标PNR数据,按照预设重复订座识别规则,将所有的目标PNR数据进行重复订单比对,并将确定的重复订单保存在主数据库中。本发明引入了缓存数据库来保存当前有效的PNR数据,并在旅客第一次订座时直接在缓存数据库中生成与旅客身份信息对应的旅客ID,当接收到实时的PNR数据时,会在重复订座识别之前,优先将PNR数据放到缓存数据库中,使旅客ID可以与所有相关联的PNR数据对应,从而通过将同一旅客ID关联的所有的有效的PNR数据重复订单比对,即可实现对重复订座的识别。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本发明实施例公开的一种重复订座识别方法流程图;
图2为本发明实施例公开的一种重复订座识别系统的处理过程;
图3为本发明实施例公开的一种重复订座识别装置的结构示意图。
具体实施方式
现有技术中重复订座识别的处理方法为:重复订座识别系统实时或定时地接收各种订座渠道预定的PNR(Passenger Name Record,旅客订座记录),重复订座识别系统根据旅客信息通过查询数据库查找相同旅客是否存在重复预定或一定范围之内的疑似重复预定来进行重复订座识别。
从系统架构的角度来说,为提高重复订座识别系统的吞吐能力,目前重复订座识别系统一般采用分布式并行处理架构。分布式架构具有可靠性、可扩展性、资源共享、灵活性、速度快、性能高等诸多优点,但也存在一定的问题。在重复订单的识别过程中,需要查询数据库中相同旅客的订单数据,并与实时推送到系统的PNR进行比较。在一些情况下,系统几乎同时接到同一旅客两个或两个以上PNR,如:PNR1和PNR2。由于系统采用分布式并行处理,因此导致这些订单被分配到不同机器上同时进行处理,当机器1正在处理PNR1时,数据库中无法查询到PNR2,也就无法对PNR2是否与PNR1重复进行识别。同理,当机器2正在处理PNR2时,也无法在数据库中查询到PNR1的信息,从而也就无法对PNR1是否与PNR2重复进行识别。在这种场景下,如果PNR1与PNR2是重复订单,系统将无法得到正确的重复订座识别结果。由此可以得出结论,分布式并行的重复订座识别系统对瞬时高并发的重复订单的识别存在漏洞,可能导致系统无法完全识别重复订单数据。
针对上述问题,一种可能的解决方案是,采用传统串行计算方式进行处理,即当同时接收到两个或两个以上的PNR时,优先处理PNR1,PNR2等待,待PNR1处理结束后再处理PNR2。尽管该解决方案可以保证重复订单识别业务的完整性,但也大大降低了系统的处理速度,同时丢掉了并行处理架构的高吞吐能力的优点。
基于此,本发明实施例公开了一种重复订座识别方法及装置,对获取的PNR数据进行解析,从PNR数据中提取出旅客身份信息和航班信息,从缓存数据库中查找到与旅客身份信息对应的旅客ID,该旅客ID为旅客第一次订座时在所述缓存数据库中生成,将PNR号码放至缓存数据库中,并与旅客ID以对应关系的形式存储,同时将PNR号码对应的PNR数据存储至缓存数据库中,基于旅客ID以及相关联的PNR号码,从缓存数据库中提取出所有有效的目标PNR数据,按照预设重复订座识别规则,将所有的目标PNR数据进行重复订单比对,并将确定的重复订单保存在主数据库中。本发明引入了缓存数据库来保存当前有效的PNR数据,并在旅客第一次订座时直接在缓存数据库中生成与旅客身份信息对应的旅客ID,当接收到实时的PNR数据时,会在重复订座识别之前,优先将PNR数据放到缓存数据库中,使旅客ID可以与所有相关联的PNR数据对应,从而通过将同一旅客ID关联的所有的有效的PNR数据重复订单比对,即可实现对重复订座的识别。
另外,本发明通过直接在缓存数据库中生成与旅客身份信息对应的旅客ID,使得旅客ID可以与所有相关联的PNR数据对应,有效避免了传统方案中因采用分布式并行处理导致的无法对同一旅客的多个PNR进行重复订座识别的问题。并且,缓存数据库相对于主数据库而言,可以极大的提升读写效率,可以将读写操作缩短到毫秒级。
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
参见图1,本发明实施例公开的一种重复订座识别方法流程图,该方法包括:
步骤S101、获取PNR数据;
具体的,在实际应用中,可以从中国民航信息系统中获取航空公司的PNR数据,PNR数据包括:PNR号码。
PNR是旅客订座记录,即Passenger Name Record的缩写,它反映了旅客的航程,航班座位占用的数量,及旅客信息,适用民航订座系统。
步骤S102、解析所述PNR数据,从所述PNR数据中提取出旅客身份信息和航班信息;
其中,旅客身份信息可以包括:旅客姓名、身份证号码、护照号码和常旅客卡号等等。
航班信息可以包括:航班订座信息、航班始发地、航班目的地、航班号、出发日期和到达日期,等等。
步骤S103、从缓存数据库中查找到与所述旅客身份信息对应的旅客ID;
其中,旅客ID为旅客第一次订座时在所述缓存数据库中生成。
在实际应用中,旅客每次订座可能使用身份证号码、护照号码和常旅客卡号其中的任意一种或多种,因此需要对旅客身份进行识别。
为便于后续对同一个旅客的多份订单进行重复识别,本发明针对每位旅客在缓存数据库中均生成一个来唯一标识每一位旅客的旅客ID。
需要说明的是:
A)当在缓存数据库中未查找到与所述旅客身份信息对应的旅客ID时,在缓存数据库中生成一个与所述旅客身份信息对应旅客ID。
B)如果缓存数据库中找到多个与所述旅客身份信息对应的旅客ID时,需要对多个旅客ID进行合并,保证有多个证件的旅客只有一个唯一的旅客ID。
举例一:不同身份证的旅客ID合并
处理订单1(英文名+身份证1):获取真实英文名+加密身份证号1键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密身份证号1为键,旅客ID1为值;
处理订单2(英文名+身份证2):获取真实英文名+加密身份证号2键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密身份证号2为键,旅客ID2为值;
处理订单3(英文名+身份证号1+身份证号2):获取真实英文名+加密身份证号1键以及真实英文名+加密护照号2键循环证件类型,查询缓存数据库,发现这个这两个键名数据存在,且有两个不同的旅客ID值,随机使用订单1或订单2的旅客ID值为最终的旅客ID(如ID1),更新订单1和订单2的旅客ID值,聚合成同一个人。
举例二:身份证和护照的旅客ID合并
处理订单1(英文名+身份证):获取真实英文名+加密身份证号键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密身份证号为键,旅客ID1为值;
处理订单2(英文名+护照):获取真实英文名+加密护照号键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密护照号为键,旅客ID2为值;
处理订单3(英文名+身份证+护照):获取真实英文名+加密身份证号键以及真实英文名+加密护照号键,循环证件类型,查询缓存数据库,发现这个这两个键名数据存在,且有两个不同的旅客ID值,随机使用订单1或订单2的旅客ID值为最终的旅客ID(如ID1),更新订单1和订单2的旅客ID值(均为ID1),聚合成同一个人。
在实际应用中,本发明可以通过判断缓存数据库中是否存储与所述旅客身份信息对应的旅客ID,来确定旅客是否是第一次订座,如果否,则判定旅客之前未订座,此时在缓存数据库生成一个新的旅客ID;如果是,则判定旅客非第一次订座,当旅客再次订座时,如有多个证件,则判断进行旅客ID的合并,否则直接使用之前生成的旅客ID即可。
需要说明的是,本步骤是解决分布式并行的重复订座识别系统对瞬时高并发的重复订单识别存在的漏洞的关键步骤。假设未引入缓存数据库,若重复订座识别系统在极短的时间间隔(比如1ms)收到同一位旅客的两个PNR,分别为PNR1和PNR2,由于系统采用分布式并行处理,因此导致这些订单被分配到不同机器上同时进行处理,当机器1正在处理PNR1时,数据库中无法查询到PNR2,也就无法对PNR2是否与PNR1重复进行识别。同理,当机器2正在处理PNR2时,也无法在数据库中查询到PNR1的信息,从而也就无法对PNR1是否与PNR2重复进行识别。
因此,本发明引入了缓存数据库,缓存数据库中可以保存当前有效的PNR数据,通过直接在缓存数据库中生成与旅客身份信息对应的唯一的旅客ID,使得旅客ID可以与所有相关联的PNR数据建立对应关系,同时PNR数据与所有的旅客ID之间也建立对应关系,有效避免了传统方案中因采用分布式并行处理导致的无法对同一旅客的多个PNR进行重复订座识别的问题。并且,缓存数据库相对于主数据库而言,可以极大的提升读写效率,可以将读写操作缩短到毫秒级。
步骤S104、将PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库中;
具体的,当旅客第一次订座时,首先在缓存数据库中生成一个与旅客身份信息对应旅客ID,然后将获取的PNR数据连同PNR号码存储至缓存数据库。
当旅客不是第一次订座时,直接将获取的PNR数据连同PNR号码存储至缓存数据库。
步骤S105、基于所述旅客ID以及相关联的PNR号码,从所述缓存数据库中提取出所有有效的目标PNR数据;
需要说明的是,在缓存数据库中,一个旅客ID与所有相关联的PNR数据相对应。
本实施例中有效的目标PNR数据指的是:未被取消的订单数据。
步骤S106、按照预设重复订座识别规则,将所有的所述目标PNR数据进行重复订单比对,判断旅客是否存在重复订单,如果是,则执行步骤S107;
其中,按照预设重复订座识别规则确定的重复订单满足条件:(一)旅客姓名和身份ID相同;(二)航班始发地或航班达到地(机场)相同;(三)时间符合如下要求的重复PNR数据(重复PNR数据中的舱位、航班号和订座责任组可不同),如下:
A、当航段为国内航段时(起飞机场到达机场对应的国家均为CN),起飞或到达机场相同,两个航段的起飞时间在第一预设时间范围内则认为是重复航段;
B、当航段为国际航段时(起飞机场到达机场对应的国家至少有一个不为CN),起飞或到达机场相同,两个航段的起飞时间在第二预设时间范围内则认为是重复航段。
具体的,(一)旅客姓名和身份ID是否相同的判断标准为:旅客姓名重复且身份ID重复。
1)旅客姓名重复的判断依据是:英文姓名相同。
举例说明,详见表1,假设重复订座识别系统收到两个PNR,分别为PNR1和PNR2。
表1
Figure BDA0002787268360000081
2)身份ID重复的判断依据是:两位旅客使用了相同的身份证、护照或常旅客卡。
同一位旅客的含义是:系统会维护旅客英文姓名、身份ID类型和身份ID内容的信息。同一位旅客可以有多种证件信息。如果旅客具有同样的英文姓名和同样的身份ID,就会被分配同一旅客ID。假如同一位旅客以不同种身份ID出现在同一PNR内,那么也会为这些身份ID分配同一个旅客ID。举例说,假如有位旅客在同一个PNR中输入过身份证号码和护照号码,若后续改旅客分别用身份证号码和护照号码各订一个PNR,则也会被确认为是同一位旅客。
其中,针对身份ID类型解析种类如下:
**********<FOID>**************************************
使用SSR FOID输入旅客的身份信息
指令格式:
SSR FOID AIRLINE-CODE HK/证件代码及号码/Pn
注意:1)证件代码有NI身份证,PP护照;
2)每个旅客只能够输入一个FOID身份信息,若输错,必须删除后重输。即多人的PNR必须指定该信息,属于哪个旅客,单人PNR可以不指定。
示例:
SSR FOID CA HK/NI110108200306016012/P1
SSR FOID CA HK/PP112233/P2
**********<PSPT>**************************************
使用SSR PSPT输入旅客护照信息
指令格式:
SSR PSPT AIRLINE-CODE HK1/护照号码/国籍/旅客生日/旅客姓/旅客名/性别及婴儿标识/持有人标识/Pn
注意:
1性别及婴儿标识包括:M表示MALE,F表示FEMALE;MI表示男孩,FI表示女孩。
2每位旅客只能够输入一个护照信息,若输错,必须删除后重输。即多人的PNR必须指定该信息属于哪个旅客,单人PNR可以不指定。
3仅需在以下两种情况输入旅客姓和旅客名:A、当PNR中旅客姓名与护照中旅客姓名不同时;B、为婴儿输入护照信息。
示例:
为02年4月20日出生的中国男孩(男性婴儿)TEST/NAME输入护照信息,该护照号为1234567890123456,护照持有人为该PNR中第一个旅客。
SSR PSPT CA HK1/1234567890123456/CN/20APR02/TEST/NAME
/MI/H/P1
为70年4月20日出生的中国男性输入护照信息,该护照号为123456789,此人为该PNR中的第一个旅客。
SSR PSPT CA HK1/123456789/CN/20APR70///M/P1
********<API使用格式>******************************
背景:
美国要求航空公司于2005年10月4日开始采用基于UNEDIFACT标准的PAXLST。加拿大为2005年11月1日开始使用和目前的API信息相比,美国PAXLST增加的信息有:居住国,美国地址(美国公民或持美国居住卡的除外),护照到期日期,加拿大PAXLST增加的信息:居住国,护照到期日期。PAXLST通常都只要求一种有效证件信息,最多不超过两种,首选护照信息,每个旅客包括婴儿都必须持有至少一种有效证件。
*DOCS
指令格式:
SSR:DOCS航空公司代码Action-Code1证件类型/发证国家/证件号码/国籍/出生日期/性别/证件有效期限
/SURNAME(姓)/FIRST-NAME(名)/MID-NAME(中间名)/持有人
标识H/P1
示例:
SSR:DOCS CA HK1 P/CHN/143810297/CHN/24APR67/M/23APR02
ZHANG/DALONG/P1
说明:
证件类型:P 护照签发国:CHN
护照号:143810297 国籍:CH
出生日期:24APR67 性别:M
证件有效期:23APR02
姓:ZHANG 名:DALONG
注:只关注DOCS类型的P类型
**********<FQTV>**************************************
使用SSR FQTV输入常旅客信息
指令格式:
SSR FQTV AIRLINE-CODE HK/证件代码及号码/Pn
注意:1证件代码为航空公司前缀,如CA、LH等等(本需求支持国航输入的非国航联盟卡号。)。
2常旅客号码必须为真实有效号码。
示例:
SSR FQTV CA HK/CA101599260/P1
疑似重复旅客举例(当旅客姓名相同且身份信息有如下几种情况时):
例子1(表2)——身份证号码相同:
表2
PNR1中的旅客 NI:11012340098900233
PNR2中的旅客 NI:11012340098900233
例子2(表3)——护照号码相同:
表3
PNR1中的旅客 PP:25782769
PNR2中的旅客 PP:25782769
例子3(表4)——常旅客卡号相同:
表4
PNR1中的旅客 CA:101599260
PNR2中的旅客 CA:101599260
例子4(表5)——身份证号码与常旅客卡号相同:
表5
PNR1中的旅客 NI:11012340098900233、CA:101599260
PNR2中的旅客 NI:11012340098900233
PNR3中的旅客 CA:101599260
需要说明的是,在判断旅客是否为第一次订座时,主要通过旅客身份信息来判断。由于PNR数据中的旅客姓名可能会带有种类繁多的姓名后缀,如MR、MS、VIP等,因此在判断姓名是否重复之前,需要进行姓名后缀剥离,以便得到准确的姓名,并判断后缀剥离后的旅客姓名是否重复。在从缓存数据库中查找到与旅客身份信息对应的旅客ID时,具体根据姓名后缀剥离的旅客姓名以及本次订座使用的身份证号、护照号或常旅客卡号等,从缓存数据中查找相同旅客身份信息的旅客ID是否存在。
其中,旅客身份信息包括:本次订座使用的身份证号、护照号或常旅客卡号中的任意一个,以及姓名后缀剥离的旅客姓名。
3)姓名后缀剥离
将下面形式的后缀剥离出来,存储在数据库表中的姓名(剥离后)、后缀(剥离后)两个字段中。在重复订单结果数据中,能够识别出有后缀和有后缀姓名之间的重复、无后缀和无后缀姓名之间的重复、有后缀和无后缀姓名之间的重复。
可识别的姓名后缀主要有以下类型,支持配置:
MR/MS/CHD/MRS/MISS/MSTR/SD/STU/DL/DR/MDM/INF/SC/V/LBR/VVIP/IN/DE/INS/DIPL/CBBG/EXST/MASTER/SEA/EM/MIS/GM/EMI/
STCR/JC/WCHR/WCHS/WCHC/VIP/MAAS/INAD/DEPA/DEPU/DEAF/CHILD/CIP/BLND/MAS/YP/MADAM/AS/LEGL/PETC/SP/VF
剥离姓名中的斜杠和空格。
举例1:zhang/san,则存储为zhangsan。
举例2:zhang san,则存储为zhangsan。
举例3:HAN/WAI LEEA,则存储为HANWAILEEA。
举例4:VANASS/LEONAD JOHA MR,则存储为VANASSLEONADJOHA。
(二)航班始发地或航班达到地(机场)相同(或者说重复航段)的判断标准为:
1)航段为有效航段;
2)航段相似的条件是起飞城市或者到达城市相同,并且在起飞城市相同的情况下,起飞时间比较近,在到达城市相同的情况下,到达时间比较近。
需要说明的是,针对疑似重复匹配说明参见表6所示。
表6
Figure BDA0002787268360000131
还需要说明的是,在检测是否有其他重复航段时,本发明支持对是否启用联盟内全检测的范围控制,例如FM、MU为同一联盟,联盟内的重复订座的航段可以识别。
需要特别说明的是,为保护旅客隐私数据,对PNR订单中证件信息(身份证号码、护照号码和常旅客卡号)进行加密处理,加密方式可以为SM4。具体加密过程可参见现有成熟方案,此处不再赘述。
步骤S107、将重复订单保存在主数据库中。
其中,在将重复订单保存在主数据库中后,就可以供后续查询或者清理功能使用。具体可以为:自动清理模块从主数据库读取重复订单,并对重复订单进行清理后,将清理结果保持至主数据库中。
需要说明的是,本发明公开的重复订座识别系统处理过程可参见图2所示,其中,PNR1和PNR2仅为一个示例,在实际应用中,重复订座识别系统获取的PNR的数量与实际应用中对应。
综上可知,本发明公开了一种重复订座识别方法,对获取的PNR数据进行解析,从PNR数据中提取出旅客身份信息和航班信息,从缓存数据库中查找到与旅客身份信息对应的旅客ID,该旅客ID为旅客第一次订座时在所述缓存数据库中生成,将PNR号码放至缓存数据库中,并与旅客ID以对应关系的形式存储,同时将PNR号码对应的PNR数据存储至缓存数据库中,基于旅客ID以及相关联的PNR号码,从缓存数据库中提取出所有有效的目标PNR数据,按照预设重复订座识别规则,将所有的目标PNR数据进行重复订单比对,并将确定的重复订单保存在主数据库中。本发明引入了缓存数据库来保存当前有效的PNR数据,并在旅客第一次订座时直接在缓存数据库中生成与旅客身份信息对应的旅客ID,当接收到实时的PNR数据时,会在重复订座识别之前,优先将PNR数据放到缓存数据库中,使旅客ID可以与所有相关联的PNR数据对应,从而通过将同一旅客ID关联的所有的有效的PNR数据重复订单比对,即可实现对重复订座的识别。
另外,本发明通过直接在缓存数据库中生成与旅客身份信息对应的旅客ID,使得旅客ID可以与所有相关联的PNR数据对应,有效避免了传统方案中因采用分布式并行处理导致的无法对同一旅客的多个PNR进行重复订座识别的问题。并且,缓存数据库相对于主数据库而言,可以极大的提升读写效率,可以将读写操作缩短到毫秒级。
需要说明的是,附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
与上述方法实施例相对应,本发明还公开了一种重复订座识别装置。
参见图3,本发明实施例公开的一种重复订座识别装置的结构示意图,该装置包括:
获取单元201,用于获取PNR数据,所述PNR数据包括:PNR号码;
解析单元202,用于解析所述PNR数据,从所述PNR数据中提取出旅客身份信息和航班信息;
其中,旅客身份信息可以包括:旅客姓名、身份证号码、护照号码和常旅客卡号等等。
航班信息可以包括:航班订座信息、航班始发地、航班目的地、航班号、出发日期和到达日期,等等。
查找单元203,用于从缓存数据库中查找到与所述旅客身份信息对应的旅客ID,所述旅客ID为旅客第一次订座时在所述缓存数据库中生成;
其中,旅客ID为旅客第一次订座时在所述缓存数据库中生成。
在实际应用中,旅客每次订座可能使用身份证号码、护照号码和常旅客卡号其中的任意一种或多种,因此需要对旅客身份进行识别。
为便于后续对同一个旅客的多份订单进行重复识别,本发明针对每位旅客在缓存数据库中均生成一个来唯一标识每一位旅客的旅客ID。
需要说明的是:
A)当在缓存数据库中未查找到与所述旅客身份信息对应的旅客ID时,在缓存数据库中生成一个与所述旅客身份信息对应旅客ID。
因此,重复订座识别装置还可以包括:生成单元,用于第一存储单元204将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库之前,当所述缓存数据库中未查找到与所述旅客身份信息对应的旅客ID时,从所述缓存数据库中生成一个与所述旅客身份信息对应旅客ID。
B)如果缓存数据库中找到多个与所述旅客身份信息对应的旅客ID时,需要对多个旅客ID进行合并,保证有多个证件的旅客只有一个唯一的旅客ID。
举例一:不同身份证的旅客ID合并
处理订单1(英文名+身份证1):获取真实英文名+加密身份证号1键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密身份证号1为键,旅客ID1为值;
处理订单2(英文名+身份证2):获取真实英文名+加密身份证号2键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密身份证号2为键,旅客ID2为值;
处理订单3(英文名+身份证号1+身份证号2):获取真实英文名+加密身份证号1键以及真实英文名+加密护照号2键循环证件类型,查询缓存数据库,发现这个这两个键名数据存在,且有两个不同的旅客ID值,随机使用订单1或订单2的旅客ID值为最终的旅客ID(如ID1),更新订单1和订单2的旅客ID值,聚合成同一个人。
举例二:身份证和护照的旅客ID合并
处理订单1(英文名+身份证):获取真实英文名+加密身份证号键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密身份证号为键,旅客ID1为值;
处理订单2(英文名+护照):获取真实英文名+加密护照号键,查询缓存数据库,无结果存入缓存数据库中,以真实英文名+加密护照号为键,旅客ID2为值;
处理订单3(英文名+身份证+护照):获取真实英文名+加密身份证号键以及真实英文名+加密护照号键,循环证件类型,查询缓存数据库,发现这个这两个键名数据存在,且有两个不同的旅客ID值,随机使用订单1或订单2的旅客ID值为最终的旅客ID(如ID1),更新订单1和订单2的旅客ID值(均为ID1),聚合成同一个人。
在实际应用中,本发明可以通过判断缓存数据库中是否存储与所述旅客身份信息对应的旅客ID,来确定旅客是否是第一次订座,如果否,则判定旅客之前未订座,此时在缓存数据库生成一个新的旅客ID;如果是,则判定旅客非第一次订座,当旅客再次订座时,如有多个证件,则判断进行旅客ID的合并,否则直接使用之前生成的旅客ID即可。
第一存储单元204,用于将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库中;
具体的,当旅客第一次订座时,首先在缓存数据库中生成一个与旅客身份信息对应旅客ID,然后将获取的PNR数据连同PNR号码存储至缓存数据库。
当旅客不是第一次订座时,直接将获取的PNR数据连同PNR号码存储至缓存数据库。
提取单元205,用于基于所述旅客ID以及相关联的PNR号码,从所述缓存数据库中提取出所有有效的目标PNR数据;
需要说明的是,在缓存数据库中,一个旅客ID与所有相关联的PNR数据相对应。
本实施例中有效的目标PNR数据指的是:未被取消的订单数据。
重复订单判断单元206,用于按照预设重复订座识别规则,将所有的所述目标PNR数据进行重复订单比对,判断旅客是否存在重复订单;
其中,按照预设重复订座识别规则确定的重复订单满足条件:(一)旅客姓名和身份ID相同;(二)航班始发地或航班达到地(机场)相同;(三)时间符合如下要求的重复PNR数据(重复PNR数据中的舱位、航班号和订座责任组可不同),如下:
A、当航段为国内航段时(起飞机场到达机场对应的国家均为CN),起飞或到达机场相同,两个航段的起飞时间在第一预设时间范围内则认为是重复航段;
B、当航段为国际航段时(起飞机场到达机场对应的国家至少有一个不为CN),起飞或到达机场相同,两个航段的起飞时间在第二预设时间范围内则认为是重复航段。
第二存储单元207,用于在所述重复订单判断单元判断为是的情况下,将所述重复订单保存在主数据库中。
其中,在将重复订单保存在主数据库中后,就可以供后续查询或者清理功能使用。具体可以为:自动清理模块从主数据库读取重复订单,并对重复订单进行清理后,将清理结果保持至主数据库中。
需要说明的是,本发明公开的重复订座识别系统处理过程可参见图2所示,其中,PNR1和PNR2仅为一个示例,在实际应用中,重复订座识别系统获取的PNR的数量与实际应用中对应。
综上可知,本发明公开了一种重复订座识别装置,对获取的PNR数据进行解析,从PNR数据中提取出旅客身份信息和航班信息,从缓存数据库中查找到与旅客身份信息对应的旅客ID,该旅客ID为旅客第一次订座时在所述缓存数据库中生成,将PNR号码放至缓存数据库中,并与旅客ID以对应关系的形式存储,同时将PNR号码对应的PNR数据存储至缓存数据库中,基于旅客ID以及相关联的PNR号码,从缓存数据库中提取出所有有效的目标PNR数据,按照预设重复订座识别规则,将所有的目标PNR数据进行重复订单比对,并将确定的重复订单保存在主数据库中。本发明引入了缓存数据库来保存当前有效的PNR数据,并在旅客第一次订座时直接在缓存数据库中生成与旅客身份信息对应的旅客ID,当接收到实时的PNR数据时,会在重复订座识别之前,优先将PNR数据放到缓存数据库中,使旅客ID可以与所有相关联的PNR数据对应,从而通过将同一旅客ID关联的所有的有效的PNR数据重复订单比对,即可实现对重复订座的识别。
另外,本发明通过直接在缓存数据库中生成与旅客身份信息对应的旅客ID,使得旅客ID可以与所有相关联的PNR数据对应,有效避免了传统方案中因采用分布式并行处理导致的无法对同一旅客的多个PNR进行重复订座识别的问题。并且,缓存数据库相对于主数据库而言,可以极大的提升读写效率,可以将读写操作缩短到毫秒级。
上述实施例中,在进行姓名重复判断时,重复订座识别装置还可以包括:
姓名重复判断单元,用于对旅客姓名进行后缀剥离,并判断后缀剥离后的旅客姓名是否重复。
其中,描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
需要特别说明的是,装置实施例中各组成部分的具体工作原理,请参见方法实施例对应部分,此处不再赘述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (14)

1.一种重复订座识别方法,其特征在于,包括:
获取PNR数据,所述PNR数据包括:PNR号码;
解析所述PNR数据,从所述PNR数据中提取出旅客身份信息和航班信息;
从缓存数据库中查找到与所述旅客身份信息对应的旅客ID,所述旅客ID为旅客第一次订座时在所述缓存数据库中生成;
将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库中;
基于所述旅客ID以及相关联的PNR号码,从所述缓存数据库中提取出所有有效的目标PNR数据;
按照预设重复订座识别规则,将所有的所述目标PNR数据进行重复订单比对,判断旅客是否存在重复订单;
如果是,则将所述重复订单保存在主数据库中。
2.根据权利要求1所述的重复订座识别方法,其特征在于,在将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库之前,还包括:
当所述缓存数据库中未查找到与所述旅客身份信息对应的旅客ID时,从所述缓存数据库中生成一个与所述旅客身份信息对应旅客ID。
3.根据权利要求1所述的重复订座识别方法,其特征在于,按照所述预设重复订座识别规则确定的重复订单满足条件:
旅客姓名和身份ID相同;
航班始发地或航班达到地相同;
时间符合如下要求的重复PNR数据:
A、当航段为国内航段时,起飞或到达机场相同,两个航段的起飞时间在第一预设时间范围内则认为是重复航段;
B、当航段为国际航段时,起飞或到达机场相同,两个航段的起飞时间在第二预设时间范围内则认为是重复航段。
4.根据权利要求3所述的重复订座识别方法,其特征在于,所述旅客姓名和所述身份ID是否相同的判断标准为:旅客姓名重复且身份ID重复;
所述旅客姓名重复的判断依据是:英文姓名相同;
所述身份ID重复的判断依据是:两位旅客使用了相同的身份证、护照或常旅客卡。
5.根据权利要求4所述的重复订座识别方法,其特征在于,判断旅客姓名重复的过程包括:
对旅客姓名进行后缀剥离,并判断后缀剥离后的旅客姓名是否重复。
6.根据权利要求5所述的重复订座识别方法,其特征在于,所述旅客身份信息包括:本次订座使用的身份证号、护照号或常旅客卡号中的任意一个,以及姓名后缀剥离的旅客姓名。
7.根据权利要求3所述的重复订座识别方法,其特征在于,所述航班始发地或航班达到地相同的判断标准为:航段为有效航段;航段相似的条件是起飞城市或者到达城市相同,并且在起飞城市相同的情况下,起飞时间比较近,在到达城市相同的情况下,到达时间比较近。
8.一种重复订座识别装置,其特征在于,包括:
获取单元,用于获取PNR数据,所述PNR数据包括:PNR号码;
解析单元,用于解析所述PNR数据,从所述PNR数据中提取出旅客身份信息和航班信息;
查找单元,用于从缓存数据库中查找到与所述旅客身份信息对应的旅客ID,所述旅客ID为旅客第一次订座时在所述缓存数据库中生成;
第一存储单元,用于将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库中;
提取单元,用于基于所述旅客ID以及相关联的PNR号码,从所述缓存数据库中提取出所有有效的目标PNR数据;
重复订单判断单元,用于按照预设重复订座识别规则,将所有的所述目标PNR数据进行重复订单比对,判断旅客是否存在重复订单;
第二存储单元,用于在所述重复订单判断单元判断为是的情况下,将所述重复订单保存在主数据库中。
9.根据权利要求8所述的重复订座识别装置,其特征在于,还包括:
生成单元,用于所述第一存储单元将所述PNR号码放至所述缓存数据库中,并与所述旅客ID以对应关系的形式存储,同时将所述PNR号码对应的所述PNR数据存储至所述缓存数据库之前,当所述缓存数据库中未查找到与所述旅客身份信息对应的旅客ID时,从所述缓存数据库中生成一个与所述旅客身份信息对应旅客ID。
10.根据权利要求8所述的重复订座识别装置,其特征在于,按照所述预设重复订座识别规则确定的重复订单满足条件:
旅客姓名和身份ID相同;
航班始发地或航班达到地相同;
时间符合如下要求的重复PNR数据:
A、当航段为国内航段时,起飞或到达机场相同,两个航段的起飞时间在第一预设时间范围内则认为是重复航段;
B、当航段为国际航段时,起飞或到达机场相同,两个航段的起飞时间在第二预设时间范围内则认为是重复航段。
11.根据权利要求10所述的重复订座识别装置,其特征在于,所述旅客姓名和所述身份ID是否相同的判断标准为:旅客姓名重复且身份ID重复;
所述旅客姓名重复的判断依据是:英文姓名相同;
所述身份ID重复的判断依据是:两位旅客使用了相同的身份证、护照或常旅客卡。
12.根据权利要求11所述的重复订座识别装置,其特征在于,还包括:
姓名重复判断单元,用于对旅客姓名进行后缀剥离,并判断后缀剥离后的旅客姓名是否重复。
13.根据权利要求12所述的重复订座识别装置,其特征在于,所述旅客身份信息包括:本次订座使用的身份证号、护照号或常旅客卡号中的任意一个,以及姓名后缀剥离的旅客姓名。
14.根据权利要求10所述的重复订座识别装置,其特征在于,所述航班始发地或航班达到地相同的判断标准为:航段为有效航段;航段相似的条件是起飞城市或者到达城市相同,并且在起飞城市相同的情况下,起飞时间比较近,在到达城市相同的情况下,到达时间比较近。
CN202011302293.0A 2020-11-19 2020-11-19 一种重复订座识别方法及装置 Pending CN112214520A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011302293.0A CN112214520A (zh) 2020-11-19 2020-11-19 一种重复订座识别方法及装置
PCT/CN2021/130027 WO2022105666A1 (zh) 2020-11-19 2021-11-11 一种重复订座识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011302293.0A CN112214520A (zh) 2020-11-19 2020-11-19 一种重复订座识别方法及装置

Publications (1)

Publication Number Publication Date
CN112214520A true CN112214520A (zh) 2021-01-12

Family

ID=74067895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011302293.0A Pending CN112214520A (zh) 2020-11-19 2020-11-19 一种重复订座识别方法及装置

Country Status (2)

Country Link
CN (1) CN112214520A (zh)
WO (1) WO2022105666A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313277A (zh) * 2021-06-10 2021-08-27 中国民航信息网络股份有限公司 一种信息处理方法及装置
WO2022105666A1 (zh) * 2020-11-19 2022-05-27 中国民航信息网络股份有限公司 一种重复订座识别方法及装置
CN116483868A (zh) * 2023-04-14 2023-07-25 首约科技(北京)有限公司 一种提升运力应答效率的方法、装置、设备、介质及程序
WO2024041368A1 (zh) * 2022-08-23 2024-02-29 中国民航信息网络股份有限公司 一种民航开放旅客预订系统中旅客姓名的处理方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168456B (zh) * 2022-09-07 2022-11-25 中国民航信息网络股份有限公司 航班销售过程特征获取方法及装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2515262A1 (en) * 2011-04-18 2012-10-24 Amadeus S.A.S. De-synchronization monitoring system and method
CN106776811A (zh) * 2016-11-23 2017-05-31 李天� 数据索引方法及装置
CN107392682A (zh) * 2017-09-13 2017-11-24 沈阳东知科技有限公司 一种多渠道客户信息处理系统及处理方法
CN107862396A (zh) * 2017-10-27 2018-03-30 携程旅游网络技术(上海)有限公司 行程订单重复预定处理方法、系统、存储介质和电子设备
CN110750217A (zh) * 2019-10-18 2020-02-04 北京浪潮数据技术有限公司 一种信息管理方法及相关装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112214520A (zh) * 2020-11-19 2021-01-12 中国民航信息网络股份有限公司 一种重复订座识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2515262A1 (en) * 2011-04-18 2012-10-24 Amadeus S.A.S. De-synchronization monitoring system and method
CN106776811A (zh) * 2016-11-23 2017-05-31 李天� 数据索引方法及装置
CN107392682A (zh) * 2017-09-13 2017-11-24 沈阳东知科技有限公司 一种多渠道客户信息处理系统及处理方法
CN107862396A (zh) * 2017-10-27 2018-03-30 携程旅游网络技术(上海)有限公司 行程订单重复预定处理方法、系统、存储介质和电子设备
CN110750217A (zh) * 2019-10-18 2020-02-04 北京浪潮数据技术有限公司 一种信息管理方法及相关装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022105666A1 (zh) * 2020-11-19 2022-05-27 中国民航信息网络股份有限公司 一种重复订座识别方法及装置
CN113313277A (zh) * 2021-06-10 2021-08-27 中国民航信息网络股份有限公司 一种信息处理方法及装置
WO2024041368A1 (zh) * 2022-08-23 2024-02-29 中国民航信息网络股份有限公司 一种民航开放旅客预订系统中旅客姓名的处理方法及装置
CN116483868A (zh) * 2023-04-14 2023-07-25 首约科技(北京)有限公司 一种提升运力应答效率的方法、装置、设备、介质及程序

Also Published As

Publication number Publication date
WO2022105666A1 (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN112214520A (zh) 一种重复订座识别方法及装置
Huang et al. Institution name disambiguation for research assessment
CN108763492A (zh) 一种音频模板提取方法及装置
CN110110325B (zh) 一种重复案件查找方法和装置、计算机可读存储介质
CN103034735A (zh) 一种大数据分布式文件导出方法
CN103313248A (zh) 一种识别垃圾信息的方法和装置
CN109145003B (zh) 一种构建知识图谱的方法及装置
CN112948429B (zh) 一种数据报送方法、装置和设备
CN106055539A (zh) 姓名消歧的方法和装置
CN110427375A (zh) 字段类别的识别方法及装置
CN107085615B (zh) 文本消重系统、方法、服务器及计算机存储介质
WO2019056781A1 (zh) 同义词挖掘方法、装置、设备和计算机可读存储介质
Shestakov et al. On estimating the scale of national deep web
CN106095808B (zh) 一种mdb文件碎片恢复的方法和装置
CN111581942B (zh) 一种数据文件的比对方法
CN109241395B (zh) 一种基于关键词解析的试题网络排重检索办法
CN111966339A (zh) 埋点参数的录入方法、装置、计算机设备和存储介质
CN110751095A (zh) 身份识别方法、系统及可读存储介质
CN111753538B (zh) 离婚纠纷裁判文书要素提取方法及装置
CN110633430B (zh) 事件发现方法、装置、设备和计算机可读存储介质
CN109635074B (zh) 一种基于舆情信息的实体关系分析方法及终端设备
CN113672610A (zh) 图数据库处理方法及装置
CN114443410A (zh) 一种业务日志处理方法、系统及物联网系统
CN108959295B (zh) 一种原生对象的识别方法和装置
Kumar et al. An efficient space partitioning tree approach for indexing and retrieving fingerprint databases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination