CN104011719B - 消息跟踪和检查的方法和系统 - Google Patents
消息跟踪和检查的方法和系统 Download PDFInfo
- Publication number
- CN104011719B CN104011719B CN201280063170.3A CN201280063170A CN104011719B CN 104011719 B CN104011719 B CN 104011719B CN 201280063170 A CN201280063170 A CN 201280063170A CN 104011719 B CN104011719 B CN 104011719B
- Authority
- CN
- China
- Prior art keywords
- message
- server
- cache memory
- thrashing
- memory architectures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 61
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 230000033458 reproduction Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims 3
- 230000001052 transient effect Effects 0.000 claims 2
- 239000004744 fabric Substances 0.000 claims 1
- 230000008569 process Effects 0.000 description 27
- 238000004364 calculation method Methods 0.000 description 13
- 230000003321 amplification Effects 0.000 description 9
- 238000003199 nucleic acid amplification method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000246 remedial effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2358—Change logging, detection, and notification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/273—Asynchronous replication or reconciliation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/288—Distributed intermediate devices, i.e. intermediate devices for interaction with other intermediate devices on the same level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/34—Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/568—Storing data temporarily at an intermediate stage, e.g. caching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/16—Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种用于跟踪报价和订购平台的高速缓存架构中的消息的失效跟踪器系统,其中所述高速缓存架构包括多个级别,其中每个级别都包含一个或多个服务器,其中失效消息从一个级别传达到另一个级别,以便把失效消息发送到所述高速缓存架构中的全部服务器,以及其中所述失效跟踪器系统从供应商数据库接收要传达到所述高速缓存架构中的服务器的数据;其中所述失效跟踪器系统包括:记录模块,用于记录传达到所述高速缓存架构中的服务器的全部失效消息以形成已发送失效消息的集合;分析模块,用于确定在所述高速缓存架构中的每个服务器接收的失效消息以及将接收的失效消息与所述已发送失效消息的集合对比以识别一个或多个未传递失效消息;重放模块,用于向所述高速缓存架构中的适当服务器再次发送一个或多个识别的未传递失效消息。
Description
技术领域
本发明涉及跟踪和检查消息以及在必要时采取补救措施的方法和系统。
背景技术
在旅游系统中有许多消息从一处分发到另一处。典型情况下,旅游系统可以包含中心数据服务器和由遍布该系统分布的许多不同级别的高速缓存组成的高速缓存架构。高速缓存架构从许多不同的供应商获得更新,然后把它们从应用服务器传达到不同级别的高速缓存。该系统的工作基础是不要求消息的确认。该系统假设已经稳妥地收到了消息。数据库应用服务器将消息发送到中心数据服务器上的许多中心高速缓存,中心数据服务器然后又将消息发送到众多计算服务器上的本机高速缓存。这些消息意在使高速缓存的内容失效。它们被称为失效消息。在典型的旅游系统中可能每天都有多达100,000个更新,这等同于极多的消息要应对。如果未收到消息便发生问题,此时可能发生的问题可能导致对消费者的财务影响。为了确保和控制分布式高速缓存架构中的数据一致性,可以使用异步失效消息。它的实现方式困难而耗时并且目前尚未以有效方式实现。
为了应对航空公司旅客机票审计已经提出了许多系统。西北航空公司已经提出了一种这样的系统,它使用专家系统审计过程来复查报告。这种系统未能应对与跟踪失效消息等问题相关联的许多难题。同样,其他系统提供了费用验证产品以及映射和匹配产品,它们仍然未能解决跟踪失效消息的问题。
US6,604,205公开了同一网络中连接的至少两台设备之间状态同步的方法和系统。第一台设备把消息发送到第二台设备,以第一标识符附着到该消息。第二台设备然后对该消息应用特定过程,它又把第一标识符变换为第二标识符。第一台设备然后向第二台设备发送状态请求,请求第二标识符的传输。第一台设备的比较模块然后比较第一标识符和第二标识符以判断第一台设备的状态是否与第二台设备的状态同步。
发明内容
本发明的目的是克服与现有技术相关联的至少某些问题。
本发明的进一步目的是提供一种方法和系统,能够有效地跟踪和监视失效消息以及在需要时再次发送所述消息。
本发明提供了附带的权利要求书中阐述的方法和系统。
根据本发明的一个方面,提供了用于跟踪报价和订购平台的高速缓存架构中的消息的失效跟踪器系统,其中所述高速缓存架构包括多个级别,其中每个级别都包含一个或多个服务器,其中失效消息从一个级别传达到另一个级别,以便把失效消息发送到所述高速缓存架构中的全部服务器,以及其中所述失效跟踪器系统从供应商数据库接收要传达到所述高速缓存架构中的服务器的数据;其中所述失效跟踪器系统包括:
-记录模块,用于记录传达到所述高速缓存架构中的服务器的全部失效消息以形成已发送失效消息的集合;
-分析模块,用于确定在所述高速缓存架构中的每个服务器接收的失效消息以及将接收的失效消息与所述已发送失效消息的集合对比以识别一个或多个未传递失效消息;
-重放模块,用于向所述高速缓存架构中的适当服务器再次发送一个或多个识别的未传递失效消息。
可选情况下,所述重放模块基于已经满足的预定条件再次发送失效消息。
可选情况下,所述预定条件包括多条重现的未传递失效消息。
可选情况下,在未传递失效匹配消息的数目超过预定阈值时触发所述预定条件。
可选情况下,所述预定条件是识别服务器不在运行。
可选情况下,所述系统进一步包括通知模块,用于创建未传递失效消息的通知并向用户传达所述通知。
可选情况下,所述系统进一步包括报告模块,用于创建报告并向用户传达所述报告。
可选情况下,所述失效跟踪器进一步包括监督器模块,用于控制未传递失效消息的自动检索。
可选情况下,所述失效跟踪器系统进一步包括配置管理模块,所述配置管理模块存储关于所述高速缓存架构的设置和分布状况的信息。
根据本发明的第二方面,提供了一种用于跟踪报价和订购平台的高速缓存架构中的消息的方法,其中所述高速缓存架构包括多个级别,其中每个级别都包含一个或多个服务器,其中失效消息从一个级别传达到另一个级别,以便把失效消息发送到所述高速缓存架构中的全部服务器,以及其中所述消息由所述失效跟踪器系统跟踪,所述失效跟踪器系统从供应商数据库接收要传达到所述高速缓存架构中的服务器的数据;其中所述方法包括:
-经由计算机记录传达到所述高速缓存架构中的服务器的全部失效消息以形成已发送失效消息的集合;
-经由计算机中的检测器确定在所述高速缓存架构中的每个服务器接收的失效消息以及将接收的失效消息与所述已发送失效消息的集合对比以识别一个或多个未传递失效消息;
-经由消息系统向所述高速缓存架构中的适当服务器再次发送一个或多个识别的未传递失效消息。
可选情况下,再次发送失效消息的步骤根据预定条件。
可选情况下,所述预定条件包括识别多个重现的未传递失效消息。
可选情况下,所述预定条件包括在未传递失效匹配消息的数目超过预定阈值时触发所述消息重放。
可选情况下,所述预定条件包括识别服务器不在运行。
可选情况下,所述方法包括创建未传递失效消息的通知并向用户传达所述通知的步骤。
可选情况下,所述方法包括创建报告并向用户传达所述报告的步骤。
可选情况下,所述方法包括经由监督器模块控制未传递失效消息的自动检索的步骤。
可选情况下,所述方法包括经由配置管理模块存储关于所述高速缓存架构的设置和分布状况的信息。
附图说明
现在将对例如附图进行参考,其中:
图1是根据本发明的实施例的失效跟踪器系统的框图;
图2是根据本发明的实施例的用于过程第一部分的系统框图;
图3是根据本发明的实施例的用于过程第二部分的系统框图;
图4是根据本发明的实施例的用于过程第三部分的系统框图;
图5是根据本发明的实施例的用于过程第四部分的系统框图;
图6是根据本发明的实施例的用于过程第五部分的系统框图;
图7是根据本发明的实施例的系统的整体概况的框图;
图8是根据本发明的实施例的系统的使用事例的总图;
图9至图18是根据本发明的实施例的许多特定使用事例图。
具体实施方式
本发明涉及被设计为要在费用高速缓存系统环境中使用的失效跟踪器系统。报价和订购平台(PSP)的高速缓存架构由横跨PSP组件分布的几个级别的高速缓存组成。正如图2所示,有单个数据库应用服务器200与多台中心数据服务器202通信,多台中心数据服务器202又与众多计算服务器204通信。在所示的实例中,有三台中心数据服务器和大约150台计算服务器。应当认识到在不同的环境中可以使用不同数量的中心数据服务器和计算服务器。这个高速缓存架构被连接到从供应商连续地获取数据更新的数据库。高速缓存借助从数据库应用服务器发送的失效信息得以更新。可以有不止一个数据库,比如主文件数据库和有效图像数据库。不过,不同的数据库可以在不同的情况中使用。
失效跟踪器系统和方法涉及检查由数据应用服务器发送的失效消息被终端用户接收。按定期方式进行这些检查,并且如果识别出任何不一致,可以自动地再次发送失效消息或在用户的控制下再次发送。如果识别出反复出现的问题,可以产生警报或出错消息以便能够通知用户或操作员。失效跟踪器系统和方法可以用于对失效流程中全部系统组件和子系统进行调查。
参考图1,显示了失效跟踪器系统组件的概况。图3更详细地介绍了各种功能。系统包括失效跟踪器102所在的数据控制台服务器100。系统进一步包括数据库应用服务器104、客户机数据服务器(CDS)子系统106和报价或低费用搜索(LFS)子系统108(后文称为计算服务器)。失效跟踪器系统包括三个主要模块。失效跟踪器监督器110对于给定时间范围和给定终端用户或目标组管理全自动检测以及重放或再次发送任何丢失的失效消息。失效跟踪器检测器模块112通过分析来自目标失效组件的关键字记录器文件的关键字来识别遗漏的失效消息。失效跟踪器重放模块114重放或向所请求的目标再次发送丢失的失效消息。失效跟踪器系统基于中间件服务等级。
逻辑失效流程包括四种类型的系统组件。第一种是位于数据库应用服务器116上的数据库应用服务器的失效服务。它向CDS CIX(中心失效)服务器队列的消息队列发送逻辑关键字阵列。CIX服务器118接收包含逻辑实体关键字阵列的消息,以便使其失效并将其分发到包含至IIX(单独失效)服务器120的单关键字的消息中。IIX服务器管理CDS高速缓存上的单失效消息并把这些失效消息转发到定价卫星或目标124上的LIX(本地失效)服务器122。LIX服务器处理计算服务器上的失效消息。每个服务器都包括与检测器112通信的适当的关键字记录器(124、126、128和130)。关键字记录器的目标是本地存储由每个服务器接收的全部消息。
失效跟踪器系统要求每个失效系统组件记录其接收的任何消息的关键字。这种记录通过与每个服务器相关联的关键字记录器系统组件完成。关键字被记录,这使得确定失效流程在何处失败更容易。失效跟踪器系统组件之间的通信基于标准的中间件通信。结果,关于系统中特定组件的全部必要信息都被存储在失效跟踪器专用的配置文件中。必要信息可以包括主机名、目标中间件环境或目标数据库。失效跟踪器系统能够按照失效判断目标是否可运行,并且在不可运行时忽略该目标。
失效跟踪器系统借助几个专门编写的过程监视和重放失效消息。第一个过程是记录过程,由服务器接收的失效消息在该过程中被记录在每个服务器上。在分析过程中基于固定时间的方式对每个服务器上接收的失效消息进行从头到尾的检查。如果消息丢失则使用重放过程,而且为了刷新对应数据自动地重放相关消息。如果消息丢失则使用通知过程进行识别。使用报告过程来记录和存档全部操作并且不时地产生统计报告。每个专门编写的过程将参考图2至图6进行说明。
参考图2,每个服务器都包括分别为206、208和210的失效消息处理程序;分别为212、214和216的记录处理程序;以及分别为218、220和222的压缩后失效消息的数据库。从失效消息处理程序206向失效消息处理程序208发送消息。失效消息处理程序208然后把该消息传播到相应的失效消息处理程序210。
每个失效消息处理程序都把消息传递到其各自的记录处理程序,在数据应用服务器中所示的模块224和226中记录和压缩。在消息已经被记录和压缩后,压缩的消息被存储在数据应用服务器中所示的数据库218中。在中心数据服务器和计算服务器中能找到类似的布局。这就完成了每个服务器上全部失效消息的记录过程。
对于这种类型的典型PSP高速缓存系统,总数据量将在每天4.5GB量级,以每秒大约15,000条消息的本地速率。高速缓存系统的保留期限典型情况下将为五天的量级。已发送全部消息在每个服务器的压缩后失效消息数据库中被存储预定时间。
现在参考图3,现在将介绍分析过程。数据控制台服务器300与数据应用服务器200、中心数据服务器202和计算服务器204通信。数据控制台服务器中的失效跟踪器系统包括协调程序模块308、配置管理器310和配置数据库312。另外,失效跟踪器进一步包括与两个数据库通信的检测器314:要重放的消息的数据库316和历史数据库318。检测器也与失效消息收集器320通信。
服务器200、202和204的每一台都包括在数据应用服务器200中示为212的记录处理程序。记录处理程序与压缩后失效消息的数据库218通信。记录处理程序包括检索模块324、解压器模块326和串联模块328。其他传感器202和204同等地配置。
协调程序模块定期触发分析循环。协调程序模块与检测器314中的分析器模块330通信。分析器类似地与失效消息收集器320中的收集器模块332通信。收集器模块收集和记录从PSP系统服务器中接收或完成的失效消息的细节。收集从每层服务器中进行:数据库应用服务器;中心数据库服务器;以及计算服务器。分析器模块然后应用算法以检测、识别和存储尚未收到或已经丢失的消息。正如先前陈述,对每条消息的关键字记录使得容易识别该消息以及它在何处丢失。已经丢失并且可能需要后来重放的消息被存储在数据库316中。配置管理器310对PSP系统服务器的设置和分布状况有集中的了解,并且能够协调失效消息的收集。网络的配置被存储在配置数据库312中并且能够在网络改变时更新。历史数据库318用于保存全部操作的记录。在运行时,分析器模块330首先检查数据库应用服务器处接收的消息。随后检查在中心数据服务器的消息并且最后检查在计算服务器的消息。这种顺序能够识别出特定失效消息的失败点。
检索模块324在如图3中所示出的数据库应用服务器中。检索模块324识别然后传递所接收的失效消息。这些消息从数据应用服务器发送到中心数据服务器,然后从中心数据服务器发送到计算服务器。
已经分析了失效消息的接收后,该过程的下一个阶段是在已经识别出丢失的消息的情况下重放或再次发送消息。这将参考图4介绍,其中与图3相同的单元将具有同样的附图标记,并且将不会进一步详细地介绍,除非这属于重放失效消息的过程。除了先前介绍的模块之外,失效跟踪器还包括重放模块400和失效消息发送模块402。在分析了丢失的失效消息后,确定对于特定服务器已经丢失的消息数量。如果丢失的消息数量低于某阈值便通知发送者或用户,并且再次发送丢失的消息。不过,如果丢失的消息数量高于某阈值,则向协调程序或用户发送警报状态,因为有问题的服务器很可能不再运行而再次发送消息将不起任何作用。
全部操作以及所记录并重放的消息都存储在历史数据库中。已经识别出消息已经在某服务器丢失后,失效消息发送模块将向没有收到该消息的服务器发送丢失的消息。如果这台服务器是数据应用服务器或中心数据服务器之一,那么该消息将分别向这些中心数据服务器和计算服务器传递。如果消息在特定服务器丢失,在该点之后的任何服务器也都将不会收到该消息,因此这就是对计算服务器(它们是失效流程的端点)以外的任何服务器重放消息时要把它传递下去的原因。在PSP系统服务器内发送的消息遵循来自接收该重放消息的服务器的标准失效流程。
参考图5,失效跟踪器系统包括通知模块500,它能够用于基于已经被重放消息的状态发送通知。这些消息能够包括全部丢失的消息已经被重放的事实。作为替代,能够发送一条消息表明,消息已经被重放了几次。如果丢失的消息的数量高于某阈值,便可以产生通知,它给出某特定服务器当前不在运行的指示。借助任何适合的通信插件比如邮件、RSS(网络送入格式)、SMS等能够发送这些通知。
以类似方式,图6介绍了本发明的报告过程。失效跟踪器系统包括存档数据库600、存档模块602、统计模块604和报告数据库606。
协调程序模块能够定期触发报告的产生。此外,报告的性质可以预定义或开发并且应特定用户或供应商的请求而产生。报告的性质可以由配置管理模块识别。存档数据库包括比历史数据库更长期的数据保留,并且存档模块能够访问存档数据库,并且使用适当的统计产生所要求的报告。
图2至图6的每一幅都已经被用于介绍由失效跟踪器系统所执行的部分过程。图7显示了失效跟踪器系统的整体概况图。各个单元根据图2至图6中的类似单元编号,并且等效解释和描述将适用于每个单元。以上介绍的失效跟踪器系统是全自动的并高度可配置。另外,失效跟踪器系统是分布式的、可缩放的并能够与任何全球PSP系统集成。
本发明用于管理旅游业中使用的巨量的失效消息。能够监视大量主机并能够跟踪持久的数据流。现在将对许多使用案例进行引用以进一步演示本发明的功能。图8显示了一般的使用案例图。失效跟踪器监督器800是高层次模块,管理对于给定时间范围和给定服务器组丢失的失效消息的全自动检测和重放。失效跟踪器检测器模块802通过分析来自关键字记录器文件的关键字来确定丢失的失效消息以瞄准失效组件。失效跟踪器重放模块804借助失效过程806把丢失的失效消息重放给所请求的目标。用户808与多个模块通信而若干过程的调度由调度器系统810管理。
在以下具体使用案例中,用户或失效跟踪器监督器900与对其发送、接收或以其他方式处理失效消息的各个目标通信。在以下篇幅中以这种方式解释术语用户和目标。
在图9显示的使用案例中,全部目标在运行而且没有丢失有效消息。失效跟踪器检测器902接收在各个系统组件之间被发送和被接收的失效消息,并且检查是否已经丢失了任何消息。如果已经丢失了消息便提供丢失关键字的列表。分析的时间范围被预定义并且用户使用失效跟踪器检测器进行特定调查。作为替代,可以安排自动检查以自动地执行。
在第一个步骤904中,从用户向失效跟踪器检测器发送检查请求。这种请求能够基于许多不同的准则。在步骤906中失效跟踪器检测器将以源失效组件908检查失效路由。在步骤910中源失效组件指出该组件在运行。在步骤912中失效跟踪器检测器请求源失效组件对具体时间范围建立源失效列表;这在步骤914中返回。随后失效跟踪器检测器对全部目标失效组件进行调查。对于每个目标失效组件执行以下步骤。在步骤918中失效跟踪器检测器从跟踪器失效组件916判断该失效路由是否在运行。在步骤920中从目标失效组件发出应答以确认该组件在运行。在步骤922中失效跟踪器检测器从目标失效组件请求在具体时间范围上的目标失效列表。在这种情况下,在步骤924中目标失效组件916确认还没有丢失失效消息。以这种方式检查全部目标失效组件之后,在步骤926中失效跟踪器检测器判断是否存在着任何已经丢失的消息。在这种情况下,由于尚未丢失消息所以在步骤928中失效跟踪器检测器向用户传达没有丢失的关键字。根据在给定时间范围内由所请求的失效系统组件所记录的逻辑关键字,建立目标失效消息列表。该列表自身包括在给定时间由所请求的失效系统所记录的逻辑关键字。步骤926包括比较步骤,其中对比由若干服务器和目标失效系统组件所记录的关键字列表。
现在参考图10,这个使用案例涉及在运行但是丢失了失效消息的目标。如图9中的介绍执行步骤904、906、910、912、914、918、920和922。不过,在这种情况下已经从一个或多个目标失效组件中丢失了消息。结果,在步骤1000产生了已经检测到丢失的失效消息的指示。在步骤1002对丢失消息的检查对每个服务器识别丢失的关键字,然后在步骤1004将其传达给用户。
现在参考图11,该使用案例涉及不在运行的目标。如同先前实例,如以上的介绍执行步骤904、906、910、912、914和918。由于目标失效组件不在运行,所以在步骤1100中失效跟踪器检测器判定该目标不在用。在步骤1102中向用户通知特定目标失效组件不在运行而且不在接收消息。
图12涉及源失效组件不在运行的使用案例。如以上的介绍执行步骤904和906。由于在步骤1200源失效组件不在运行,所以向失效跟踪器检测器通知该组件不在运行。然后在步骤1202将其传达给用户。
在图13涉及的使用案例中丢失了许多失效消息,但是数量尚未达到以上讨论的预定阈值。此外,此使用案例涉及不存在从特定目标重现丢失失效消息的情况。在这种情况下用户或失效跟踪器监督器900与失效跟踪器重放模块1300和失效过程1302通信。在步骤1306用户向失效跟踪器重放模块1300发送要重放的失效消息列表。由该用户确定阈值(它涉及对特定目标能够被重放的失效消息的最大数量)以及测量此阈值经过的延迟。已经向每个目标重放的消息列表被更新,这意味着在当前时间被处理的丢失的消息仅仅是在步骤1306中所提供的列表中的消息。在监督过程期间用户或监督器能够控制失效跟踪器重放模块。要重放消息的列表必须仅仅包含非重现的丢失的消息以及没有到达特定目标但是尚未达到阈值的消息。任何非重现的丢失的消息都基于对被发送失效消息的计时以由用户配置的延迟被重放。典型的延迟为一秒的量级。为了保护被重放的信息量,如果失效消息数量已经达到每个目标的阈值或者这些消息已经在给定时间范围期间被重放,该系统便不播放这些消息。在已经达到了阈值的情况下,警报出现并由任何适宜装置比如电子邮件发送给用户。
返回到图13,步骤1308涉及过滤逻辑关键字的步骤。该过滤器从给定的消息列表和对给定的目标确定要失效的逻辑关键字。之所以没有过滤出任何关键字是因为目标的阈值还未达到阈值并且不存在重现的丢失的失效消息。结果,在列表中的全部关键字都被标注为准备好重放。在步骤1310中,对于已经丢失的失效消息,逻辑关键字的列表被发送给失效过程。同时在步骤1312中重放的关键字的列表被存储并传达给用户。
在图14中,使用案例涉及已经丢失的失效消息的数量达到或超过了至少一个目标的阈值。如以上的介绍执行步骤1306。在步骤1400应用过滤器。在这种情况下失效消息的逻辑关键字被过滤器全部过滤出,因为丢失的失效消息的数量已经达到或超过了至少一个目标的阈值。结果,该系统将不播放任何失效消息。在步骤1402转而向该用户发送消息以指示已经丢失的消息多得无法重放它们。
在图15涉及的使用案例中,对特定目标存在着重现的丢失的失效消息。如以上的介绍执行步骤1306。在步骤1500对失效消息列表应用过滤器。在这种情况下列表中存在着某些重现误差。这些在步骤1500被过滤出并在步骤1502产生丢失的重现消息的警报。列表上的其他消息在步骤1504被发送到失效过程并向有问题的目标重放。在步骤1506向用户通知已经被重放的消息,以便使其能够被存储。
在图16公开的使用案例中,在许多目标上存在着丢失的失效消息。如以上的介绍发送消息并在步骤1600应用过滤器。该过滤器在步骤1602判定对于框符1(第一个目标)存在着太多的丢失消息并产生了警报消息。此外,在步骤1604过滤器识别出框符2(第二个目标)具有许多重现的丢失的消息。失效跟踪器重放模块然后产生要在步骤1606通过失效过程1302重放的消息的列表。步骤1606包括不对框符1重放任何消息;对于框符2的消息仅仅是与非重现的丢失的关键字有关的消息;以及对于所有的其他框符(目标)全部丢失关键字都被重放。在步骤1608通知用户已经重放的消息因而可以存储它们。
图17涉及的使用案例包括失效跟踪器监督器1700。为了有规律地运行该过程,该过程由调度系统1702协调。本系统还使用了失效跟踪器检测器902和失效跟踪器重放模块1300。产生了要检查的时间范围和系统组件列表并且停用了失效跟踪器重放模块。如果有任何丢失的消息,则产生丢失的失效消息的列表作为该过程的结果。这个使用案例描述的过程监督失效消息流并且是全自动的。可以产生包含丢失的失效消息的报告。在第一个步骤1704中,系统的调度器产生对具体时间范围的检查失效消息的请求。在步骤1706失效跟踪器监督器请求失效跟踪器检测器在给定时间跨度上全局地检查失效流。失效跟踪器检测器在步骤1708中识别出任何关键字或丢失的消息并且把这些返回在列表中。
在图18显示的使用案例中,失效跟踪器监督器产生自动重放。如以上的介绍执行步骤1704、1706和1708。这个使用案例描述的过程监督失效消息流;由调度系统调度;并且是全自动的。在重现错误的情况下由失效跟踪器重放模块产生报告并能够产生警报向用户发送。监督过程使用了在失效跟踪器检测器和失效跟踪器重放模块使用案例中已经介绍的功能。在步骤1804中重放失效消息的列表从失效跟踪器监督器发送到失效跟踪器重放模块。只有非重现的失效消息才将被重放。消息已经重放的确认在步骤1802中被发送给失效跟踪器监督器,并且在步骤1804中发送给用户。
本领域的技术人员将理解,某些或全部功能实体以及这些过程自身可以实施为软件或者一个或多个软件启用的模块和/或器件或者其任何组合。该软件可以运行在任何适宜的计算机或其他机器上。本发明的运行提供了许多变换,比如监视失效消息以及在需要时再次发送。
本系统和方法运行在特定机器上,比如被配置执行本发明的多个步骤和功能的计算机。本发明还涉及许多变换,包括监视关键字记录数据的能力以及使用其再次发送或重放消息的能力。
参考旅行环境中失效消息的使用已经介绍了本发明。不过,应当认识到,本发明可以应用于其他环境。应当认识到,本发明可以以许多不同方式变化而仍然保持在权利要求书中定义的本发明的意图范围之内。
Claims (19)
1.一种用于跟踪报价和订购平台的高速缓存架构中的失效消息的失效跟踪器系统,其中所述高速缓存架构包括多个级别,其中所述多个级别中的每个级别都包含一个或多个服务器,其中失效消息从所述多个级别中的一个级别传达到所述多个级别中的另一个级别,以便把失效消息发送到所述高速缓存架构中的全部服务器,以及其中所述失效跟踪器系统从供应商数据库接收要传达到所述高速缓存架构中的服务器的数据,并且其中所述服务器中的每个服务器包括用于本地存储由每个服务器接收的全部失效消息的对应的关键字记录器;其中所述失效跟踪器系统包括:
-记录模块,用于记录传达到所述高速缓存架构中的服务器的全部失效消息以形成已发送失效消息的集合,其中所述失效消息用于使所述高速缓存架构内的内容失效;
-分析模块,用于确定在所述高速缓存架构中的服务器中的每个服务器接收的失效消息以及将所述失效消息与所述已发送失效消息的集合对比以识别一个或多个未传递失效消息;
-检测模块,用于在所述高速缓存架构内一次一个级别地检查服务器中的每个服务器的对应的关键字记录器以确定在所述高速缓存架构中的多个级别中的每个级别接收的失效消息,以及基于将在所述高速缓存架构中的多个级别中的每个级别接收的失效消息与所述已发送失效消息的集合对比来识别所述高速缓存架构内的、一个或多个未传递失效消息未被传递的特定级别,其中所述失效跟踪器系统通过在所述高速缓存架构内一次一个级别地检查服务器中的每个服务器的关键字记录器来确定所述高速缓存架构内的特定级别;以及
-重放模块,用于向所述高速缓存架构中的适当服务器再次发送一个或多个未传递失效消息。
2.根据权利要求1所述的失效跟踪器系统,其中,所述重放模块基于已经满足预定条件而再次发送失效消息。
3.根据权利要求2所述的失效跟踪器系统,其中,所述预定条件包括多个重现的未传递失效消息。
4.根据权利要求2所述的失效跟踪器系统,其中,如果未传递失效匹配消息的数目超过预定阈值,则触发所述预定条件。
5.根据权利要求2所述的失效跟踪器系统,其中,所述预定条件是识别所述服务器中的至少一个不在运行。
6.根据权利要求1所述的失效跟踪器系统,进一步包括通知模块,用于创建一个或多个未传递失效消息的通知并向用户传达所述通知。
7.根据权利要求1所述的失效跟踪器系统,进一步包括报告模块,用于创建包含丢失的失效消息的报告并向用户传达所述报告。
8.根据权利要求1所述的失效跟踪器系统,其中,所述失效跟踪器进一步包括监督器模块,用于控制一个或多个未传递失效消息的自动检索。
9.根据权利要求1所述的失效跟踪器系统,其中,所述失效跟踪器系统进一步包括配置管理模块,所述配置管理模块存储关于所述高速缓存架构的设置和分布状况的信息。
10.一种用于跟踪报价和订购平台的高速缓存架构中的失效消息的方法,其中所述高速缓存架构包括多个级别,其中所述多个级别中的每个级别都包含一个或多个服务器,其中失效消息从所述多个级别中的一个级别传达到所述多个级别中的另一个级别,以便把失效消息发送到所述高速缓存架构中的全部服务器,以及其中所述失效消息由失效跟踪器系统跟踪,所述失效跟踪器系统从供应商数据库接收要传达到所述高速缓存架构中的服务器的数据,并且其中所述服务器中的每个服务器包括用于本地存储由每个服务器接收的全部失效消息的对应的关键字记录器;其中所述方法包括:
-经由记录模块记录传达到所述高速缓存架构中的服务器的全部失效消息以形成已发送失效消息的集合,其中所述失效消息用于使高速缓存架构内的内容失效;
-经由计算机中的分析模块确定在所述高速缓存架构中的每个服务器接收的失效消息以及将失效消息与所述已发送失效消息的集合对比以识别一个或多个未传递失效消息;
-经由检测模块在所述高速缓存架构内一次一个级别地检查服务器中的每个服务器的对应的关键字记录器以确定在高速缓存架构中的多个级别中的每个级别接收的失效消息;
-经由检测模块基于将在所述高速缓存架构中的多个级别中的每个级别接收的失效消息与所述已发送失效消息的集合对比来识别所述高速缓存架构内的、一个或多个未传递失效消息未被传递的特定级别,其中所述失效跟踪器系统通过在所述高速缓存架构内一次一个级别地检查服务器中的每个服务器的关键字记录器来确定所述高速缓存架构内的特定级别;以及
-经由重放模块向所述高速缓存架构中的适当服务器再次发送一个或多个未传递失效消息。
11.根据权利要求10所述的方法,其中,重放失效消息是基于预定条件的。
12.根据权利要求11所述的方法,其中,所述预定条件包括识别多个重现的未传递失效消息。
13.根据权利要求11所述的方法,其中,所述预定条件包括如果未传递失效匹配消息的数目超过预定阈值,则触发消息的重放。
14.根据权利要求11所述的方法,其中,所述预定条件包括识别是否所述服务器中的至少一个服务器不在运行。
15.根据权利要求10所述的方法,进一步包括创建一个或多个未传递失效消息的通知并向用户传达所述通知。
16.根据权利要求10所述的方法,进一步包括创建包含丢失的失效消息的报告并向用户传达所述报告。
17.根据权利要求10所述的方法,进一步包括控制一个或多个未传递失效消息的自动检索。
18.根据权利要求10所述的方法,进一步包括存储关于所述高速缓存架构的设置和分布状况的信息。
19.一种包含指令的非暂态计算机可读存储介质,当所述指令在所述非暂态计算机可读存储介质上执行时,所述指令用于执行根据权利要求10至18中任何一项的方法的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11306756.5 | 2011-12-22 | ||
EP11306756.5A EP2608061B1 (en) | 2011-12-22 | 2011-12-22 | Method and system for update message tracking and checking |
PCT/EP2012/070318 WO2013091926A2 (en) | 2011-12-22 | 2012-10-12 | Method and system for message tracking and checking |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104011719A CN104011719A (zh) | 2014-08-27 |
CN104011719B true CN104011719B (zh) | 2017-07-18 |
Family
ID=47008637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280063170.3A Active CN104011719B (zh) | 2011-12-22 | 2012-10-12 | 消息跟踪和检查的方法和系统 |
Country Status (11)
Country | Link |
---|---|
US (1) | US9367578B2 (zh) |
EP (1) | EP2608061B1 (zh) |
JP (1) | JP6050378B2 (zh) |
KR (1) | KR101886855B1 (zh) |
CN (1) | CN104011719B (zh) |
AU (1) | AU2012330499B2 (zh) |
BR (1) | BR112014013530A2 (zh) |
CA (1) | CA2859872C (zh) |
ES (1) | ES2896059T3 (zh) |
SG (1) | SG11201402530UA (zh) |
WO (1) | WO2013091926A2 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9197522B1 (en) * | 2012-03-21 | 2015-11-24 | Emc Corporation | Native storage data collection using multiple data collection plug-ins installed in a component separate from data sources of one or more storage area networks |
US8990375B2 (en) | 2012-08-31 | 2015-03-24 | Facebook, Inc. | Subscription groups in publish-subscribe system |
US9635095B1 (en) | 2012-09-12 | 2017-04-25 | Fastly Inc. | Data purge distribution and coherency |
US9189510B2 (en) * | 2013-02-26 | 2015-11-17 | Facebook, Inc. | System and method for implementing cache consistent regional clusters |
JP5913196B2 (ja) * | 2013-05-27 | 2016-04-27 | 株式会社日立製作所 | 計算機システム及び障害特定方法 |
US9648125B2 (en) * | 2013-10-04 | 2017-05-09 | Akamai Technologies, Inc. | Systems and methods for caching content with notification-based invalidation |
US9641640B2 (en) | 2013-10-04 | 2017-05-02 | Akamai Technologies, Inc. | Systems and methods for controlling cacheability and privacy of objects |
US9813515B2 (en) | 2013-10-04 | 2017-11-07 | Akamai Technologies, Inc. | Systems and methods for caching content with notification-based invalidation with extension to clients |
CN103701667A (zh) * | 2013-12-27 | 2014-04-02 | 乐视网信息技术(北京)股份有限公司 | 服务器的心跳的监控方法、装置及系统 |
CN104580169A (zh) * | 2014-12-23 | 2015-04-29 | 惠州Tcl移动通信有限公司 | 一种进行文件同步的方法及系统 |
US10237073B2 (en) | 2015-01-19 | 2019-03-19 | InAuth, Inc. | Systems and methods for trusted path secure communication |
EP3373544A1 (en) * | 2017-03-07 | 2018-09-12 | ABB Schweiz AG | Automatic communication network system hardening |
US10698792B2 (en) * | 2018-05-02 | 2020-06-30 | Microsoft Technology Licensing, Llc | Execution control with cross-level trace mapping |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6041423A (en) * | 1996-11-08 | 2000-03-21 | Oracle Corporation | Method and apparatus for using undo/redo logging to perform asynchronous updates of parity and data pages in a redundant array data storage environment |
US6604205B1 (en) | 2000-02-07 | 2003-08-05 | Hewlett-Packard Development Co., L.P. | System and method for state synchronization |
US6792544B2 (en) * | 2001-04-03 | 2004-09-14 | Ge Financial Assurance Holdings, Inc. | Method and system for secure transmission of information |
JP3823319B2 (ja) | 2003-07-07 | 2006-09-20 | 日本電気株式会社 | メッセージ送受信装置の復旧システム及び方法 |
US7143244B2 (en) * | 2003-09-05 | 2006-11-28 | Oracle International Corp. | System and method for invalidating data in a hierarchy of caches |
US7089363B2 (en) * | 2003-09-05 | 2006-08-08 | Oracle International Corp | System and method for inline invalidation of cached data |
US7412642B2 (en) * | 2005-03-09 | 2008-08-12 | Sun Microsystems, Inc. | System and method for tolerating communication lane failures |
EP1770954A1 (en) * | 2005-10-03 | 2007-04-04 | Amadeus S.A.S. | System and method to maintain coherence of cache contents in a multi-tier software system aimed at interfacing large databases |
US7653668B1 (en) * | 2005-11-23 | 2010-01-26 | Symantec Operating Corporation | Fault tolerant multi-stage data replication with relaxed coherency guarantees |
US7664125B1 (en) * | 2006-01-03 | 2010-02-16 | Emc Corporation | Indication forwarding in a distributed environment |
US7937618B2 (en) * | 2007-04-26 | 2011-05-03 | International Business Machines Corporation | Distributed, fault-tolerant and highly available computing system |
JP5359201B2 (ja) | 2008-11-06 | 2013-12-04 | 富士通株式会社 | コンテンツの削除更新プログラム |
-
2011
- 2011-12-22 ES ES11306756T patent/ES2896059T3/es active Active
- 2011-12-22 EP EP11306756.5A patent/EP2608061B1/en active Active
-
2012
- 2012-01-19 US US13/354,154 patent/US9367578B2/en active Active
- 2012-10-12 SG SG11201402530UA patent/SG11201402530UA/en unknown
- 2012-10-12 KR KR1020147017250A patent/KR101886855B1/ko active IP Right Grant
- 2012-10-12 AU AU2012330499A patent/AU2012330499B2/en active Active
- 2012-10-12 WO PCT/EP2012/070318 patent/WO2013091926A2/en active Application Filing
- 2012-10-12 BR BR112014013530A patent/BR112014013530A2/pt not_active IP Right Cessation
- 2012-10-12 CN CN201280063170.3A patent/CN104011719B/zh active Active
- 2012-10-12 JP JP2014547780A patent/JP6050378B2/ja active Active
- 2012-10-12 CA CA2859872A patent/CA2859872C/en active Active
Also Published As
Publication number | Publication date |
---|---|
KR101886855B1 (ko) | 2018-09-11 |
BR112014013530A2 (pt) | 2017-06-13 |
EP2608061A1 (en) | 2013-06-26 |
AU2012330499A1 (en) | 2013-07-11 |
KR20140111257A (ko) | 2014-09-18 |
AU2012330499B2 (en) | 2014-10-30 |
CA2859872A1 (en) | 2013-06-27 |
SG11201402530UA (en) | 2014-10-30 |
WO2013091926A2 (en) | 2013-06-27 |
EP2608061B1 (en) | 2021-07-28 |
US9367578B2 (en) | 2016-06-14 |
JP2015507260A (ja) | 2015-03-05 |
CN104011719A (zh) | 2014-08-27 |
JP6050378B2 (ja) | 2016-12-21 |
CA2859872C (en) | 2019-06-18 |
ES2896059T3 (es) | 2022-02-23 |
US20130166729A1 (en) | 2013-06-27 |
WO2013091926A3 (en) | 2013-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104011719B (zh) | 消息跟踪和检查的方法和系统 | |
CN106940677A (zh) | 一种应用日志数据告警方法及装置 | |
JP2021141582A (ja) | 障害回復方法および障害回復装置、ならびに記憶媒体 | |
CN111158983A (zh) | 一种一体化运维管理系统 | |
CN104268061A (zh) | 一种适用于虚拟机的存储状态监控机制 | |
CN107391335B (zh) | 一种用于检查集群健康状态的方法和设备 | |
CN102111310A (zh) | Cdn设备状态监控方法和系统 | |
CN107579858A (zh) | 云主机的告警方法及装置、通信系统 | |
CN104574219A (zh) | 电网业务信息系统运行工况的监测预警方法及系统 | |
CN113010374A (zh) | 一种基于监控平台的量子设备监控的方法、系统 | |
CN109660396A (zh) | 一种网络监控方法及装置 | |
CN106487597A (zh) | 一种基于Zookeeper的服务监控系统和方法 | |
CN201828915U (zh) | 空间信息监测系统 | |
CN206021244U (zh) | 一种分布式计算机集群下的数据采集系统 | |
CN113157521B (zh) | 用于区块链全生命周期的监控方法和监控系统 | |
CN114201649A (zh) | 电网数据处理系统和处理方法 | |
CN110398755A (zh) | 反无人机设备评测系统和方法 | |
CN105897498A (zh) | 一种监控业务的方法及设备 | |
CN113592208A (zh) | 电子采购平台运维监控系统 | |
CN112449019A (zh) | 一种ims智能物联网运维管理平台 | |
US6941347B2 (en) | Network administration system and method of re-arranging network resources | |
CN109871301A (zh) | 一种远程测试装置、系统及方法 | |
CN116062009A (zh) | 故障分析方法、装置、电子设备及存储介质 | |
CN112732531A (zh) | 一种监控数据的处理方法及装置 | |
CN118331823B (zh) | 航天工程业务运行日志管理与监控告警方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |