CN108694075B - 处理报表数据的方法、装置、电子设备和可读存储介质 - Google Patents

处理报表数据的方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN108694075B
CN108694075B CN201710235874.9A CN201710235874A CN108694075B CN 108694075 B CN108694075 B CN 108694075B CN 201710235874 A CN201710235874 A CN 201710235874A CN 108694075 B CN108694075 B CN 108694075B
Authority
CN
China
Prior art keywords
task
report data
calculation
report
cache
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710235874.9A
Other languages
English (en)
Other versions
CN108694075A (zh
Inventor
刘小云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710235874.9A priority Critical patent/CN108694075B/zh
Publication of CN108694075A publication Critical patent/CN108694075A/zh
Application granted granted Critical
Publication of CN108694075B publication Critical patent/CN108694075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/466Transaction processing
    • G06F9/467Transactional memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues

Abstract

本发明实施例提供一种处理报表数据的方法、装置、电子设备和可读存储介质,能够兼顾大数据量下的响应速度和系统稳定性,满足更高的使用需求。该方法包括:接收包含请求参数的报表请求,根据请求参数将报表请求转换为计算任务;判断在缓存中是否存在与计算任务对应的报表数据;若在缓存中不存在与计算任务对应的报表数据,则进一步判断任务队列中是否存在计算任务;若任务队列中不存在计算任务,则将计算任务加入任务队列;使用处理进程,以便从任务队列中获取计算任务后根据计算任务计算对应报表数据并保存至缓存。

Description

处理报表数据的方法、装置、电子设备和可读存储介质
技术领域
本发明涉及计算机技术领域,特别涉及一种处理报表数据的方法及装置。
背景技术
在生活中工作中总会有报表需求,报表的数据是连续更新的,所以需要一种高效的报表数据生成方案。
现有报表数据生成方案大概有如下几种:
(1)收到报表请求时,查询数据库,即时生成报表数据;
(2)收到报表请求时,优先查询缓存,如果没有在缓存中找到报表数据,则查询数据库,实时生成报表数据,并把结果存入缓存;
(3)后台对全部报表数据进行全量计算,并将结果存入缓存中,供查询使用;报表数据直接缓存获取。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有的方案(1)实时地、直接地从数据库中获取报表数据,由于数据库连接数资源非常宝贵,因此在高并发请求下,可能导致请求获取不到数据库连接,或影响到数据库稳定性的问题;现有的方案(2)如果没有在缓存中查询到报表数据,会转为方案(1),直接从数据库查询数据,存在着相同的问题,如果设置较长的缓存过期时间以缓解数据库压力,则容易造成缓存数据更新不及时,导致获取到的报表数据过期的问题;现有的方案(3)在数据量较大时,容易长时间请求不到所需数据,且存在数据不及时、重复计算的问题,仅适用于数据量要求较小的场景。总体来说,现有技术的方案无法兼顾大数据量下的响应速度和系统稳定性,难以满足使用需求。
发明内容
有鉴于此,本发明实施例提供一种处理报表数据的方法、装置、电子设备和可读存储介质,能够兼顾大数据量下的响应速度和系统稳定性,满足更高的使用需求。
为实现上述目的,根据本发明实施例的一个方面,提供了一种处理报表数据的方法,包括:接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;判断在缓存中是否存在与所述计算任务对应的报表数据;若在所述缓存中不存在与所述计算任务对应的报表数据,则进一步判断任务队列中是否存在所述计算任务;若所述任务队列中不存在所述计算任务,则将所述计算任务加入所述任务队列;使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
可选的,所述任务队列为循环队列;从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存,包括:从所述任务队列队头获取所述计算任务,并放回所述任务队列队尾;判断所述计算任务对应的报表数据是否需要被计算;若所述计算任务对应的报表数据需要被计算,则进一步判断所述计算任务是否被其他所述处理进程占用;若所述计算任务没有被其他所述处理进程占用,则根据所述计算任务计算所述报表数据并保存至所述缓存。
可选的,判断所述计算任务对应的报表数据是否需要被计算,包括:在所述缓存中查找与所述计算任务对应的报表数据;若查找到与所述计算任务对应的报表数据,则进一步判断所述报表数据是否过期;若没有查找到与所述计算任务对应的报表数据,或所述报表数据已过期,则确定所述计算任务对应的报表数据需要被计算。
可选的,所述方法还包括:若确定所述计算任务对应的报表数据不需要被计算,或所述计算任务被其他所述处理进程占用,或完成计算所述报表数据并保存至所述缓存,则进一步判断所述处理进程是否需要休眠;若所述处理进程需要休眠,则根据预设休眠时长进行休眠;若所述处理进程不需要休眠或休眠结束,则从所述任务队列获取新的计算任务并处理。
在一些可选的实施例中,所述方法还包括:
若在所述缓存中存在与所述计算任务对应的报表数据,则返回所述报表数据;若在所述缓存中不存在与所述计算任务对应的报表数据,则在判断任务队列中是否存在所述计算任务的同时返回等待消息。
为实现上述目的,根据本发明实施例的另一个方面,提供了一种处理报表数据的装置,包括:任务转换模块,用于接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;数据查找模块,用于判断在缓存中是否存在与所述计算任务对应的报表数据;任务查找模块,用于在缓存中不存在与所述计算任务对应的报表数据时,进一步判断任务队列中是否存在所述计算任务;任务处理模块,用于在所述任务队列中不存在所述计算任务时,将所述计算任务加入所述任务队列;数据计算模块,用于使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
可选的,所述任务队列为循环队列;所述数据计算模块还用于:从所述任务队列队头获取所述计算任务,将其放回所述任务队列队尾;判断所述计算任务对应的报表数据是否需要被计算;若所述计算任务对应的报表数据需要被计算,则进一步判断所述计算任务是否被其他所述处理进程占用;若所述计算任务没有被其他所述处理进程占用,则根据所述计算任务计算所述报表数据并保存至所述缓存。
可选的,所述数据计算模块还用于:在所述缓存中查找与所述计算任务对应的报表数据;若查找到与所述计算任务对应的报表数据,则进一步判断所述报表数据是否过期;若没有查找到与所述计算任务对应的报表数据,或所述报表数据已过期,则确定所述计算任务对应的报表数据需要被计算。
可选的,所述数据计算模块还用于:若确定所述计算任务对应的报表数据不需要被计算,或所述计算任务被其他所述处理进程占用,或完成计算所述报表数据并保存至所述缓存,则进一步判断所述处理进程是否需要休眠;若所述处理进程需要休眠,则根据预设休眠时长进行休眠;若所述处理进程不需要休眠或休眠结束,则从所述任务队列获取新的计算任务并处理。
可选的,所述数据查找模块还用于,若在所述缓存中存在与所述计算任务对应的报表数据,则返回所述报表数据;所述任务查找模块还用于,若在所述缓存中不存在与所述计算任务对应的报表数据,则在判断任务队列中是否存在所述计算任务的同时返回等待消息。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种处理报表数据的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器至少实现:
接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;判断在缓存中是否存在与所述计算任务对应的报表数据;若在所述缓存中不存在与所述计算任务对应的报表数据,则进一步判断任务队列中是否存在所述计算任务;若所述任务队列中不存在所述计算任务,则将所述计算任务加入所述任务队列;使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
为实现上述目的,根据本发明实施例的又一个方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时至少实现:
接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;判断在缓存中是否存在与所述计算任务对应的报表数据;若在所述缓存中不存在与所述计算任务对应的报表数据,则进一步判断任务队列中是否存在所述计算任务;若所述任务队列中不存在所述计算任务,则将所述计算任务加入所述任务队列;使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
上述发明中的一个实施例具有如下优点或有益效果:因为采用了在接收到报表请求时将其转换为计算任务的技术手段,从而将处于同一阶级的不同用户的报表请求统一为相同的计算任务,解决了现有技术方案中对于每个不同用户请求的报表数据均单独处理、导致数据计算量过大的问题,达到了有效降低数据计算量和内存空间占用量的技术效果。此外,因为采用了将报表数据获取过程和报表数据计算过程分离,并使用分布式处理进程和循环队列处理计算任务的报表数据的技术手段,解决了现有技术在高并发情况下数据库压力过大,影响系统稳定性和相应速度的问题,达到了提高并发处理能力、提升系统稳定性的技术效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的处理报表数据的方法的主要步骤的示意图;
图2是根据本发明实施例的处理报表数据的方法的一些可选步骤的示意图;
图3是根据本发明实施例的处理报表数据的方法的另一些可选步骤的示意图;
图4是根据本发明实施例的处理报表数据的装置的主要模块的示意图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本发明实施例提供的处理报表数据的方法、装置、电子设备和可读存储介质,因为采用了在接收到报表请求时将其转换为计算任务的技术手段,从而将处于同一阶级的不同用户的报表请求统一为相同的计算任务,解决了现有技术方案中对于每个不同用户请求的报表数据均单独处理、导致数据计算量过大的问题,达到了有效降低数据计算量和内存空间占用量的技术效果。此外,因为采用了将报表数据获取过程和报表数据计算过程分离,并使用分布式处理进程和循环队列处理计算任务的报表数据的技术手段,解决了现有技术在高并发情况下数据库压力过大,影响系统稳定性和相应速度的问题,达到了提高并发处理能力、提升系统稳定性的技术效果。
图1是根据本发明实施例的处理报表数据的方法的主要步骤的示意图。
参考图1所示,本发明实施例提供一种处理报表数据的方法,包括:
S10,接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务。其中,请求参数是可以与报表数据唯一对应的参数,换句话说,每一组请求参数可以无疑义地对应到一份报表数据;同理,作为根据请求参数转换得到的计算任务,也可以无疑义地对应到一份报表数据。在处理报表数据时,位于同一阶级(例如拥有相同权限的用户组)的用户所请求的报表数据实际上是相同的,但现有的数据处理方法中,仍然按照各用户分别进行数据计算,这就导致了重复数据的出现。步骤S10正是针对这一问题,将除了请求参数外,所述报表请求还可能包含的用户相关信息、网络相关信息等,视为无效信息,不会参与到计算任务的转换中,从而将同一阶级的用户所请求的报表数据进行了统一,有效减少了数据计算量和缓存的存储压力。
例如,报表请求中可以包含有:客服类型、客服级别、业务标识、用户名、其他信息;其中,只要获取到“客服类型、客服级别、业务标识”,就可以确定需要计算哪些报表数据,所以请求参数就表示“客服类型、客服级别、业务标识”,至于“用户名、其他信息”对于报表数据的计算没有贡献,不在请求参数之列。可见,通过选择一定的请求参数,可以将报表请求中的不必要部分剔除,仅保留必要部分转换为计算任务,从而减少了计算任务和对应的报表数据的数量,降低计算量和缓存占用量。
S11,判断在缓存中是否存在与所述计算任务对应的报表数据。如果在缓存中存在于所述计算任务对应的报表数据,说明在本次报表请求之前,已经有其他用户请求过相同的报表数据,处理进程计算得到报表数据后将报表数据放入了缓存中,此时可以直接获取与所述计算任务对应的报表数据,并将该报表数据返回给发送报表请求的用户。
S12,若在缓存中不存在与所述计算任务对应的报表数据,则进一步判断任务队列中是否存在所述计算任务。
S13,若所述任务队列中不存在所述计算任务,则将所述计算任务加入所述任务队列。任务队列是一个用于存放计算任务的队列,处理进程会根据预设的规则,从任务队列中获取任务并处理。为了保证数据计算的公平性,任务队列可以设置为循环队列,具备先进先出(first in,first out,缩写为FIFO)的特性,一方面可以保证计算任务能被依次循环处理,保证对应的报表数据及时更新,另一方面还能够防止任务丢失(在普通队列中,在计算用进程意外停止、崩溃的过程中,容易造成计算任务丢失,即计算任务从队列中被取出后没有被放回);从而保障先发起的报表请求会被优先计算报表数据,以及各报表数据的持续更新。此外,经过步骤S13的处理,可以保证任务队列中不存在重复任务。
S14,使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。所述处理进程可选采用分布式处理进程,每个所述处理进程之间不会相互影响,分别独立完成计算任务,具体可以采用Redis数据库等分布式工具实现。
在现有技术中,用户的每个报表请求从获取、执行到返回结果,通常是由一个进程或模块连续完成的,导致高并发条件下,进程数量不能满足报表请求数量;另一方面,由于数据库连接数有限,且报表数据的计算需要一定时间,导致部分进程进行到“执行”的步骤后只能暂停,等待数据库资源解放。反映在用户侧,可能是长时间的等待而无结果,甚至严重时会导致系统瘫痪。
本实施例针对现有技术存在问题,将报表数据的请求、获取,与报表数据的计算进行了分离。在无法直接从缓存中获取到报表请求对应的报表数据时,并不是立刻继续从数据库计算相关数据,而是将报表请求转换为计算任务并加入任务队列,由分布式处理进程异步地从任务队列获取计算任务进行处理。这样一来,当有大量报表请求并发时,可以有效提高数据处理效率,并且通过控制分布式处理进程的工作频率,能够有效降低数据库的负担。
从上面所述可以看出,本实施例提供的处理报表数据的方法,因为采用了在接收到报表请求时将其转换为计算任务的技术手段,从而将处于同一阶级的不同用户的报表请求统一为相同的计算任务,解决了现有技术方案中对于每个不同用户请求的报表数据均单独处理、导致数据计算量过大的问题,达到了有效降低数据计算量和内存空间占用量的技术效果。此外,因为采用了将报表数据获取过程和报表数据计算过程分离,并使用分布式处理进程和循环队列处理计算任务的报表数据的技术手段,解决了现有技术在高并发情况下数据库压力过大,影响系统稳定性和相应速度的问题,达到了提高并发处理能力、提升系统稳定性的技术效果。
图2是根据本发明实施例的处理报表数据的方法的一些可选步骤的示意图。
如图2所示,在一些可选的实施例中,所述任务队列为循环队列;从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存,包括:
S20,从所述任务队列队头获取所述计算任务,并放回所述任务队列队尾。所述任务队列是一个循环队列,具备先进先出的特性。获取所述计算任务后,在执行后续步骤的同时,将所述计算任务放回任务队列队尾,而不是等待该任务处理完成后才将其放到队尾,所以不会影响其他进程再从任务队列中获取任务;换句话说,当有N个处理进程时,则可以有N个计算任务被同时执行,且彼此之间没有影响,达到了分布式处理的效果。
判断所述计算任务对应的报表数据是否需要被计算。本步骤中判断报表数据是否需要被计算的依据主要有两个,第一是缓存中是否存在计算任务对应的报表数据,第二是缓存中的报表数据是否过期。具体判断报表数据是否过期,可以在每次更新报表数据时,相应的记录此次更新的时间,作为报表数据的“上次更新时间”。所以,判断所述计算任务对应的报表数据是否需要被计算,还可以包括以下子步骤:
S21,判断在缓存中是否存在与所述计算任务对应的报表数据。
若在缓存中不存在与所述计算任务对应的报表数据,则确定所述计算任务对应的报表数据需要被计算。
S22,若在缓存中存在与所述计算任务对应的报表数据,则进一步判断所述报表数据是否过期。在判断报表数据是否过期时,可以通过设置一个过期时长,在“当前系统时间-上次更新时间>过期时长”时,则确定缓存中的报表数据已经过期,需要被更新。而此时重新计算得到的新报表数据在存入缓存时,会替换旧报表数据,同时更新该报表数据的上次更新时间。
若所述报表数据过期,则确定所述计算任务对应的报表数据需要被计算;若所述报表数据没有过期,则确定所述计算任务对应的报表数据不需要被计算。需要说明的是,在判断所述报表数据没有过期,不需要被计算时,处理进程就会判断此次计算任务执行完毕,转而获取并处理新的计算任务。
S23,若所述计算任务对应的报表数据需要被计算,则进一步判断所述计算任务是否被其他所述处理进程占用。由于任务队列为循环队列,因此有可能出现某个计算任务被一个处理进程获取并处理时,经过循环,另外一个处理进程再次获取到这一计算任务,而此时前一个处理进程还没有完成这一计算任务的计算的情况。所以加入了步骤S23,以保证同一个计算任务不会被两个不同的处理进程同时处理,避免重复计算,降低服务器资源消耗。
S24,若所述计算任务没有被其他所述处理进程占用,则根据所述计算任务计算所述报表数据并保存至所述缓存。
在一些可选的实施例中,所述方法还包括:
S25,若确定所述计算任务对应的报表数据不需要被计算,或所述计算任务被其他所述处理进程占用,或完成计算所述报表数据并保存至所述缓存(在得到前面三个任意之一结果后,即可确定一次计算任务处理完毕),则进一步判断所述处理进程是否需要休眠。休眠表示控制处理进程暂停工作一定时长;控制处理进程休眠是处于对数据库以及缓存的连接数资源保护的考虑,连接数资源是有限的,无限制地命令处理进程从任务队列获取数据,则可能导致连接数资源长期被处理进程以“获取计算任务-判断不需要计算-放弃此次任务-重新获取计算任务”这样的流程进行占用,影响到系统的其他功能。
S26,若所述处理进程需要休眠,则根据预设休眠时长进行休眠。休眠时长可以根据计算能力、当前并发数、服务器负载等因素进行调整,例如,可以设置当处理进程完成一次计算任务的处理之后,休眠1秒;还可以设置一个处理进程累计完成一定数量的计算任务后,再多休眠1秒。
若所述处理进程不需要休眠或休眠结束,则从所述任务队列获取新的计算任务并处理。
本实施例进一步说明了使用分布式处理进程从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存的详细步骤。因为加入了对于报表数据是否过期的判断,可以实现对于缓存内报表数据的动态更新,在接收到报表请求时可以直接从缓存中获取最新的报表数据,保证了数据时效性,使得用户能够获取到的数据一定是较新的数据;因为加入了对于计算任务是否被其他处理进程占用的判断,避免发生两个不同处理进程同时处理同一任务的事件,从而防止因为重复计算导致的数据不一致等问题。此外,本实施例因为设置了可调的休眠时长,能够灵活地对处理进程的工作频率进行调整,从而可以适应不同业务情况(例如午夜闲时低强度、日常普通强度、节假日高强度等等),并对数据库和缓存的线程资源起到保护作用。
图3是根据本发明实施例的处理报表数据的方法的另一些可选步骤的示意图;
如图3所示,在另一些可选的实施例中,所述方法包括:
S30,接收报表请求,根据报表请求的请求参数将报表请求转换为计算任务。
S31,判断缓存中是否存在与所述计算任务对应的报表数据。
S32,若确定缓存中不存在与所述计算任务对应的报表数据,则进一步判断任务队列中是否存在所述计算任务。
S33,若确定所述任务队列中不存在所述计算任务,将所述计算任务加入所述任务队列。
S34,若确定在所述缓存中存在与所述计算任务对应的报表数据,则返回所述报表数据。这里的“返回所述报表数据”是一个广义的概念,表示将报表数据以任意形式发送至该报表数据的计算任务对应的报表请求的发起者,以使得在发起者使用的设备中可以直接或间接(例如经过解析后)取得可读的报表数据。
S35,若在确定所述缓存中不存在与所述计算任务对应的报表数据,则在判断任务队列中是否存在所述计算任务的同时返回等待消息。这里的等待消息用于告知报表请求已经加入任务队列待处理,但暂时还无法返回报表数据,请用户等待,例如返回字符串“您所请求的任务正在处理中,请稍后重试”等等。
在完成S34,若确定在所述缓存中存在与所述计算任务对应的报表数据,则返回所述报表数据;或S35,若在确定所述缓存中不存在与所述计算任务对应的报表数据,则在判断任务队列中是否存在所述计算任务的同时返回等待消息;或在S32的判断中确定任务队列存在所述计算任务之后,则可以确定本次从缓存中获取报表数据的数据获取工作已经完成。
在一些可选的实施例中,所述方法还包括:根据预设时间,清理所述任务队列和/或缓存中的报表数据。缓存中的计算任务可以在新的报表请求到来时被更新,但是如果缓存中的某份报表数据在很长一段时间内都没有被取用过,则说明可能改报表数据对应的计算任务也已经失效,此时可以执行清理,将所述计算任务和报表数据移除,以节省缓存容量,提高处理效率。此外,还可以定期清空任务队列,例如设置为每天凌晨清理,可以保证任务队列里面的计算任务都是当天有效的报表请求所对应的,这样可以减小计算量,还能够实现全面的任务更新。
为了使本发明提供的处理报表数据的方法的技术方案更加清楚,进一步提供了一个可选的具体实施例。
在一些可选的实施例中,在缓存中维护了一些键值对,以便用于实施前面实施例中描述的方法,键值对的一种可选的设置方式见表1所示:
表1键值对对应关系表
键(Key) 值(Value)
任务关键字 预先定义的、可识别的值
报表数据缓存关键字 报表数据
报表数据更新时间关键字 报表数据上次更新时间
键值对中的键(Key)均根据计算任务映射生成,一个计算任务分别与一个任务关键字、报表数据缓存关键字和报表数据更新时间关键字唯一对应,而键值对的值(Value)则在对计算任务的处理过程中生成。因此在获取到计算任务后,可以根据计算任务(或根据请求参数)按照预设的规则映射得到上述键,以便实现查询、数据获取等步骤。键值对的一种可选实现方式是利用哈希结构实现,当然其他可以达到相同或者相近效果的数据结构也可以被采用。
其中,“任务关键字”键值对用于判断计算任务是否已经加入任务队列;当计算任务没有加入任务队列时,则该计算任务的任务关键字键值对在内存中不存在;当计算任务加入任务队列后,建立该计算任务映射生成的任务关键字键值对,并在该键值对的值处保存可识别的内容,以便在读取该值后,可以根据预设规则确定计算任务已经被加入任务队列。
“报表数据缓存关键字”用于存储计算任务对应的报表数据。通过在缓存中查找报表数据缓存关键字,即可找到该键对应的值,即报表数据。
“报表数据更新时间关键字”则用于记录报表数据的上次更新时间,其值部分保存有报表数据的上次更新时间的具体数值。
在前实施例中提到,处理进程可以判断计算任务是否被其他处理进程占用,以防止重复计算,达到节省系统资源,提高数据稳定性的作用。具体在操作时,可以采用基于Redis实现的分布式锁,处理进程抢占到计算任务后,在进行后续计算前会尝试获取计算任务的锁,只有在成功获取到锁之后才进行数据计算。为了防止死锁,可以根据需要给锁设置过期时间。具体的,可以调用Redis的缓存命令SETN5E5(该命令作用是以原子操作将缓存里面不存在的键值设置到缓存里并同步设置过期时间,设置成功返回1,否则返回0),如果缓存命令结果返回1就知道计算任务未被执行。
从上面所述可以看出,本发明实施例提供的处理报表数据的方法,因为采用了在接收到报表请求时将其转换为计算任务的技术手段,从而将处于同一阶级的不同用户的报表请求统一为相同的计算任务,解决了现有技术方案中对于每个不同用户请求的报表数据均单独处理、导致数据计算量过大的问题,达到了有效降低数据计算量和内存空间占用量的技术效果。此外,因为采用了将报表数据获取过程和报表数据计算过程分离,并使用分布式处理进程和循环队列处理计算任务的报表数据的技术手段,解决了现有技术在高并发情况下数据库压力过大,影响系统稳定性和相应速度的问题,达到了提高并发处理能力、提升系统稳定性的技术效果。
图4是根据本发明实施例的处理报表数据的装置的主要模块的示意图。
参考图4所示,本发明实施例提供的一种处理报表数据的装置40包括任务转换模块401、数据查找模块402、任务查找模块403、任务处理模块404和数据计算模块405,其中任务转换模块401用于接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;数据查找模块402用于判断在缓存中是否存在与所述计算任务对应的报表数据;任务查找模块403用于在缓存中不存在与所述计算任务对应的报表数据时,进一步判断任务队列中是否存在所述计算任务;任务处理模块404用于在所述任务队列中不存在所述计算任务时,将所述计算任务加入所述任务队列;数据计算模块405用于使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
在一些可选的实施例中,所述任务队列为循环队列;所述数据计算模块405还用于:从所述任务队列队头获取所述计算任务,将其放回所述任务队列队尾;判断所述计算任务对应的报表数据是否需要被计算;若所述计算任务对应的报表数据需要被计算,则进一步判断所述计算任务是否被其他所述处理进程占用;若所述计算任务没有被其他所述处理进程占用,则根据所述计算任务计算所述报表数据并保存至所述缓存。
在一些可选的实施例中,所述数据计算模块405还用于:在缓存中查找与所述计算任务对应的报表数据;若查找到与所述计算任务对应的报表数据,则进一步判断所述报表数据是否过期;若没有查找到与所述计算任务对应的报表数据,或所述报表数据已过期,则确定所述计算任务对应的报表数据需要被计算。
在一些可选的实施例中,所述数据计算模块405还用于:若确定所述计算任务对应的报表数据不需要被计算,或所述计算任务被其他所述处理进程占用,或完成计算所述报表数据并保存至所述缓存,则进一步判断所述处理进程是否需要休眠;若所述处理进程需要休眠,则根据预设休眠时长进行休眠;若所述处理进程不需要休眠或休眠结束,则从所述任务队列获取新的计算任务并处理。
在一些可选的实施例中,所述数据查找模块402还用于,若在所述缓存中存在与所述计算任务对应的报表数据,则返回所述报表数据;所述任务查找模块403还用于,若在缓存中不存在与所述计算任务对应的报表数据,则在判断任务队列中是否存在所述计算任务的同时返回等待消息。
从上面所述可以看出,本发明实施例提供的处理报表数据的装置,因为采用了在接收到报表请求时将其转换为计算任务的技术手段,从而将处于同一阶级的不同用户的报表请求统一为相同的计算任务,解决了现有技术方案中对于每个不同用户请求的报表数据均单独处理、导致数据计算量过大的问题,达到了有效降低数据计算量和内存空间占用量的技术效果。此外,因为采用了将报表数据获取过程和报表数据计算过程分离,并使用分布式处理进程和循环队列处理计算任务的报表数据的技术手段,解决了现有技术在高并发情况下数据库压力过大,影响系统稳定性和相应速度的问题,达到了提高并发处理能力、提升系统稳定性的技术效果。
根据本发明的实施例,本发明还提供了一种电子设备和一种可读存储介质。
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明的实施例,上文主要步骤的示意图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤的示意图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括任务转换模块、数据查找模块、任务查找模块、任务处理模块和数据计算模块。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,任务转换模块还可以被描述为“用于接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;判断在缓存中是否存在与所述计算任务对应的报表数据;若在所述缓存中不存在与所述计算任务对应的报表数据,则进一步判断任务队列中是否存在所述计算任务;若所述任务队列中不存在所述计算任务,则将所述计算任务加入所述任务队列;使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
根据本发明实施例的技术方案,因为采用了在接收到报表请求时将其转换为计算任务的技术手段,从而将处于同一阶级的不同用户的报表请求统一为相同的计算任务,解决了现有技术方案中对于每个不同用户请求的报表数据均单独处理、导致数据计算量过大的问题,达到了有效降低数据计算量和内存空间占用量的技术效果。此外,因为采用了将报表数据获取过程和报表数据计算过程分离,并使用分布式处理进程和循环队列处理计算任务的报表数据的技术手段,解决了现有技术在高并发情况下数据库压力过大,影响系统稳定性和相应速度的问题,达到了提高并发处理能力、提升系统稳定性的技术效果。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种处理报表数据的方法,其特征在于,包括:
接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;其中,所述包含请求参数的报表请求为位于同一阶级不同用户的报表请求,将报表数据中除了所述请求参数之外的其他参数视为无效信息,仅将报表数据中对应的请求参数转换为计算任务;
判断在缓存中是否存在与所述计算任务对应的报表数据;
若在所述缓存中不存在与所述计算任务对应的报表数据,则进一步判断任务队列中是否存在所述计算任务;
若所述任务队列中不存在所述计算任务,则将所述计算任务加入所述任务队列;
使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
2.根据权利要求1所述的方法,其特征在于,所述任务队列为循环队列;从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存,包括:
从所述任务队列队头获取所述计算任务,并放回所述任务队列队尾;
判断所述计算任务对应的报表数据是否需要被计算;
若所述计算任务对应的报表数据需要被计算,则进一步判断所述计算任务是否被其他所述处理进程占用;
若所述计算任务没有被其他所述处理进程占用,则根据所述计算任务计算所述报表数据并保存至所述缓存。
3.根据权利要求2所述的方法,其特征在于,判断所述计算任务对应的报表数据是否需要被计算,包括:
在所述缓存中查找与所述计算任务对应的报表数据;
若查找到与所述计算任务对应的报表数据,则进一步判断所述报表数据是否过期;
若没有查找到与所述计算任务对应的报表数据,或所述报表数据已过期,则确定所述计算任务对应的报表数据需要被计算。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若确定所述计算任务对应的报表数据不需要被计算,或所述计算任务被其他所述处理进程占用,或完成计算所述报表数据并保存至所述缓存,则进一步判断所述处理进程是否需要休眠;
若所述处理进程需要休眠,则根据预设休眠时长进行休眠;
若所述处理进程不需要休眠或休眠结束,则从所述任务队列获取新的计算任务并处理。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:
若在所述缓存中存在与所述计算任务对应的报表数据,则返回所述报表数据;
若在所述缓存中不存在与所述计算任务对应的报表数据,则在判断任务队列中是否存在所述计算任务的同时返回等待消息。
6.一种处理报表数据的装置,其特征在于,包括:
任务转换模块,用于接收包含请求参数的报表请求,根据所述请求参数将所述报表请求转换为计算任务;其中,所述包含请求参数的报表请求为位于同一阶级不同用户的报表请求,将报表数据中除了所述请求参数之外的其他参数视为无效信息,仅将报表数据中对应的请求参数转换为计算任务;
数据查找模块,用于判断在缓存中是否存在与所述计算任务对应的报表数据;
任务查找模块,用于在缓存中不存在与所述计算任务对应的报表数据时,进一步判断任务队列中是否存在所述计算任务;
任务处理模块,用于在所述任务队列中不存在所述计算任务时,将所述计算任务加入所述任务队列;
数据计算模块,用于使用处理进程,以便从所述任务队列中获取所述计算任务后根据所述计算任务计算对应报表数据并保存至所述缓存。
7.根据权利要求6所述的装置,其特征在于,所述任务队列为循环队列;所述数据计算模块还用于:
从所述任务队列队头获取所述计算任务,将其放回所述任务队列队尾;判断所述计算任务对应的报表数据是否需要被计算;若所述计算任务对应的报表数据需要被计算,则进一步判断所述计算任务是否被其他所述处理进程占用;若所述计算任务没有被其他所述处理进程占用,则根据所述计算任务计算所述报表数据并保存至所述缓存。
8.根据权利要求7所述的装置,其特征在于,所述数据计算模块还用于:
在所述缓存中查找与所述计算任务对应的报表数据;若查找到与所述计算任务对应的报表数据,则进一步判断所述报表数据是否过期;若没有查找到与所述计算任务对应的报表数据,或所述报表数据已过期,则确定所述计算任务对应的报表数据需要被计算。
9.根据权利要求7所述的装置,其特征在于,所述数据计算模块还用于:
若确定所述计算任务对应的报表数据不需要被计算,或所述计算任务被其他所述处理进程占用,或完成计算所述报表数据并保存至所述缓存,则进一步判断所述处理进程是否需要休眠;若所述处理进程需要休眠,则根据预设休眠时长进行休眠;若所述处理进程不需要休眠或休眠结束,则从所述任务队列获取新的计算任务并处理。
10.根据权利要求6-9任意一项所述的装置,其特征在于,所述数据查找模块还用于:
若在所述缓存中存在与所述计算任务对应的报表数据,则返回所述报表数据;所述任务查找模块还用于,若在所述缓存中不存在与所述计算任务对应的报表数据,则在判断任务队列中是否存在所述计算任务的同时返回等待消息。
11.一种处理报表数据的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201710235874.9A 2017-04-12 2017-04-12 处理报表数据的方法、装置、电子设备和可读存储介质 Active CN108694075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710235874.9A CN108694075B (zh) 2017-04-12 2017-04-12 处理报表数据的方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710235874.9A CN108694075B (zh) 2017-04-12 2017-04-12 处理报表数据的方法、装置、电子设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN108694075A CN108694075A (zh) 2018-10-23
CN108694075B true CN108694075B (zh) 2021-03-30

Family

ID=63843581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710235874.9A Active CN108694075B (zh) 2017-04-12 2017-04-12 处理报表数据的方法、装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN108694075B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324615A (zh) * 2018-12-13 2020-06-23 北京京东尚科信息技术有限公司 数据处理方法、装置、介质及电子设备
CN110162384B (zh) * 2019-04-19 2023-04-28 深圳壹账通智能科技有限公司 基于Redis分布式锁的超时时间动态调整方法及系统
CN110443695A (zh) * 2019-07-31 2019-11-12 中国工商银行股份有限公司 数据处理方法及其装置、电子设备和介质
CN110457126A (zh) * 2019-08-13 2019-11-15 杭州有赞科技有限公司 一种异步调用方法及系统
CN110750349B (zh) * 2019-10-26 2022-07-29 武汉中海庭数据技术有限公司 一种分布式任务调度方法及系统
CN111414424B (zh) * 2020-03-23 2023-08-04 北京思特奇信息技术股份有限公司 一种配置数据自动同步redis的方法、系统、介质及设备
CN113626176A (zh) * 2020-05-08 2021-11-09 北京沃东天骏信息技术有限公司 一种业务请求处理方法及装置
CN112347167A (zh) * 2020-09-30 2021-02-09 长沙市到家悠享网络科技有限公司 一种数据处理方法、装置、电子设备及存储介质
CN113204416A (zh) * 2021-04-07 2021-08-03 上海多维度网络科技股份有限公司 数据报表任务执行方法、装置、设备和存储介质
CN116662394A (zh) * 2023-07-12 2023-08-29 唐山银耐联电子商务有限公司 一种基于Java的响应优先式缓存加载方法
CN117112267B (zh) * 2023-10-20 2024-01-23 成都华栖云科技有限公司 一种应用接口的缓存维护方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106249A (zh) * 2013-01-08 2013-05-15 华中科技大学 一种基于Cassandra的数据并行处理系统
CN103370917A (zh) * 2012-11-20 2013-10-23 华为技术有限公司 消息处理方法及服务器
CN103390061A (zh) * 2013-07-31 2013-11-13 浙江大学 以用户为中心且基于多级缓存的海洋时空数据访问方法
CN104243598A (zh) * 2014-09-25 2014-12-24 海信集团有限公司 一种信息推荐方法及装置
CN105447092A (zh) * 2015-11-09 2016-03-30 联动优势科技有限公司 一种缓存方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080066066A1 (en) * 2006-09-08 2008-03-13 Macpherson Michael B Task queue suitable for processing systems that use multiple processing units and shared memory

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103370917A (zh) * 2012-11-20 2013-10-23 华为技术有限公司 消息处理方法及服务器
CN103106249A (zh) * 2013-01-08 2013-05-15 华中科技大学 一种基于Cassandra的数据并行处理系统
CN103390061A (zh) * 2013-07-31 2013-11-13 浙江大学 以用户为中心且基于多级缓存的海洋时空数据访问方法
CN104243598A (zh) * 2014-09-25 2014-12-24 海信集团有限公司 一种信息推荐方法及装置
CN105447092A (zh) * 2015-11-09 2016-03-30 联动优势科技有限公司 一种缓存方法及装置

Also Published As

Publication number Publication date
CN108694075A (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
CN108694075B (zh) 处理报表数据的方法、装置、电子设备和可读存储介质
CN109684358B (zh) 数据查询的方法和装置
JP4912401B2 (ja) パフォーマンス情報およびイベント情報を適応的に収集するシステムおよび方法
JP5744707B2 (ja) メモリ使用量照会ガバナのためのコンピュータ実装方法、コンピュータ・プログラム、およびシステム(メモリ使用量照会ガバナ)
CN110598138A (zh) 基于缓存的处理方法和装置
US20150280981A1 (en) Apparatus and system for configuration management
US8583608B2 (en) Maximum allowable runtime query governor
CN110990439A (zh) 基于缓存的快速查询方法、装置、计算机设备及存储介质
EP3860043A2 (en) Method and apparatus for implementing smart contract based on blockchain
CN105138679A (zh) 一种基于分布式缓存的数据处理系统及处理方法
CN113364877B (zh) 数据处理方法、装置、电子设备和介质
CN111078585B (zh) 一种内存缓存管理方法、系统、存储介质及电子设备
CN112631504A (zh) 利用堆外内存实现本地缓存的方法和装置
CN109471989A (zh) 一种页面请求处理方法及相关装置
CN107748649B (zh) 一种缓存数据的方法和装置
CN112671892A (zh) 数据传输方法、装置、电子设备、介质和计算机程序产品
CN116185578A (zh) 计算任务的调度方法和计算任务的执行方法
CN114610719B (zh) 跨集群数据处理方法、装置、电子设备以及存储介质
CN112817687A (zh) 一种数据同步方法和装置
CN108984431B (zh) 用于清空过期缓存的方法和装置
CN115878035A (zh) 一种数据读取方法、装置、电子设备及存储介质
CN114612212A (zh) 一种基于风险控制的业务处理方法、装置和系统
CN109388658B (zh) 一种数据确定方法和装置
CN112115123A (zh) 用于分布式数据库的性能优化的方法和装置
CN113220981A (zh) 一种优化缓存的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant