CN117195834A - 文档格式的转换控制方法、装置、计算机可读介质及设备 - Google Patents

文档格式的转换控制方法、装置、计算机可读介质及设备 Download PDF

Info

Publication number
CN117195834A
CN117195834A CN202311114234.4A CN202311114234A CN117195834A CN 117195834 A CN117195834 A CN 117195834A CN 202311114234 A CN202311114234 A CN 202311114234A CN 117195834 A CN117195834 A CN 117195834A
Authority
CN
China
Prior art keywords
document
format
subtasks
conversion
formatted data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311114234.4A
Other languages
English (en)
Inventor
阎逸飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202311114234.4A priority Critical patent/CN117195834A/zh
Publication of CN117195834A publication Critical patent/CN117195834A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本申请的实施例提供了一种文档格式的转换控制方法、装置、计算机可读介质及设备。该文档格式的转换控制方法包括:接收格式转换任务,所述格式转换任务用于指示将第一格式文档转换为第二格式文档;根据所述第一格式文档的属性信息,将所述格式转换任务拆分为多个子任务;将所述多个子任务分配给解析服务集群,以使所述解析服务集群中的文档解析服务处理所述多个子任务,得到各个子任务对应的格式化数据;根据所述多个子任务分别对应的格式化数据生成所述第二格式文档。本申请实施例的技术方案可以将格式转换任务拆分为多个子任务,并由解析服务集群中的文档解析服务进行并行处理,进而可以缩减格式转换的等待时长,提高了格式转换的效率。

Description

文档格式的转换控制方法、装置、计算机可读介质及设备
技术领域
本申请涉及计算机及通信技术领域,具体而言,涉及一种文档格式的转换控制方法、装置、计算机可读介质及设备。
背景技术
PDF(Portable Document Format,便携式文档格式)文件是目前较为常用的文件类型之一;EPUB(Electronic Publication,电子出版)是一个自由的开放标准,属于一种可以自动重新编排的内容,也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示。在相关技术中存在着PDF文件转换为EPUB文件的需求,比如在电子书阅读应用中上传PDF文件,然后转换为EPUB文件供用户进行阅读。相关技术中在将PDF文件转换为EPUB文件时通常是每个页面依次进行处理,即对PDF文件的解析过程是串行的,由于PDF转EPUB的过程会涉及版面识别、图像识别等处理,因此相关技术中的这种处理方式将会花费较长的时间,严重降低了转换效率。
发明内容
本申请的实施例提供了一种文档格式的转换控制方法、装置、计算机可读介质及设备,可以将格式转换任务拆分为多个子任务,并由解析服务集群中的文档解析服务进行并行处理,进而可以缩减格式转换的等待时长,提高了格式转换的效率。
本申请的其它特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种文档格式的转换控制方法,包括:接收格式转换任务,所述格式转换任务用于指示将第一格式文档转换为第二格式文档;根据所述第一格式文档的属性信息,将所述格式转换任务拆分为多个子任务;将所述多个子任务分配给解析服务集群,以使所述解析服务集群中的文档解析服务处理所述多个子任务,得到各个子任务对应的格式化数据;根据所述多个子任务分别对应的格式化数据生成所述第二格式文档。
根据本申请实施例的一个方面,提供了一种文档格式的转换控制方法,包括:获取文档解析服务集群生成的与多个子任务分别对应的格式化数据,所述多个子任务是根据第一格式文档的属性信息将格式转换任务进行拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;将所述多个子任务分别对应的格式化数据进行合并处理,以生成所述第二格式文档。
根据本申请实施例的一个方面,提供了一种文档格式的转换控制方法,包括:获取用于进行格式转换的子任务,所述子任务是根据第一格式文档的属性信息将格式转换任务拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;处理所述子任务,得到所述子任务对应的格式化数据;将所述子任务对应的格式化数据存储至指定存储空间中,以便于根据所述指定存储空间中存储的多个子任务分别对应的格式化数据生成所述第二格式文档。
根据本申请实施例的一个方面,提供了一种文档格式的转换控制装置,包括:接收单元,配置为接收格式转换任务,所述格式转换任务用于指示将第一格式文档转换为第二格式文档;拆分单元,配置为根据所述第一格式文档的属性信息,将所述格式转换任务拆分为多个子任务;分配单元,配置为将所述多个子任务分配给解析服务集群,以使所述解析服务集群中的文档解析服务处理所述多个子任务,得到各个子任务对应的格式化数据;生成单元,配置为根据所述多个子任务分别对应的格式化数据生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述分配单元配置为:将所述多个子任务发送到消息队列中,以使所述解析服务集群中的文档解析服务从所述消息队列中读取所述子任务进行处理。
在本申请的一些实施例中,基于前述方案,所述生成单元配置为:向文档生成服务发送生成第二格式文档的通知消息,以使所述文档生成服务在接收到所述通知消息后获取所述各个子任务对应的格式化数据,并根据所述多个子任务分别对应的格式化数据,生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述格式化数据由所述文档解析服务在处理所述子任务之后存储至指定存储空间中的;所述生成单元配置为:将生成第二格式文档的通知消息发送到消息队列中,以使所述文档生成服务从所述消息队列中检测到所述通知消息后从所述指定存储空间中获取所述各个子任务对应的格式化数据。
在本申请的一些实施例中,基于前述方案,所述拆分单元配置为:根据所述第一格式文档的页码总数,将所述第一格式文档拆分为多份子文档,每份子文档对应一个所述子任务;或者根据所述第一格式文档的数据量,将所述第一格式文档拆分为多份子文档,每份子文档对应一个所述子任务。
根据本申请实施例的一个方面,提供了一种文档格式的转换控制装置,包括:获取单元,配置为获取文档解析服务集群生成的与多个子任务分别对应的格式化数据,所述多个子任务是根据第一格式文档的属性信息将格式转换任务进行拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;合并单元,配置为将所述多个子任务分别对应的格式化数据进行合并处理,以生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述获取单元配置为:从指定存储空间中检测所述多个子任务分别对应的格式化数据,所述格式化数据是由所述文档解析服务集群中的文档解析服务在处理所述子任务之后存储至所述存储空间中的;若检测到所述多个子任务分别对应的格式化数据均生成,则从所述指定存储空间中获取所述多个子任务分别对应的格式化数据。
在本申请的一些实施例中,基于前述方案,所述获取单元配置为:若接收到生成第二格式文档的通知消息,则根据所述通知消息从指定存储空间中检测所述多个子任务分别对应的格式化数据。
在本申请的一些实施例中,基于前述方案,所述获取单元还配置为:检测消息队列中的消息,以从所述消息队列中获取所述通知消息;在获取所述通知消息之后,从所述指定存储空间中周期性地检测所述多个子任务分别对应的格式化数据是否生成。
在本申请的一些实施例中,基于前述方案,所述合并单元还配置为:在生成所述第二格式文档之后,将生成所述第二格式文档的完成消息发送至消息队列中,以使其它处理服务从所述消息队列中获取到所述完成消息。
根据本申请实施例的一个方面,提供了一种文档格式的转换控制装置,包括:获取单元,配置为获取用于进行格式转换的子任务,所述子任务是根据第一格式文档的属性信息将格式转换任务拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;处理单元,配置为处理所述子任务,得到所述子任务对应的格式化数据;存储单元,配置为将所述子任务对应的格式化数据存储至指定存储空间中,以便于根据所述指定存储空间中存储的多个子任务分别对应的格式化数据生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述获取单元配置为:检测消息队列中的消息,所述消息队列用于存储所述格式转换任务拆分得到的多个子任务;从所述消息队列中获取所述子任务。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的文档格式的转换控制方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如上述实施例中所述的文档格式的转换控制方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取并执行该计算机程序,使得该电子设备执行上述各种可选实施例中提供的文档格式的转换控制方法。
在本申请的一些实施例所提供的技术方案中,通过根据第一格式文档的属性信息将格式转换任务拆分为多个子任务,然后将这多个子任务分配给解析服务集群,以使解析服务集群中的文档解析服务处理这多个子任务,得到各个子任务对应的格式化数据,之后根据这多个子任务分别对应的格式化数据生成第二格式文档,使得在进行格式转换处理时,可以将格式转换任务拆分为多个子任务,并由解析服务集群中的文档解析服务进行并行处理,进而可以缩减格式转换的等待时长,提高了格式转换的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
图1示出了一种PDF转EPUB的处理流程图;
图2示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图3示出了根据本申请的一个实施例的文档格式的转换控制方法的流程图;
图4示出了根据本申请的一个实施例的电子书阅读应用的客户端界面示意图;
图5示出了根据本申请的一个实施例的文档格式的转换控制方法的流程图;
图6示出了根据本申请的一个实施例的文档格式的转换控制方法的流程图;
图7示出了根据本申请的一个实施例的PDF文档转EPUB文档的流程图;
图8示出了根据本申请的一个实施例的合并中间数据生成EPUB的服务的处理流程图;
图9示出了根据本申请的一个实施例的文档格式的转换控制装置的框图;
图10示出了根据本申请的一个实施例的文档格式的转换控制装置的框图;
图11示出了根据本申请的一个实施例的文档格式的转换控制装置的框图;
图12示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在参考附图以更全面的方式描述示例实施方式。然而,示例的实施方式能够以各种形式实施,且不应被理解为仅限于这些范例;相反,提供这些实施方式的目的是使得本申请更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,本申请所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,有许多具体细节从而可以充分理解本申请的实施例。然而,本领域技术人员应意识到,在实施本申请的技术方案时可以不需用到实施例中的所有细节特征,可以省略一个或更多特定细节,或者可以采用其它的方法、元件、装置、步骤等。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
可以理解的是,本申请在收集用户的相关数据(如用户上传的需要进行格式转换的文件或者文档等数据)之前以及在收集用户的相关数据的过程中,都可以显示提示界面或者弹窗,该提示界面或者弹窗用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的,且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
相关技术中存在着PDF文件转换为EPUB文件的需求,比如在电子书阅读应用中上传PDF文件,然后转换为EPUB文件供用户进行阅读,这样可以实现语音朗读、划线分享等功能,进而提高用户的阅读体验。图1示出了一种PDF转EPUB的处理流程图,具体包括如下步骤:
S101,对于需要进行格式转换处理的PDF文档,判断是否解析了PDF文档的所有页面,若是,则执行S105;否则,执行S102。
S102,若PDF文档的所有页面没有解析完成,则解析PDF文档中新一页的图文内容。
S103,对这一页进行版面分析。
S104,生成这一页的格式化数据。
S105,若PDF文档的所有页面解析完成,则将各个页面的格式化数据组合起来。
S106,根据EPUB的格式生成对应的EPUB文件。
在具体实现时,图1所示的处理流程是先通过MuPDF库(一个可以解析PDF文件基础信息的轻量级软件库)读取PDF文档的基础信息,包括文件的状态、总共的页码数等信息。然后对PDF文档进行逐页解析,通过MuPDF读取每个页面的文字和图片信息,将每个页面转为图片,并作为输入让版面分析模型对该页面进行版面分析,进而将分析的结果与MuPDF读取的文字和图片内容结合生成一个存储中间数据的json结构(也即格式化数据)。当所有的页面都解析完成之后,再将所有页面的格式化数据组合起来,生成一个EPUB文件。
但是,图1中将PDF文件转换为EPUB文件的过程是每个页面依次进行处理的,即对PDF文件的解析过程是串行的,由于PDF转EPUB的过程会涉及版面识别、图像识别等处理,平均处理一个页面需要花费1秒钟的时间,那么如果遇到上百页的PDF需要转为EPUB文档时,将会花费较长的时间,严重降低了转换效率。
基于此,本申请实施例的技术方案提出了一种新的文档格式的转换控制方案,具体如图2所示,在应用本申请实施例的技术方案的一个系统架构200中,可以包括终端设备210、网络220和服务器230。终端设备210可以包括智能手机、平板电脑、笔记本电脑、智能语音交互设备、智能家电、车载终端、飞行器等等。服务器230可以是提供各种服务的服务器,其可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。其中,网络220可以是在终端设备210与服务器230之间提供通信连接的介质,比如可以是有线通信链路或者无线通信链路。
根据实现需要,本申请实施例中的系统架构可以具有任意数目的终端设备210、网络220和服务器230。例如,服务器230可以是由多个服务器设备组成的服务器群组。
在本申请的一个实施例中,用户可以使用终端设备210通过网络220向服务器230发送格式转换任务,该格式转换任务用于指示将第一格式文档(如PDF格式文档)转换为第二格式文档(如EPUB格式文档)。服务器230在接收到该格式转换任务之后,可以根据第一格式文档的属性信息(如页码数量、数据量等),将格式转换任务拆分为多个子任务(比如将第一格式文档的每个页面的解析工作作为一个子任务),然后将多个子任务分配给解析服务集群,以使解析服务集群中的文档解析服务处理这多个子任务,得到各个子任务对应的格式化数据,进而可以根据这多个子任务分别对应的格式化数据生成第二格式文档。
可见,本申请实施例的技术方案使得在进行格式转换处理时,可以将格式转换任务拆分为多个子任务,并由解析服务集群中的文档解析服务进行并行处理,进而可以缩减格式转换的等待时长,提高了格式转换的效率。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图3示出了根据本申请的一个实施例的文档格式的转换控制方法的流程图,该文档格式的转换控制方法可以由电子设备来执行,该电子设备可以是服务器,具体比如可以是由服务器中的转换入口服务来执行。参照图3所示,该文档格式的转换控制方法至少包括步骤S310至步骤S340,详细介绍如下:
在步骤S310中,接收格式转换任务,该格式转换任务用于指示将第一格式文档转换为第二格式文档。
在一些可选的实施例中,第一格式文档与第二格式文档是不同格式的文档,比如第一格式文档是PDF格式文档,第二格式文档是EPUB格式文档;或者第一格式文档也可以是DOC格式文档,第二格式文档可以是PDF格式文档等。
在一些可选的实施例中,用户可以通过在客户端上进行触发操作来发送格式转换任务,比如用户选择某个文档,并选择所需要转换得到的格式,然后通过触发相应的控件来发送格式转换任务。或者,用户也可以只选择需要进行格式转换的文档,然后客户端自动上传用户选择的文档,并发送格式转换任务。具体地,比如用户需要在电子书阅读应用中上传一份PDF文档,然后电子书阅读应用默认会将其转换为EPUB格式文档进行展示,那么如图4所示,在电子书阅读应用的客户端界面上,用户可以通过触发控件401来实现PDF文档的导入,具体可以在触发控件401所弹出的窗口中选择“从电脑导入”、“从云端导入”或者“从聊天软件导入”等控件来选择需要导入的文档,进而电子书阅读应用的客户端自动上传用户选择的文档,并发送格式转换任务至服务器。
在步骤S320中,根据第一格式文档的属性信息,将格式转换任务拆分为多个子任务。
在一些可选的实施例中,根据第一格式文档的属性信息,将格式转换任务拆分为多个子任务的过程可以是根据第一格式文档的页码总数,将第一格式文档拆分为多份子文档,每份子文档对应一个子任务。比如,可以将第一格式文档的每一页作为一份子文档,这样可以针对第一格式文档的每一页生成一个子任务。当然,也可以将第一格式文档的每两页作为一份子文档,或者更多页作为一份子文档来生成多个子任务。
在一些可选的实施例中,根据第一格式文档的属性信息,将格式转换任务拆分为多个子任务的过程可以是根据第一格式文档的数据量,将第一格式文档拆分为多份子文档,每份子文档对应一个子任务。比如,可以设定一个数据量阈值,然后将第一格式文档按照这个数据量阈值划分为多份子文档,以针对第一格式文档的每一份子文档生成一个子任务。
在步骤S330中,将多个子任务分配给解析服务集群,以使解析服务集群中的文档解析服务处理多个子任务,得到各个子任务对应的格式化数据。
在一些可选的实施例中,将多个子任务分配给解析服务集群可以是按照负载均衡的方式进行分配。或者,也可以将多个子任务发送到消息队列中,以使解析服务集群中的文档解析服务从消息队列中读取子任务进行处理,这种方式使得文档解析服务可以根据自身的处理能力来选择子任务进行处理,确保文档解析服务在短时间内处理子任务不会超过其负载极限,进而能够保证文档解析服务的稳定性。
可选地,子任务对应的格式化数据可以是按照一定的数据结构所生成的中间数据。比如对于EPUB文档而言,格式化数据可以是按照JSON结构生成的中间数据。
在步骤S340中,根据多个子任务分别对应的格式化数据生成第二格式文档。
在一些可选的实施例中,可以向文档生成服务发送生成第二格式文档的通知消息,以使文档生成服务在接收到通知消息后获取各个子任务对应的格式化数据,并根据多个子任务分别对应的格式化数据,生成第二格式文档。
可选地,文档解析服务在处理子任务之后,可以将得到的格式化数据存储至指定存储空间(比如云存储空间等)中,那么转换入口服务在向文档生成服务发送生成第二格式文档的通知消息时,可以将生成第二格式文档的通知消息发送到消息队列中,以使文档生成服务从消息队列中检测到通知消息后从指定存储空间中获取各个子任务对应的格式化数据。
图5示出了根据本申请的一个实施例的文档格式的转换控制方法的流程图,该文档格式的转换控制方法可以由电子设备来执行,该电子设备可以是服务器,具体比如可以是由服务器中的文档生成服务来执行。参照图5所示,该文档格式的转换控制方法至少包括步骤S510至步骤S520,详细介绍如下:
在步骤S510中,获取文档解析服务集群生成的与多个子任务分别对应的格式化数据,该多个子任务是根据第一格式文档的属性信息将格式转换任务进行拆分得到的,该格式转换任务用于指示将第一格式文档转换为第二格式文档。
在一些可选的实施例中,可以根据第一格式文档的页码总数,将第一格式文档拆分为多份子文档,每份子文档对应一个子任务。比如,可以将第一格式文档的每一页作为一份子文档,这样可以针对第一格式文档的每一页生成一个子任务。当然,也可以将第一格式文档的每两页作为一份子文档,或者更多页作为一份子文档来生成多个子任务。
在一些可选的实施例中,可以根据第一格式文档的数据量,将第一格式文档拆分为多份子文档,每份子文档对应一个子任务。比如,可以设定一个数据量阈值,然后将第一格式文档按照这个数据量阈值划分为多份子文档,以针对第一格式文档的每一份子文档生成一个子任务。
在一些可选的实施例中,文档解析服务在处理子任务之后,可以将得到的格式化数据存储至指定存储空间(如云存储空间等)中,那么文档生成服务获取文档解析服务集群生成的与多个子任务分别对应的格式化数据可以是从指定存储空间中检测多个子任务分别对应的格式化数据,若检测到多个子任务分别对应的格式化数据均生成,则从指定存储空间中获取多个子任务分别对应的格式化数据。
在一些可选的实施例中,文档生成服务可以在接收到生成第二格式文档的通知消息时,再根据该通知消息从指定存储空间中检测多个子任务分别对应的格式化数据。可选地,转换入口服务可以将生成第二格式文档的通知消息发送到消息队列中,那么文档生成服务可以检测消息队列中的消息,以从消息队列中来获取该通知消息,并且在获取该通知消息之后,可以从指定存储空间中周期性地检测多个子任务分别对应的格式化数据是否生成。
在步骤S520中,将多个子任务分别对应的格式化数据进行合并处理,以生成第二格式文档。
在一些可选的实施例中,文档生成服务在生成第二格式文档之后,可以将生成第二格式文档的完成消息发送至消息队列中,以使其它处理服务从消息队列中获取到完成消息。同时,文档生成服务还可以将生成的第二格式文档上传至指定存储空间(如云存储空间中),这样其它处理服务如果需要获取第二格式文档,则可以从指定存储空间中获取。其它处理服务比如可以是文档展示服务、文档传输服务等。
图6示出了根据本申请的一个实施例的文档格式的转换控制方法的流程图,该文档格式的转换控制方法可以由电子设备来执行,该电子设备可以是服务器,具体比如可以是由服务器中的文档解析服务来执行。参照图6所示,该文档格式的转换控制方法至少包括步骤S610至步骤S630,详细介绍如下:
在步骤S610中,获取用于进行格式转换的子任务,该子任务是根据第一格式文档的属性信息将格式转换任务拆分得到的,该格式转换任务用于指示将第一格式文档转换为第二格式文档。
在一些可选的实施例中,可以根据第一格式文档的页码总数,将第一格式文档拆分为多份子文档,每份子文档对应一个子任务。比如,可以将第一格式文档的每一页作为一份子文档,这样可以针对第一格式文档的每一页生成一个子任务。当然,也可以将第一格式文档的每两页作为一份子文档,或者更多页作为一份子文档来生成多个子任务。
在一些可选的实施例中,可以根据第一格式文档的数据量,将第一格式文档拆分为多份子文档,每份子文档对应一个子任务。比如,可以设定一个数据量阈值,然后将第一格式文档按照这个数据量阈值划分为多份子文档,以针对第一格式文档的每一份子文档生成一个子任务。
在一些可选的实施例中,子任务可以是处于消息队列中,那么获取用于进行格式转换的子任务的过程可以是检测消息队列中的消息,该消息队列用于存储格式转换任务拆分得到的多个子任务,然后从消息队列中获取子任务。
在步骤S620中,处理子任务,得到子任务对应的格式化数据。
可选地,文档解析服务处理子任务即是将各个子任务对应的文档内容转换为第二格式的文档数据。比如对子任务对应的文档进行解析,通过MuPDF读取每个页面的文字和图片信息,将每个页面转为图片,并作为输入让版面分析模型对该页面进行版面分析,进而将分析的结果与MuPDF读取的文字和图片内容结合生成一个存储中间数据的json结构(也即格式化数据)。
在步骤S630中,将子任务对应的格式化数据存储至指定存储空间中,以便于根据指定存储空间中存储的多个子任务分别对应的格式化数据生成第二格式文档。
可选地,指定存储空间比如可以是云存储空间等。
本申请上述实施例的技术方案使得在进行格式转换处理时,可以将格式转换任务拆分为多个子任务,并由解析服务集群中的文档解析服务进行并行处理,进而可以缩减格式转换的等待时长,提高了格式转换的效率。
以下以第一格式文档是PDF文档,第二格式文档是EPUB文档为例,结合图7至图9对本申请实施例的技术方案的实现细节进行详细阐述:
如图7所示,在本申请的一个实施例中,可以将整个文档转换控制系统的架构分成三类服务:PDF转换入口服务、解析服务、合并中间数据生成EPUB的服务。这三类服务可以分布式部署,借助消息队列进行通信,同时借助云存储空间来存储PDF、EPUB以及中间数据(即格式化数据)。其中解析服务的压力最大,可以部署较多数量的解析服务。云存储空间可以采用COS(Cloud Object Storage,云对象存储)的方式来进行存储。具体处理过程可以包括如下步骤:
S701,PDF转换入口服务接收到解析任务,即接收到把PDF文档转为EPUB文件的任务消息。比如,PDF转换入口服务可以从消息队列中接收到解析任务的消息。
S702,PDF转换入口服务获取需要转换的PDF文档。比如,PDF转换入口服务可以从云存储空间中获取到需要转换的PDF文档,并且可以读取该PDF文档的基本信息,如总页码等。然后将其划分成尽量小的子任务,作为消息发送到消息队列中,以便于解析服务从消息队列中获取任务进行处理。比如,假设需要转换的PDF文档有101页,那么可以将每一页拆分为一个子任务,这样一共有101个子任务消息发送到消息队列中。
S703,PDF转换入口服务发送一个单独的通知消息,即通知生成EPUB文档的消息,发送到消息队列中,以通知合并中间数据生成EPUB的服务在后续完成合并流程。
需要说明的是,解析服务是整个转换流程中任务量最多、压力最大、最核心的服务,主要作用是解析具体的PDF页面,生成存储详细图文信息的中间数据json,以得到中间数据。解析服务的具体处理过程可以是:检测消息队列中处理具体页面的消息(即子任务的消息),然后获取PDF信息和所需处理的页码信息,进而通过MuPDF和模型版面分析综合得到的结果,得到可以用于生成epub文件的、存储着格式化图文信息的中间数据json,然后可以将中间数据json以文件的形式存储到云存储空间中。
S704,合并中间数据生成EPUB的服务检测消息队列中的消息,在收到生成EPUB文档的消息之后,从云存储中获取所有子任务对应的中间数据json,然后进行合并处理生成EPUB文档,并且可以将生成的EPUB文档上传至云存储空间中。
S705,合并中间数据生成EPUB的服务生成通知转换完成的消息,并加入到消息队列中,以便于通知其它处理服务进行后续的处理。
在申请的一个实施例中,合并中间数据生成EPUB的服务的处理流程如图8所示,包括如下步骤:
S801,检测消息队列中的消息。
S802,获取需要合并的中间数据及生成EPUB文档的消息。
S803,检查云存储空间中的中间数据是否已全部生成;若是,则执行S804;否则继续检查中间数据是否已全部生成,比如可以每隔一段时间检查一次,也可以持续进行检查。
S804,如果所有子任务对应的中间数据都生成了,那么可以合并全部的中间数据。
S805,根据合并后的中间数据及EPUB的格式生成对应的EPUB文件。
S806,将生成的EPUB文件上传到云存储空间。
S807,发送完成转换的消息到消息队列中,使得后续的处理服务得到该消息,比如文档展示服务或者文档传输服务等。
可见,本申请实施例的技术方案实现了PDF转EPUB服务的并行化,进而可以极大的提高文档转换效率,充分利用服务器性能来缩减文档转换的等待时间,提高了用户体验。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的文档格式的转换控制方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的文档格式的转换控制方法的实施例。
图9示出了根据本申请的一个实施例的文档格式的转换控制装置的框图,该文档格式的转换控制装置可以应用于电子设备,该电子设备可以是服务器,具体比如可以是服务器中的转换入口服务。
参照图9所示,根据本申请的一个实施例的文档格式的转换控制装置900,包括:接收单元902、拆分单元904、分配单元906和生成单元908。
其中,接收单元902配置为接收格式转换任务,所述格式转换任务用于指示将第一格式文档转换为第二格式文档;拆分单元904配置为根据所述第一格式文档的属性信息,将所述格式转换任务拆分为多个子任务;分配单元906配置为将所述多个子任务分配给解析服务集群,以使所述解析服务集群中的文档解析服务处理所述多个子任务,得到各个子任务对应的格式化数据;生成单元908配置为根据所述多个子任务分别对应的格式化数据生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述分配单元906配置为:将所述多个子任务发送到消息队列中,以使所述解析服务集群中的文档解析服务从所述消息队列中读取所述子任务进行处理。
在本申请的一些实施例中,基于前述方案,所述生成单元908配置为:向文档生成服务发送生成第二格式文档的通知消息,以使所述文档生成服务在接收到所述通知消息后获取所述各个子任务对应的格式化数据,并根据所述多个子任务分别对应的格式化数据,生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述格式化数据由所述文档解析服务在处理所述子任务之后存储至指定存储空间中的;所述生成单元908配置为:将生成第二格式文档的通知消息发送到消息队列中,以使所述文档生成服务从所述消息队列中检测到所述通知消息后从所述指定存储空间中获取所述各个子任务对应的格式化数据。
在本申请的一些实施例中,基于前述方案,所述拆分单元904配置为:根据所述第一格式文档的页码总数,将所述第一格式文档拆分为多份子文档,每份子文档对应一个所述子任务;或者根据所述第一格式文档的数据量,将所述第一格式文档拆分为多份子文档,每份子文档对应一个所述子任务。
图10示出了根据本申请的一个实施例的文档格式的转换控制装置的框图,该文档格式的转换控制装置可以应用于电子设备,该电子设备可以是服务器,具体比如可以是服务器中的文档生成服务。
参照图10所示,根据本申请的一个实施例的文档格式的转换控制装置1000,包括:获取单元1002和合并单元1004。
其中,获取单元1002配置为获取文档解析服务集群生成的与多个子任务分别对应的格式化数据,所述多个子任务是根据第一格式文档的属性信息将格式转换任务进行拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;合并单元1004配置为将所述多个子任务分别对应的格式化数据进行合并处理,以生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述获取单元1002配置为:从指定存储空间中检测所述多个子任务分别对应的格式化数据,所述格式化数据是由所述文档解析服务集群中的文档解析服务在处理所述子任务之后存储至所述存储空间中的;若检测到所述多个子任务分别对应的格式化数据均生成,则从所述指定存储空间中获取所述多个子任务分别对应的格式化数据。
在本申请的一些实施例中,基于前述方案,所述获取单元1002配置为:若接收到生成第二格式文档的通知消息,则根据所述通知消息从指定存储空间中检测所述多个子任务分别对应的格式化数据。
在本申请的一些实施例中,基于前述方案,所述获取单元1002还配置为:检测消息队列中的消息,以从所述消息队列中获取所述通知消息;在获取所述通知消息之后,从所述指定存储空间中周期性地检测所述多个子任务分别对应的格式化数据是否生成。
在本申请的一些实施例中,基于前述方案,所述合并单元1004还配置为:在生成所述第二格式文档之后,将生成所述第二格式文档的完成消息发送至消息队列中,以使其它处理服务从所述消息队列中获取到所述完成消息。
图11示出了根据本申请的一个实施例的文档格式的转换控制装置的框图,该文档格式的转换控制装置可以应用于电子设备,该电子设备可以是服务器,具体比如可以是服务器中的文档解析服务。
参照图11所示,根据本申请的一个实施例的文档格式的转换控制装置1100,包括:获取单元1102、处理单元1104和存储单元1106。
其中,获取单元1102配置为获取用于进行格式转换的子任务,所述子任务是根据第一格式文档的属性信息将格式转换任务拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;处理单元1104配置为处理所述子任务,得到所述子任务对应的格式化数据;存储单元1106配置为将所述子任务对应的格式化数据存储至指定存储空间中,以便于根据所述指定存储空间中存储的多个子任务分别对应的格式化数据生成所述第二格式文档。
在本申请的一些实施例中,基于前述方案,所述获取单元1102配置为:检测消息队列中的消息,所述消息队列用于存储所述格式转换任务拆分得到的多个子任务;从所述消息队列中获取所述子任务。
图12示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图,该电子设备可以是前述实施例中的服务器。
需要说明的是,图12示出的电子设备的计算机系统1200仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图12所示,计算机系统1200可以包括中央处理单元(Central ProcessingUnit,CPU)1201,其可以根据存储在只读存储器(Read-Only Memory,ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(Random Access Memory,RAM)1203中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1203中,还存储有系统操作所需的各种程序和数据。CPU 1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(Input/Output,I/O)接口1205也连接至总线1204。
以下部件可以连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序用于执行流程图所示的方法。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(CPU)1201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储计算机程序的有形介质,该计算机程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机程序的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个计算机程序,当上述一个或者多个计算机程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台电子设备执行根据本申请实施方式的方法。
比如,电子设备可以执行图3、图5或者图6所示的文档格式的转换控制方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (18)

1.一种文档格式的转换控制方法,其特征在于,包括:
接收格式转换任务,所述格式转换任务用于指示将第一格式文档转换为第二格式文档;
根据所述第一格式文档的属性信息,将所述格式转换任务拆分为多个子任务;
将所述多个子任务分配给解析服务集群,以使所述解析服务集群中的文档解析服务处理所述多个子任务,得到各个子任务对应的格式化数据;
根据所述多个子任务分别对应的格式化数据生成所述第二格式文档。
2.根据权利要求1所述的文档格式的转换控制方法,其特征在于,将所述多个子任务分配给解析服务集群,以使所述解析服务集群中的文档解析服务处理所述多个子任务,包括:
将所述多个子任务发送到消息队列中,以使所述解析服务集群中的文档解析服务从所述消息队列中读取所述子任务进行处理。
3.根据权利要求1所述的文档格式的转换控制方法,其特征在于,根据所述多个子任务分别对应的格式化数据生成所述第二格式文档,包括:
向文档生成服务发送生成第二格式文档的通知消息,以使所述文档生成服务在接收到所述通知消息后获取所述各个子任务对应的格式化数据,并根据所述多个子任务分别对应的格式化数据,生成所述第二格式文档。
4.根据权利要求3所述的文档格式的转换控制方法,其特征在于,所述格式化数据由所述文档解析服务在处理所述子任务之后存储至指定存储空间中的;
所述向文档生成服务发送生成第二格式文档的通知消息,包括:将生成第二格式文档的通知消息发送到消息队列中,以使所述文档生成服务从所述消息队列中检测到所述通知消息后从所述指定存储空间中获取所述各个子任务对应的格式化数据。
5.根据权利要求1所述的文档格式的转换控制方法,其特征在于,根据所述第一格式文档的属性信息,将所述格式转换任务拆分为多个子任务,包括:
根据所述第一格式文档的页码总数,将所述第一格式文档拆分为多份子文档,每份子文档对应一个所述子任务;或者
根据所述第一格式文档的数据量,将所述第一格式文档拆分为多份子文档,每份子文档对应一个所述子任务。
6.一种文档格式的转换控制方法,其特征在于,包括:
获取文档解析服务集群生成的与多个子任务分别对应的格式化数据,所述多个子任务是根据第一格式文档的属性信息将格式转换任务进行拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;
将所述多个子任务分别对应的格式化数据进行合并处理,以生成所述第二格式文档。
7.根据权利要求6所述的文档格式的转换控制方法,其特征在于,获取文档解析服务集群生成的与多个子任务分别对应的格式化数据,包括:
从指定存储空间中检测所述多个子任务分别对应的格式化数据,所述格式化数据是由所述文档解析服务集群中的文档解析服务在处理所述子任务之后存储至所述存储空间中的;
若检测到所述多个子任务分别对应的格式化数据均生成,则从所述指定存储空间中获取所述多个子任务分别对应的格式化数据。
8.根据权利要求7所述的文档格式的转换控制方法,其特征在于,从指定存储空间中检测所述多个子任务分别对应的格式化数据,包括:
若接收到生成第二格式文档的通知消息,则根据所述通知消息从指定存储空间中检测所述多个子任务分别对应的格式化数据。
9.根据权利要求8所述的文档格式的转换控制方法,其特征在于,所述文档格式的转换控制方法还包括:
检测消息队列中的消息,以从所述消息队列中获取所述通知消息;
在获取所述通知消息之后,从所述指定存储空间中周期性地检测所述多个子任务分别对应的格式化数据是否生成。
10.根据权利要求6至9中任一项所述的文档格式的转换控制方法,其特征在于,在生成所述第二格式文档之后,所述文档格式的转换控制方法还包括:
将生成所述第二格式文档的完成消息发送至消息队列中,以使其它处理服务从所述消息队列中获取到所述完成消息。
11.一种文档格式的转换控制方法,其特征在于,包括:
获取用于进行格式转换的子任务,所述子任务是根据第一格式文档的属性信息将格式转换任务拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;
处理所述子任务,得到所述子任务对应的格式化数据;
将所述子任务对应的格式化数据存储至指定存储空间中,以便于根据所述指定存储空间中存储的多个子任务分别对应的格式化数据生成所述第二格式文档。
12.根据权利要求11所述的文档格式的转换控制方法,其特征在于,获取用于进行格式转换的子任务,包括:
检测消息队列中的消息,所述消息队列用于存储所述格式转换任务拆分得到的多个子任务;
从所述消息队列中获取所述子任务。
13.一种文档格式的转换控制装置,其特征在于,包括:
接收单元,配置为接收格式转换任务,所述格式转换任务用于指示将第一格式文档转换为第二格式文档;
拆分单元,配置为根据所述第一格式文档的属性信息,将所述格式转换任务拆分为多个子任务;
分配单元,配置为将所述多个子任务分配给解析服务集群,以使所述解析服务集群中的文档解析服务处理所述多个子任务,得到各个子任务对应的格式化数据;
生成单元,配置为根据所述多个子任务分别对应的格式化数据生成所述第二格式文档。
14.一种文档格式的转换控制装置,其特征在于,包括:
获取单元,配置为获取文档解析服务集群生成的与多个子任务分别对应的格式化数据,所述多个子任务是根据第一格式文档的属性信息将格式转换任务进行拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;
合并单元,配置为将所述多个子任务分别对应的格式化数据进行合并处理,以生成所述第二格式文档。
15.一种文档格式的转换控制装置,其特征在于,包括:
获取单元,配置为获取用于进行格式转换的子任务,所述子任务是根据第一格式文档的属性信息将格式转换任务拆分得到的,所述格式转换任务用于指示将所述第一格式文档转换为第二格式文档;
处理单元,配置为处理所述子任务,得到所述子任务对应的格式化数据;
存储单元,配置为将所述子任务对应的格式化数据存储至指定存储空间中,以便于根据所述指定存储空间中存储的多个子任务分别对应的格式化数据生成所述第二格式文档。
16.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的文档格式的转换控制方法。
17.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1至12中任一项所述的文档格式的转换控制方法。
18.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中,电子设备的处理器从所述计算机可读存储介质读取并执行所述计算机程序,使得所述电子设备执行如权利要求1至12中任一项所述的文档格式的转换控制方法。
CN202311114234.4A 2023-08-30 2023-08-30 文档格式的转换控制方法、装置、计算机可读介质及设备 Pending CN117195834A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311114234.4A CN117195834A (zh) 2023-08-30 2023-08-30 文档格式的转换控制方法、装置、计算机可读介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311114234.4A CN117195834A (zh) 2023-08-30 2023-08-30 文档格式的转换控制方法、装置、计算机可读介质及设备

Publications (1)

Publication Number Publication Date
CN117195834A true CN117195834A (zh) 2023-12-08

Family

ID=88997226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311114234.4A Pending CN117195834A (zh) 2023-08-30 2023-08-30 文档格式的转换控制方法、装置、计算机可读介质及设备

Country Status (1)

Country Link
CN (1) CN117195834A (zh)

Similar Documents

Publication Publication Date Title
CN111221793B (zh) 数据挖掘方法、平台、计算机设备及存储介质
CN110955640B (zh) 跨系统数据文件的处理方法、装置、服务器和存储介质
CN111786939B (zh) 物联网管理平台测试的方法、装置和系统
CN110888639A (zh) 一种业务代码编译打包方法和装置
CN117195834A (zh) 文档格式的转换控制方法、装置、计算机可读介质及设备
CN113141403B (zh) 一种日志传输方法和装置
CN114924937A (zh) 批量任务处理方法、装置、电子设备及计算机可读介质
CN115033542A (zh) 文件传输方法、文件传输装置、电子设备及存储介质
CN113760482A (zh) 一种任务处理方法、装置和系统
CN114301980A (zh) 容器集群的调度方法、装置、系统及计算机可读介质
CN111178014A (zh) 一种处理业务流程的方法和装置
CN113992641A (zh) 一种数据处理方法、装置、设备及存储介质
CN115705465A (zh) 数据解析结果的呈现方法、装置、设备及存储介质
CN110858240A (zh) 一种前端模块加载方法和装置
CN111970338A (zh) 基于云函数的请求处理方法、装置及计算机可读介质
CN109840073B (zh) 业务流程的实现方法和装置
CN112230891A (zh) 接口文档的集成方法、装置、服务器及计算机存储介质
CN110780937A (zh) 任务发布方法、装置、计算机可读存储介质及设备
CN112527290A (zh) 基于生物特征信息搭建页面的方法和装置
CN112988528B (zh) 日志处理方法、装置及容器组
US10079739B2 (en) Computer-implemented method for handling log file
CN114201493B (zh) 数据接入方法、装置、设备以及存储介质
CN114546530B (zh) 一种大数据的加载方法、装置、设备及介质
CN116561015B (zh) 地图应用测试方法、电子设备与计算机可读介质
CN111736805B (zh) 一种处理Excel表格的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication