CN111400012A - 数据并行处理方法、装置、设备及存储介质 - Google Patents

数据并行处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111400012A
CN111400012A CN202010199891.3A CN202010199891A CN111400012A CN 111400012 A CN111400012 A CN 111400012A CN 202010199891 A CN202010199891 A CN 202010199891A CN 111400012 A CN111400012 A CN 111400012A
Authority
CN
China
Prior art keywords
data
splitting
subtasks
sub
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010199891.3A
Other languages
English (en)
Inventor
陈军
唐成山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202010199891.3A priority Critical patent/CN111400012A/zh
Publication of CN111400012A publication Critical patent/CN111400012A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5018Thread allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种数据并行处理方法、装置、设备及存储介质。包括:若待处理任务支持分片,获取数据拆分规则;根据所述拆分规则将所述待处理任务拆分为多个子任务;将所述多个子任务分配至对应的线程进行处理,获得多个子结果;将所述多个子结果进行合并,获得数据处理结果。本发明实施例提供的数据并行处理方法,将待处理任务拆分为多个子任务,然后将多个子任务分配至对应的线程中并行处理,最后将各个子结果合并,获得最终的数据处理结果,可以减少单个作业处理的批处理时间,从而提高数据的处理效率。

Description

数据并行处理方法、装置、设备及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种数据并行处理方法、装置、设备及存储介质。
背景技术
商业银行核心系统基于IBM大型机构建,大型机上的联机、批处理基于文件,并在计算过程中没有网络损耗,但是从大型机下移到X86开放系统后,X86系统CPU、网络通讯、IO等损耗增加,单一机器无法满足大型银行10亿级以上的业务处理,通过对业务数据进行业务领域垂直拆分,数据量水平拆分来解决数据库瓶颈,但是在批处理中,一个批次的数据文件达到百万级,如果按由单台进行处理,仍然无法实现高效的计算。因而提高数据的处理效率显得尤为重要。
发明内容
本发明实施例提供一种数据并行处理方法、装置、设备及存储介质,通过数据分片,把一个任务按一定比例拆分成多片,并在不同机器上并行运行,来减少单个作业处理的批处理时间,从而提高数据的处理效率。
第一方面,本发明实施例提供了一种数据并行处理方法,包括:
若待处理任务支持分片,获取数据拆分规则;
根据所述拆分规则将所述待处理任务拆分为多个子任务;
将所述多个子任务分配至对应的线程进行处理,获得多个子结果;
将所述多个子结果进行合并,获得数据处理结果。
进一步地,获取数据拆分规则,包括:
根据所述待处理任务的身份标识码获取分片参数;
根据所述分片参数确定数据拆分规则。
进一步地,在根据设定拆分规则将所述待处理任务拆分为多个子任务,包括:
注册拆分表;
将拆分的多个子任务的信息登记至所述拆分表中;所述拆分表用于记录拆分进度。
进一步地,所述子任务的信息包括:子任务的身份识别码、输入文件路径、输出文件路径及记录条数。
进一步地,将所述多个子任务分配至对应的线程进行处理,获得多个子结果,包括:
根据子任务的信息按照锁机制将所述多个子任务分配至对应的线程进行处理,获得多个子结果。
第二方面,本发明实施例还提供了一种数据并行处理装置,包括:
数据拆分规则获取模块,用于若待处理任务支持分片,获取数据拆分规则;
子任务获取模块,用于根据所述拆分规则将所述待处理任务拆分为多个子任务;
子结果获取模块,用于将所述多个子任务分配至对应的线程进行处理,获得多个子结果;
数据处理结果获取模块,用于将所述多个子结果进行合并,获得数据处理结果。
进一步地,所述数据拆分规则获取模块,还用于:
根据所述待处理任务的身份标识码获取分片参数;
根据所述分片参数确定数据拆分规则。
进一步地,所述子任务获取模块,还用于:
注册拆分表;
将拆分的多个子任务的信息登记至所述拆分表中;所述拆分表用于记录拆分进度。。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例所述的数据并行处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理装置执行时实现如本发明实施例所述的数据并行处理方法。
本发明实施例,若待处理任务支持分片,获取数据拆分规则;根据拆分规则将待处理任务拆分为多个子任务;将多个子任务分配至对应的线程进行处理,获得多个子结果;将多个结果进行合并,获得数据处理结果。本发明实施例提供的数据并行处理方法,将待处理任务拆分为多个子任务,然后将多个子任务分配至对应的线程中并行处理,最后将各个子结果合并,获得最终的数据处理结果,可以减少单个作业处理的批处理时间,从而提高数据的处理效率。
附图说明
图1是本发明实施例一中的一种数据并行处理方法的流程图;
图2是本发明实施例一中的又一种数据并行处理方法的流程图;
图3是本发明实施例二中的一种数据并行处理装置的结构示意图;
图4是本发明实施例三中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种数据并行处理方法的流程图,本实施例可适用于对数据进行批量处理的情况,该方法可以由数据并行处理装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有数据并行处理功能的设备中,该设备可以是服务器或服务器集群等电子设备。如图1所示,具体包括如下步骤:
步骤110,若待处理任务支持分片,获取数据拆分规则。
其中,待处理任务可以是批量数据,例如:一个包含200万记录的待处理任务。本实施例中,首先判断待处理任务是否支持数据分片,若支持,则获取该待处理任务所需的数据分片规则。
具体的,获取数据拆分规则的方式可以是:根据待处理任务的身份标识码获取分片参数;根据分片参数确定数据拆分规则。
其中,待处理任务的身份标识码可以是待处理任务的名称。本实施例中,如果待处理任务支持分片,则根据待处理任务的身份识别码读取分片参数表,然后根据分片参数获取数据拆分规则。
步骤120,根据拆分规则将待处理任务拆分为多个子任务。
具体的,根据设定拆分规则将所述待处理任务拆分为多个子任务的过程可以是:注册拆分表;将拆分的多个子任务的信息登记至所述拆分表中。
其中,拆分表用于记录拆分进度。子任务的信息可以包括:子任务的身份识别码、输入文件路径、输出文件路径及记录条数。本实施例中,拆分表中记录主任务和子任务,当所有子任务的信息登记至拆分表后,更新主任务的状态为“拆分完成”。本实施例中,还可以根据任务身份识别码及子任务的信息进行参数调整。
步骤130,将多个子任务分配至对应的线程进行处理,获得多个子结果。
具体的,将多个子任务分配至对应的线程进行处理,获得多个子结果的方式可以是:根据子任务的信息按照锁机制将多个子任务分配至对应的线程进行处理,获得多个子结果。
本实施例中,通过拆分表记录子任务信息,利用数据库的锁机制,实现每个子任务只有一个线程来处理,没处理完成一个子任务,更新主任务完成记录数,当所有的子任务处理完成后,更新主任务的状态为“完成处理”。
步骤140,将多个子结果进行合并,获得数据处理结果。
本实施例中,在获得处理完成的子结果后,由主线程将多个子结果进行合并,获得数据处理结果。
本实施例的技术方案,若待处理任务支持分片,获取数据拆分规则;根据拆分规则将待处理任务拆分为多个子任务;将多个子任务分配至对应的线程进行处理,获得多个子结果;将多个结果进行合并,获得数据处理结果。本发明实施例提供的数据并行处理方法,将待处理任务拆分为多个子任务,然后将多个子任务分配至对应的线程中并行处理,最后将各个子结果合并,获得最终的数据处理结果,可以减少单个作业处理的批处理时间,从而提高数据的处理效率。
可选的,图2为本发明实施例一提供的一种数据并行处理方法的流程图,作为对上述实施例的进一步解释,该方法具体包括:获取待处理任务,并判断待处理任务是否支持分片,若支持,则根据任务名称读取分片参数表,并根据分片参数获取数据分片规则;注册拆分表,将主任务和子任务信息登记至拆分表中;利用排它锁机制将多个子任务分配至对应的线程中进行处理,获得多个子结果,并将拆分表中的状态更新为已完成;当所有子任务处理完成时,将多个子结果进行合并,获得数据处理结果。
实施例二
图3为本发明实施例二提供的一种数据并行处理装置的结构示意图。如图3所示,该装置包括:数据拆分规则获取模块210,子任务获取模块220,子结果获取模块230和数据处理结果获取模块240。
数据拆分规则获取模块210,用于若待处理任务支持分片,获取数据拆分规则;
子任务获取模块220,用于根据拆分规则将待处理任务拆分为多个子任务;
子结果获取模块230,用于将多个子任务分配至对应的线程进行处理,获得多个子结果;
数据处理结果获取模块240,用于将多个子结果进行合并,获得数据处理结果。
可选的,数据拆分规则获取模块210,还用于:
根据待处理任务的身份标识码获取分片参数;
根据分片参数确定数据拆分规则。
可选的,子任务获取模块220,还用于:
注册拆分表;
将拆分的多个子任务的信息登记至拆分表中;拆分表用于记录拆分进度。
可选的,子任务的信息包括:子任务的身份识别码、输入文件路径、输出文件路径及记录条数。
可选的,子结果获取模块230,还用于:
根据子任务的信息按照锁机制将多个子任务分配至对应的线程进行处理,获得多个子结果。
上述装置可执行本发明前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明前述所有实施例所提供的方法。
实施例三
图4为本发明实施例三提供的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的计算机设备312的框图。图4显示的计算机设备312仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备312是典型的数据并行处理功能的计算设备。
如图4所示,计算机设备312以通用计算设备的形式表现。计算机设备312的组件可以包括但不限于:一个或者多个处理器316,存储装置328,连接不同系统组件(包括存储装置328和处理器316)的总线318。
总线318表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备312典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备312访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置328可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)330和/或高速缓存存储器332。计算机设备312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统334可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储装置328可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块326的程序336,可以存储在例如存储装置328中,这样的程序模块326包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块326通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备312也可以与一个或多个外部设备314(例如键盘、指向设备、摄像头、显示器324等)通信,还可与一个或者多个使得用户能与该计算机设备312交互的设备通信,和/或与使得该计算机设备312能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口322进行。并且,计算机设备312还可以通过网络适配器320与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器320通过总线318与计算机设备312的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备312使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器316通过运行存储在存储装置328中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的数据并行处理方法。
实施例四
本发明实施例提供了一种计算机可读存储介质。本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收用户输入的源文本,将所述源文本翻译为目标语种对应的目标文本;获取所述用户的历史纠正行为;根据所述历史纠正行为对所述目标文本进行纠正,获得翻译结果,并将所述翻译结果推送至所述用户所在的客户端。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种数据并行处理方法,其特征在于,包括:
若待处理任务支持分片,获取数据拆分规则;
根据所述拆分规则将所述待处理任务拆分为多个子任务;
将所述多个子任务分配至对应的线程进行处理,获得多个子结果;
将所述多个子结果进行合并,获得数据处理结果。
2.根据权利要求1所述的方法,其特征在于,获取数据拆分规则,包括:
根据所述待处理任务的身份标识码获取分片参数;
根据所述分片参数确定数据拆分规则。
3.根据权利要求1所述的方法,其特征在于,根据设定拆分规则将所述待处理任务拆分为多个子任务,包括:
注册拆分表;
将拆分的多个子任务的信息登记至所述拆分表中;所述拆分表用于记录拆分进度。
4.根据权利要求3所述的方法,其特征在于,所述子任务的信息包括:子任务的身份识别码、输入文件路径、输出文件路径及记录条数。
5.根据权利要求3所述的方法,其特征在于,将所述多个子任务分配至对应的线程进行处理,获得多个子结果,包括:
根据子任务的信息按照锁机制将所述多个子任务分配至对应的线程进行处理,获得多个子结果。
6.一种数据并行处理装置,其特征在于,包括:
数据拆分规则获取模块,用于若待处理任务支持分片,获取数据拆分规则;
子任务获取模块,用于根据所述拆分规则将所述待处理任务拆分为多个子任务;
子结果获取模块,用于将所述多个子任务分配至对应的线程进行处理,获得多个子结果;
数据处理结果获取模块,用于将所述多个子结果进行合并,获得数据处理结果。
7.根据权利要求6所述的装置,其特征在于,所述数据拆分规则获取模块,还用于:
根据所述待处理任务的身份标识码获取分片参数;
根据所述分片参数确定数据拆分规则。
8.根据权利要求6所述的装置,其特征在于,所述子任务获取模块,还用于:
注册拆分表;
将拆分的多个子任务的信息登记至所述拆分表中;所述拆分表用于记录拆分进度。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任一所述的数据并行处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-5中任一所述的数据并行处理方法。
CN202010199891.3A 2020-03-20 2020-03-20 数据并行处理方法、装置、设备及存储介质 Pending CN111400012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010199891.3A CN111400012A (zh) 2020-03-20 2020-03-20 数据并行处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010199891.3A CN111400012A (zh) 2020-03-20 2020-03-20 数据并行处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111400012A true CN111400012A (zh) 2020-07-10

Family

ID=71434374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010199891.3A Pending CN111400012A (zh) 2020-03-20 2020-03-20 数据并行处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111400012A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782403A (zh) * 2020-07-17 2020-10-16 Oppo广东移动通信有限公司 数据处理方法、装置以及电子设备
CN112130972A (zh) * 2020-08-24 2020-12-25 北京思特奇信息技术股份有限公司 一种任务处理的方法和系统
CN112162859A (zh) * 2020-09-24 2021-01-01 成都长城开发科技有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN112162644A (zh) * 2020-09-24 2021-01-01 深圳哇哇鱼网络科技有限公司 多语言输入法的硬件加速方法、终端及介质
CN112307105A (zh) * 2020-11-03 2021-02-02 平安普惠企业管理有限公司 基于多线程的定时任务运行方法、装置、设备及存储介质
CN112364001A (zh) * 2020-11-03 2021-02-12 北京红山信息科技研究院有限公司 多维空间大数据的清洗方法、装置、计算机设备及介质
CN112486966A (zh) * 2020-11-26 2021-03-12 中国国家铁路集团有限公司 一种过期数据清理方法、装置和电子设备
CN112800147A (zh) * 2021-02-02 2021-05-14 北京明略昭辉科技有限公司 一种数据处理方法、装置、设备及存储介质
CN112818338A (zh) * 2021-01-22 2021-05-18 支付宝(杭州)信息技术有限公司 一种程序运行方法及系统
CN112948078A (zh) * 2021-02-10 2021-06-11 中国工商银行股份有限公司 基于服务调用的收益分配任务处理方法及装置
CN113010286A (zh) * 2021-03-12 2021-06-22 京东数字科技控股股份有限公司 并行任务调度方法、装置、计算机设备和存储介质
CN113111055A (zh) * 2021-04-19 2021-07-13 中国工商银行股份有限公司 一种数据表的数据清理方法及装置
CN113110935A (zh) * 2021-04-13 2021-07-13 中国邮政储蓄银行股份有限公司 分布式批量作业处理系统
CN113392252A (zh) * 2021-06-01 2021-09-14 上海徐毓智能科技有限公司 数据处理方法和装置
CN113407429A (zh) * 2021-06-23 2021-09-17 中国建设银行股份有限公司 一种任务处理方法和装置
CN113485806A (zh) * 2021-07-02 2021-10-08 中国建设银行股份有限公司 处理任务的方法、装置、设备和计算机可读介质
CN113687951A (zh) * 2021-09-01 2021-11-23 睿云奇智(重庆)科技有限公司 任务处理方法、装置、电子设备及计算机可读存储介质
CN114020434A (zh) * 2021-11-09 2022-02-08 中国建设银行股份有限公司 一种任务处理方法、装置、电子设备及存储介质
CN115062022A (zh) * 2022-06-16 2022-09-16 北京汉端科技有限公司 航空器手册拆分方法、装置、电子设备和计算机可读介质
CN115361382A (zh) * 2022-08-10 2022-11-18 北京友友天宇系统技术有限公司 基于数据群组的数据处理方法、装置、设备和存储介质
CN115378937A (zh) * 2022-08-10 2022-11-22 北京友友天宇系统技术有限公司 任务的分布式并发方法、装置、设备和可读存储介质
CN115426266A (zh) * 2022-10-09 2022-12-02 中国工商银行股份有限公司 配置下发方法及装置
CN116401070A (zh) * 2023-06-06 2023-07-07 昆山嘉提信息科技有限公司 一种多mcu的数据并行处理方法及装置
CN117608813A (zh) * 2023-10-07 2024-02-27 速度科技股份有限公司 基于大数据的卫星数据多任务并行处理方法
CN113110935B (zh) * 2021-04-13 2024-09-24 中国邮政储蓄银行股份有限公司 分布式批量作业处理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688500A (zh) * 2017-07-26 2018-02-13 阿里巴巴集团控股有限公司 一种分布式任务处理方法、装置、系统及设备
CN109308214A (zh) * 2017-07-27 2019-02-05 北京京东尚科信息技术有限公司 数据任务处理方法和系统
CN109408214A (zh) * 2018-11-06 2019-03-01 北京字节跳动网络技术有限公司 一种数据的并行处理方法、装置、电子设备及可读介质
CN110673959A (zh) * 2019-10-14 2020-01-10 京东数字科技控股有限公司 用于处理任务的系统、方法和装置
CN110781159A (zh) * 2019-10-28 2020-02-11 柏科数据技术(深圳)股份有限公司 Ceph目录文件信息读取方法、装置、服务器及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688500A (zh) * 2017-07-26 2018-02-13 阿里巴巴集团控股有限公司 一种分布式任务处理方法、装置、系统及设备
CN109308214A (zh) * 2017-07-27 2019-02-05 北京京东尚科信息技术有限公司 数据任务处理方法和系统
CN109408214A (zh) * 2018-11-06 2019-03-01 北京字节跳动网络技术有限公司 一种数据的并行处理方法、装置、电子设备及可读介质
CN110673959A (zh) * 2019-10-14 2020-01-10 京东数字科技控股有限公司 用于处理任务的系统、方法和装置
CN110781159A (zh) * 2019-10-28 2020-02-11 柏科数据技术(深圳)股份有限公司 Ceph目录文件信息读取方法、装置、服务器及存储介质

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782403A (zh) * 2020-07-17 2020-10-16 Oppo广东移动通信有限公司 数据处理方法、装置以及电子设备
CN112130972A (zh) * 2020-08-24 2020-12-25 北京思特奇信息技术股份有限公司 一种任务处理的方法和系统
CN112162859A (zh) * 2020-09-24 2021-01-01 成都长城开发科技有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN112162644A (zh) * 2020-09-24 2021-01-01 深圳哇哇鱼网络科技有限公司 多语言输入法的硬件加速方法、终端及介质
CN112307105A (zh) * 2020-11-03 2021-02-02 平安普惠企业管理有限公司 基于多线程的定时任务运行方法、装置、设备及存储介质
CN112364001A (zh) * 2020-11-03 2021-02-12 北京红山信息科技研究院有限公司 多维空间大数据的清洗方法、装置、计算机设备及介质
CN112486966A (zh) * 2020-11-26 2021-03-12 中国国家铁路集团有限公司 一种过期数据清理方法、装置和电子设备
CN112818338A (zh) * 2021-01-22 2021-05-18 支付宝(杭州)信息技术有限公司 一种程序运行方法及系统
CN112800147A (zh) * 2021-02-02 2021-05-14 北京明略昭辉科技有限公司 一种数据处理方法、装置、设备及存储介质
CN112948078A (zh) * 2021-02-10 2021-06-11 中国工商银行股份有限公司 基于服务调用的收益分配任务处理方法及装置
CN113010286A (zh) * 2021-03-12 2021-06-22 京东数字科技控股股份有限公司 并行任务调度方法、装置、计算机设备和存储介质
CN113110935A (zh) * 2021-04-13 2021-07-13 中国邮政储蓄银行股份有限公司 分布式批量作业处理系统
CN113110935B (zh) * 2021-04-13 2024-09-24 中国邮政储蓄银行股份有限公司 分布式批量作业处理系统
CN113111055A (zh) * 2021-04-19 2021-07-13 中国工商银行股份有限公司 一种数据表的数据清理方法及装置
CN113392252B (zh) * 2021-06-01 2023-01-17 上海徐毓智能科技有限公司 数据处理方法和装置
CN113392252A (zh) * 2021-06-01 2021-09-14 上海徐毓智能科技有限公司 数据处理方法和装置
CN113407429A (zh) * 2021-06-23 2021-09-17 中国建设银行股份有限公司 一种任务处理方法和装置
CN113485806A (zh) * 2021-07-02 2021-10-08 中国建设银行股份有限公司 处理任务的方法、装置、设备和计算机可读介质
CN113687951A (zh) * 2021-09-01 2021-11-23 睿云奇智(重庆)科技有限公司 任务处理方法、装置、电子设备及计算机可读存储介质
CN114020434A (zh) * 2021-11-09 2022-02-08 中国建设银行股份有限公司 一种任务处理方法、装置、电子设备及存储介质
CN115062022A (zh) * 2022-06-16 2022-09-16 北京汉端科技有限公司 航空器手册拆分方法、装置、电子设备和计算机可读介质
CN115062022B (zh) * 2022-06-16 2023-08-18 北京汉端科技有限公司 航空器手册拆分方法、装置、电子设备和计算机可读介质
CN115361382A (zh) * 2022-08-10 2022-11-18 北京友友天宇系统技术有限公司 基于数据群组的数据处理方法、装置、设备和存储介质
CN115378937A (zh) * 2022-08-10 2022-11-22 北京友友天宇系统技术有限公司 任务的分布式并发方法、装置、设备和可读存储介质
CN115426266A (zh) * 2022-10-09 2022-12-02 中国工商银行股份有限公司 配置下发方法及装置
CN115426266B (zh) * 2022-10-09 2024-04-30 中国工商银行股份有限公司 配置下发方法及装置
CN116401070A (zh) * 2023-06-06 2023-07-07 昆山嘉提信息科技有限公司 一种多mcu的数据并行处理方法及装置
CN117608813A (zh) * 2023-10-07 2024-02-27 速度科技股份有限公司 基于大数据的卫星数据多任务并行处理方法

Similar Documents

Publication Publication Date Title
CN111400012A (zh) 数据并行处理方法、装置、设备及存储介质
US11544623B2 (en) Consistent filtering of machine learning data
US10102480B2 (en) Machine learning service
US9886670B2 (en) Feature processing recipes for machine learning
US10866973B2 (en) Test data management
US20150379072A1 (en) Input processing for machine learning
CN109508326B (zh) 用于处理数据的方法、装置和系统
US10402406B2 (en) Predictive database for computer processes
CN110428319B (zh) 一种数据比对平台、方法、设备和存储介质
US11200231B2 (en) Remote query optimization in multi data sources
US9753979B2 (en) Dynamic combination of processes for sub-queries
US9652227B2 (en) Assigning an annotation to a variable and a statement in a source code of a software application
US20170329740A1 (en) Distributed client based cache for keys using demand fault invalidation
CN109597697B (zh) 一种资源撮合处理方法及装置
CN111782614B (zh) 数据访问方法、装置、设备及存储介质
US9632837B2 (en) Systems and methods for system consolidation
CN111047427A (zh) 数据上报方法、装置、服务器及存储介质
US20190384629A1 (en) Dynamically determine the transaction coordinator in multitier hybrid transaction processing middleware systems
CN111143461A (zh) 映射关系处理系统、方法和电子设备
CN112148705A (zh) 数据迁移的方法和装置
CN114168607A (zh) 全局序列号生成方法、装置、设备、介质和产品
CN113312195A (zh) 数据处理方法、装置、设备及存储介质
US10122643B2 (en) Systems and methods for reorganization of messages in queuing systems
US20230214394A1 (en) Data search method and apparatus, electronic device and storage medium
CN113742225B (zh) 一种测试数据生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220920

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.

TA01 Transfer of patent application right