CN117519996A - 一种数据处理方法、装置、设备以及存储介质 - Google Patents
一种数据处理方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN117519996A CN117519996A CN202410021649.5A CN202410021649A CN117519996A CN 117519996 A CN117519996 A CN 117519996A CN 202410021649 A CN202410021649 A CN 202410021649A CN 117519996 A CN117519996 A CN 117519996A
- Authority
- CN
- China
- Prior art keywords
- server
- large model
- tasks
- execution
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000012821 model calculation Methods 0.000 claims abstract description 133
- 238000004364 calculation method Methods 0.000 claims abstract description 60
- 238000012545 processing Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 15
- 238000013473 artificial intelligence Methods 0.000 description 14
- 230000004044 response Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 101710092887 Integrator complex subunit 4 Proteins 0.000 description 2
- 102100030148 Integrator complex subunit 8 Human genes 0.000 description 2
- 101710092891 Integrator complex subunit 8 Proteins 0.000 description 2
- 102100037075 Proto-oncogene Wnt-3 Human genes 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 235000008001 rakum palm Nutrition 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据处理方法、装置、设备以及存储介质。该方法包括:响应于大模型计算请求,获取大模型计算任务;根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;根据执行策略调用至少一个服务器中的大模型执行计算任务,以对大模型计算请求进行响应。本发明的技术方案,可以利用服务器集群中的单个服务器或多个服务器,针对性地对大模型计算任务进行处理,有效提高数据处理的效率。
Description
技术领域
本发明涉及大数据领域,尤其涉及一种数据处理方法、装置、设备以及存储介质。
背景技术
随着AI(Artificial Intelligence,人工智能)大语言模型的出现,使人工智能技术也出现广泛普及、适用于各种行业/各种应用场景的趋势。但大数据的不断发展也带来了数据规模更大更复杂的数据,这对数据的高效率处理带来了挑战。
因此,如何利用服务器集群中的单个服务器或多个服务器,针对性地对大模型计算任务进行处理,有效提高数据处理的效率,是目前亟待解决的问题。
发明内容
本发明提供了一种数据处理方法、装置、设备以及存储介质,可以利用服务器集群中的单个服务器或多个服务器,针对性地对大模型计算任务进行处理,有效提高数据处理的效率。
根据本发明的一方面,提供了一种数据处理方法,包括:
响应于大模型计算请求,获取大模型计算任务;
根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;
根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。
根据本发明的另一方面,提供了一种数据处理装置,包括:
获取模块,用于响应于大模型计算请求,获取大模型计算任务;
确定模块,用于根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;
执行模块,用于根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的数据处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据处理方法。
本发明实施例的技术方案,响应于大模型计算请求,获取大模型计算任务;根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。通过利用服务器集群中的单个服务器或多个服务器,针对性地对大模型计算任务进行处理,可以有效提高数据处理的效率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本发明实施例一提供的一种数据处理方法的流程图;
图1B是本发明实施例一提供的单节点服务器的结构示意图;
图2是本发明实施例二提供的一种数据处理方法的流程图;
图3是本发明实施例三提供的一种数据处理装置的结构框图;
图4是本发明实施例四提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”、“候选”、“备选”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1A是本发明实施例一提供的一种数据处理方法的流程图;图1B是本发明实施例一提供的单节点服务器的结构示意图;本实施例适用于本机服务器响应于大模型计算请求采用单个服务器或多个服务器执行计算任务的情况,该方法可以由数据处理装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成于具有数据处理功能的电子设备中,如服务器中,其中,该服务器可以是服务器集群中任意的一个服务器。如图1A所示,该数据处理方法包括:
S101、响应于大模型计算请求,获取大模型计算任务。
其中,大模型计算请求是指请求采用服务器集群中服务器的大模型进行数据计算的请求。大模型计算任务具体可以是指示本机服务器采用本地的大模型和/或指示服务器集群中的其他服务器采用其大模型进行计算处理的任务。大模型可以是指通用的AI大模型,如ChatGLM或MOSS等。
可选的,服务器集群中不同服务器上均部署有完整的大模型分层,且大模型结构相同;每个服务器大模型可以由至少两个前后衔接、可独立运行的模型分层集成组成,服务器通过大模型不同分层来实现大模型计算任务的执行。示例性的,大模型的分层包括以下至少一种:词层、编码层、解码层、语言建模匹配层以及损失计算层。
具体的,词层(Words)可以为ChatGLM(Generative Language Model)的Embedding层,分词后的词汇需要经过Embedding 层进行向量化表示。编码层(Encoding)可以为ChatGLM的GLM Block层,编码层将词汇的向量表示进行整合,得到一个个编码块;再基于注意力机制在层内进行计算,根据输入序列和查询序列的相关性生成权重矩阵。解码层(Decoding)可以为ChatGLM的Final Layer norm层,生成的输出序列经过Final Layernorm层进行归一化处理,得到最终的输出。语言建模匹配层可以是Chat GLM的LM层:通过上下文推测及计算输入输出匹配程度,根据输出的概率分布生成文本。损失计算层可以为ChatGLM的Loss层,负责计算模型在训练过程中的损失。
需要说明的是,本发明通过将通用大语言模型以及密码运算芯片部署到一台成本适合的单台服务器上,解决了私有环境下、中小企业及个人、以及有隐私保护要求的AI大语言模型推广需求。
可选的,响应于大模型计算请求,本机服务器可以实时接收所属服务器集群之上的负载均衡设备或软件(如F5设备)分布路由的大模型计算任务,即获取大模型计算任务;也可以直接对大模型计算请求进行解析,并根据解析结果确定待执行的大模型计算任务,同时,本发明中的本机服务器可实现待执行任务的拆分和下发,以及结合负载均衡服务器实现目标服务器的确定和调用,并接收各目标服务器生成的最终执行结果。
可选的,服务器集群中可以包含至少两个服务器,每个服务器均作为服务器集群的一个单节点,示例性的,参见图1B,每个单节点的服务器均可以包括密码芯片、配置有专属大模型的专用磁盘和预先定制的可提供AI算力的显卡。也就是说,服务器集群中的各服务器均配置有具备密码计算能力的芯片、显卡以及专用硬盘;专用硬盘用于对大模型进行优化压缩以及对大模型进行预训练。
其中,所述芯片是通过把密码机、密码卡的密码计算能力以协处理器的形式融合到通用芯片中所形成的,具有密码能力嵌入的通用芯片,该芯片需要满足相关密码模型资质和法规要求。所述显卡用于完成专用GPU(图形处理器,graphics processing unit)设备(如服务器)的AI大模型要求,使该设备具有可普及的AI计算能力。
需要说明的是,本发明直接采用专用密码芯片支撑商用密码计算需求,替代了传统密码机与密码卡,在云与私有计算环境中,无论是成本还是部署,都有着极强的扩展与普及优势,解决了密码应用本地化处理的需求。
可选的,可以根据成本从低到高来选择定制显卡,例如RTX3090ti,A40,RX6090xt以及华为昇腾Atlas对应显卡,以对应低、中、高多级设备型号的服务器,优选的,本发明的服务器中可配置采用RTX2080显卡进行大内存扩充(扩充到20G以上)定制后得到的显卡,以实现优化压缩后一定的大模型计算需求。
可选的,可以对专用硬盘中的大模型进行优化压缩使其能在显卡的协助下实现秒级(如5秒)内的推理/查询响应速度,以及短时间内(如72小时内)的训练速度,形成服务器专属AI大模型。定制设计无高端显卡/RTX3090ti,A40,RX6090xt(或华为昇腾Atlas对应显卡)可以分别对应优化压缩后的6B、13B、70B的大模型规模。
可选的,可以采用INT4或INT8方法对大模型进行优化压缩,使其能在本地显卡级别的设备上实现秒级的响应效率。其中INT4压缩优化可以用于设备计算能力较弱时,比如无专业显卡或者3090ti,而INT8则用于计算能力稍强时。
需要说明的是,本发明通过对大语言模型进行优化压缩,使其适合单服务器部署,用不同级别显卡满足不同级别的AI计算需求,实现秒级查询响应速度,并满足大部分场景的性能需要。
可选的,在服务器在采用专用硬盘进行数据处理的过程中,可以通过调用本机密码芯片API,进行密码计算,还可以调用本机显卡API,进行大模型计算。
需要说明的是,本发明通过对大语言模型面向通用密码计算与应用需求进行预训练、预配置,使其成为了一体化智能密码设备,从而更方便地支撑智能化的先进密码应用与产品开发。
需要说明的是,本发明中提供的单节点服务器为一种新型的服务器结构,可以把密码计算、低成本可用性能的AI大模型计算、与通用计算以及相关的预制数据与模型集成到同一个设备上,形成一种面向一系列软硬一体化密码安全产品智能化改造,同时去除密码机与密码卡、并且能把密码并行与AI大模型并行计算有机融合的新型通用基础设施。
S102、根据大模型计算任务的数量,确定对大模型计算任务的执行策略。
其中,大模型计算任务的数量可以为至少一个。执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务。
需要说明的是,本机服务器可以是服务器集群中的任一服务器,相应的,根据执行策略,本机服务器可以自身加入大模型计算任务的处理,也可以通知服务器集群中的其他服务器执行大模型计算任务,本发明对此不做限制。
可选的,本机服务器可以基于预设的时间间隔统计接收到的大模型计算任务的数量,并根据任务数量与预设数量阈值的关系确定对大模型计算任务的执行策略。
可选的,根据大模型计算任务的数量,确定对大模型计算任务的执行策略,包括:若检测到单个大模型计算任务,则确定对大模型计算任务的执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器串行执行任务;若大模型计算任务的数量为至少两个,则确定对大模型计算任务的执行策略为采用服务器集群中的至少两个服务器并行执行任务。
需要说明的是,本发明中,负载均衡设备并不做对应分层的子任务的划分,而是将整个任务分发给服务器节点,分层子任务的划分、分发工作由接收负载均衡服务器任务的服务器节点实现,各分发任务的执行结果均需汇总到该服务器节点,由该节点将任务的最终执行结果返回给上层应用。
可选的,若检测到单个大模型计算任务,则可以根据服务器集群的配置信息,确定本机服务器所属服务器集群中包含的候选服务器,进一步根据服务器集群中各候选服务器的负载情况,确定负载最少的服务器中大模型各个分层是否处于空闲状态,若是,则确定执行策略为采用服务器集群中的单个服务器执行任务,否则,采用多个服务器组合的方式执行任务,即采用服务器集群中的至少两个服务器串行执行任务。
需要说明的是,通过多个服务器组合执行单个计算任务,可以使得每个计算任务分散使用服务器集群中多个单节点服务器的能力,从而可以更充分的使用集群的显卡进行计算,提高计算任务的处理效率。
S103、根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。
其中,调用的服务器可以包含本机服务器,也可以不包含本机服务器,即通过本机服务器指示服务器集群中的其他服务器执行大模型计算任务。
可选的,若确定对大模型计算任务的执行策略为采用服务器集群中的单个服务器执行任务,则可以确定本机服务器的各个分层的工作状态是否为空闲状态,若是,则确定采用本机服务器执行任务,根据本机服务器各个分层的执行情况,生成执行结果,以对大模型计算请求进行响应。
具体的,可以根据本机服务器中大模型的分层情况,将大模型计算任务划分为至少两个子任务,并将至少两个子任务分发至本地大模型的各个分层;控制本机服务器的各分层调用预设本机显卡API进行计算处理,并整合各分层的计算结果,以对大模型计算需求进行响应。
可选的,若存在本机服务器的分层的工作状态为占用状态,则可以根据服务器集群的配置信息和服务器集群中各候选服务器的负载情况,将大模型计算任务发送至负载最少且各分层为空闲状态的候选服务器,以指示该候选服务器执行任务,即根据执行策略调用一个服务器中的大模型执行大模型计算任务,并根据该候选服务器的反馈信息,对大模型计算请求进行响应。
可选的,根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,包括:若执行策略为采用服务器集群中的至少两个服务器串行执行任务,则根据服务器集群的配置信息和服务器集群中各候选服务器的负载情况,从服务器集群中确定第一目标服务器;根据第一目标服务器的数量,将各大模型计算任务划分为至少两个子任务并下发至各第一目标服务器;控制本机服务器和第一目标服务器采用各自大模型的不同分层执行不同子任务,以实现串行的计算任务执行。
其中,第一目标服务器是指服务器集群中针对单个大模型计算任务目标通过串行的方式执行任务的服务器。第一目标服务器可以包含本机服务器也可以不包含,本发明对此不做限制。第一目标服务器的数量和划分的子任务的数量相同。
可选的,确定第一目标服务器之后,可以根据各第一目标服务器的负载情况,确定负载优先级,以将各子任务优先发送至负载较少的第一目标服务器。
可选的,控制本机服务器和第一目标服务器采用各自大模型的不同分层执行不同子任务,以实现串行的计算任务执行,包括:控制本机服务器或第一目标服务器的第一分层执行第一子任务;指示下一个第一目标服务器接收第一子任务的执行结果并采用其本地大模型的第二分层执行第二子任务;直到所有子任务均被执行完毕;反馈大模型计算任务的最终执行结果,以实现本机服务器和第一目标服务器串行执行计算任务。
示例性的,若将大模型计算任务分为子任务1和子任务2,则可以采用服务器1的分层1对子任务1进行计算,进一步采用服务器2的分层2对子任务2进行计算,直到完成任务计算并反馈结果。
可选的,所有子任务均被执行完毕之后,可以根据各子任务的执行结果,生成对大模型计算任务的最终执行结果,以实现本机服务器和第一目标服务器串行执行计算任务。
本发明实施例的技术方案,响应于大模型计算请求,获取大模型计算任务;根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。通过利用服务器集群中的单个服务器或多个服务器,针对性地对大模型计算任务进行处理,可以有效提高数据处理的效率。
需要说明的是,在服务器集群实际业务处理的过程中,部分业务会同时用到大模型和密码运算,如密码监管业务、数据分类分级任务、电子签章以及密评方案生成业务,在相关技术中,通常会采用专用的密码机与密码卡来满足服务器的密码计算请求,具体的,对非云计算环境,一种情况是将给通用的服务器配置专门的密码卡以支撑密码计算;另一种情况是通用服务器后面连接专用的密码机以支撑密码计算;对于云计算环境,一般采用在云计算物理环境中加装部署密码机设备集群,然后再在云计算环境中部署云密码服务管理平台软件环境的方法来实现,上述方式既不能满足数据隐私与私有化部署的需求,不能满足海量密码并行计算的需求,也造成了相关设备资源的浪费。
针对上述问题,本发明的技术方案为提供了一种新型的服务器,通过在服务器集群的每个服务器的本地同时部署密码芯片、具有大模型的专属磁盘以及提高大模型所需算力的显卡,使得服务器集群不但可以通过单节点服务器或多服务器组合的方式进行高效的大模型计算,还可以在相关数据存在密码运算处理需求时,直接调用本地的密码芯片进行密码运算。尤其在多密码相关业务并行执行的情境下,多个大模型计算任务和多个密码运算任务均可在每个服务器内部并行计算,,即保证了数据的隐私安全又提升了数据处理效率。
具体的,在数据分类分级任务中,可以先执行大模型计算任务,确定数据的类别或级别,若目标数据的类别或级别为预设级别范围,则可以自动生成针对该目标数据的密码计算需求,调用服务器内的密码芯片实现对大模型处理后的数据执行加密存储的处理,并将处理后的数据进行加密传输、反馈,以保证数据的安全性,实现智能精准加密。在根据应用功能描述语段自动生成密评方案的业务场景下,也可以先执行大模型计算任务得到密评方案,进一步按照方案生成密码计算需求,执行密码运算。
具体的,服务器集群中各服务器执行密码计算过程可以包括:响应于密码计算需求,获取密码计算任务;根据本机服务器中大模型的分层情况,将密码计算任务划分为至少两个子任务,并将至少两个子任务分发至大模型的各个分层;控制本机服务器的各分层调用预设密码芯片API进行计算处理,并整合各分层的计算结果,以对密码计算需求进行响应。
其中,预设密码芯片API(Application Programming Interface,应用程序编程接口)是指调用服务器本地的密码芯片的接口。服务器通过预设密码芯片API调用本地的密码芯片,可以使得各个分层的密码计算需求都直接在部署服务器上本地化地完成,满足了数据私有化部署的需求。
可选的,响应于密码计算需求,本机服务器可以获取预设负载均衡设备发送的密码计算任务,也可以获取服务器集群执行大模型计算任务之后发送的需要进行密码计算的数据,生成密码计算任务。
可选的,在服务器的每个分层进行密码计算时,可以调用本机密码芯片API,从分层所在的本机服务器直接获取所需密码,从而保障安全性并提高数据处理效率。
需要说明的是,大多数情况下,单个密码计算任务在服务器集群的一个服务器上就能完成计算,但也可以通过多个服务器串行执行任务,在检测到至少两个密码计算任务时,还可以采用大模型计算类似的方式,通过至少两个服务器执行任务,在此不进行赘述。
需要说明的是,可以采用服务器的专用硬盘,利用私有数据预先进行的大模型的预训练或预配置,使得后续响应于大模型计算请求时,可以直接调用训练好的大模型进行密评方案的生成或数据分类分级结果的生成等处理。具体的,大模型的预训练过程可以包括:根据应用描述语段与密评方案的对应关系,以及行业数据样本和数据分类分级结果的对应关系,确定问答训练对;根据问答训练对,进行服务器中大模型的预训练。
其中,应用描述语段是指对应用相关信息的描述语段,具体可以包括应用的功能描述、应用的技术架构描述(包括开发语言架构、技术组件及结构的语言描述)以及应用的数据描述(包括数据库数据与传输的数据结构,可以采用JSON、表格等各种结构及其用途描述)。行业数据样本例如可以是金融或医疗等行业领域的数据。
应用进行密评时,需要在其数据存储与传输流程中增加密码能力,比如存储时需要加密,数据传输时需要签名/签章等。密评方案就是指导应用进行密码改造的方案。
可选的,可以筛选出应用描述语段中的“现状”、“需求”、“开发方案”“接口描述”等信息,并基于预设的拼接格式进行格式化处理,生成对应的密评方案,将一个应用描述语段和对应生成的密评方案作为一个问答训练对,从而得到大模型的预训练的训练集。
可选的,应用描述语段的格式可以为PDF、WORD等格式;对于PPT与图片格式的描述语段,可以先采用OCR技术进行处理,再生成问答训练对;对于字数超过阈值的应用描述语段,可以先对其进行分块处理,再生成问答训练对。
可选的,可以基于行业标准规范对行业数据样本进行分类分级,确定行业数据样本和数据分类分级结果的对应关系,生成问答训练对,以进行服务器中大模型的预训练。
本发明通过将一些典型的成型方案拆解标注形成适合训练数据预训练、预配置的大模型,从而使大模型根据一个典型应用的特性与参数就可以自动生成对应的密评方案,提高了后续进行大模型计算任务处理的效率和准确性。
实施例二
图2是本发明实施例二提供的一种数据处理方法的流程图;本实施例在上述实施例的基础上,进一步对“若执行策略为采用服务器集群中的至少两个服务器并行执行任务,则调用至少一个服务器中的大模型执行计算任务”的具体过程进行详细描述,该数据处理方法包括:
S201、响应于大模型计算请求,获取大模型计算任务。
S202、根据大模型计算任务的数量,确定对大模型计算任务的执行策略。
S203、若执行策略为采用服务器集群中的至少两个服务器并行执行任务,则根据服务器集群的配置信息和服务器集群中各候选服务器的负载情况,从服务器集群中确定第二目标服务器。
其中,第二目标服务器是指服务器集群中针对多个大模型计算任务目标通过并行的方式执行任务的服务器。第二目标服务器可以包含本机服务器也可以不包含,本发明对此不做限制。
可选的,若检测到至少两个大模型计算任务,则可以根据服务器集群的配置信息,确定本机服务器所属服务器集群中包含的候选服务器,进一步根据服务器集群中各候选服务器的负载情况,确定各候选服务器的负载优先级,并根据各候选服务器的负载优先级,将服务器集群中负载优先级满足预设优先级要求的服务器确定为第二目标服务器。
S204、根据第二目标服务器的数量和大模型计算任务的数量,分别将各大模型计算任务划分为至少两个子任务下发至各第二目标服务器。
其中,第二目标服务器的数量和大模型计算任务的数量可以相同也可以不同。
可选的,若第二目标服务器的数量大于大模型计算任务的数量,则可以根据大模型计算任务的数量对大模型计算任务进行划分,得到至少两个子任务下发至各第二目标服务器;若第二目标服务器的数量小于大模型计算任务的数量,则可以根据第二目标服务器的数量对大模型计算任务进行划分,得到至少两个子任务下发至各第二目标服务器。
S205、控制本机服务器和第二目标服务器采用各自大模型的不同分层同时执行不同子任务,以实现并行计算任务的执行,并对大模型计算请求进行响应。
可选的,控制本机服务器和第二目标服务器采用各自大模型的不同分层同时执行不同子任务,以实现并行计算任务的执行,包括:按照大模型分层将N个大模型计算任务进行拆分;将待第一分层执行的大模型计算任务发送给第一批N个第二目标服务器,利用其本地大模型的第一分层同步执行N个第一子任务;指示第二批N个第二目标服务器分别接收N个第一子任务的执行结果,基于其本地大模型的第二分层同步执行N个第二子任务,直到所有子任务均被执行完毕;各子任务的最终执行结果即为N个大模型计算任务的执行结果,以实现并行计算任务的执行。其中,N可以为大于等于2的自然数。
示例性的,若大模型计算任务包括第一大模型计算任务和第二大模型计算任务,第一大模型计算任务划分为第三子任务和第四子任务,第二大模型计算任务划分为第五子任务和第六子任务;则相应的,控制本机服务器和第二目标服务器采用各自大模型的不同分层同时执行不同子任务,以实现并行的计算任务执行,包括:
控制本机服务器中大模型的第一分层执行第一大模型计算任务的第三子任务;同时指示第二目标服务器中大模型的第一分层执行第二大模型计算任务的第五子任务;之后,指示本地服务器和第二目标服务器或根据负载均衡情况指示其他2个目标服务器分别接收第三子任务和第五子任务的执行结果,并利用各自的大模型的第二分层分别计算第四子任务和第六子任务,根据第四子任务和第六子任务的执行结果,生成第二大模型任务的最终执行结果,并将最终执行结果通过本机服务器反馈给上层应用,从而实现多个总任务及多个子任务并行执行的效果,通过本申请提供的服务器及集群实现资源的高效利用。
或者,若待执行的大模型计算子任务为:子3,子4,子5和子6,那么调用目标服务器1的分层1执行子3的同时可以采用分层2执行子6,目标服务器2的分层1执行子5的同时可以采用分层2执行子4,实现大模型的不同分层同时执行不同子任务。
本发明的技术方案,可以使得服务器1的分层1,同时对总任务1的子任务1,和总任务2的子任务2进行处理,大幅提高服务器分层的利用率和数据处理的效率,实现对大规模的计算与数据需求,通过该服务器设备级成集群的方式来满足,从而能支撑当前大企业、大组织的“密码+AI”计算与应用需求。
本发明的技术方案,对于多个大模型计算任务的情况,采用服务器集群中的至少两个服务器并行执行任务,可以有效利用各个服务器中的独立分层,在保证数据准确性的情况下,有效提高任务的处理效率。
需要说明的是,本申请实施例以大模型分层数量为2层为例,实际应用中大模型分层数量一般多于2层。
实施例三
图3是本发明实施例三提供的一种数据处理装置的结构框图;本实施例可适用于根本机服务器响应于大模型计算请求采用单个服务器或多个服务器执行计算任务的情况,本发明实施例所提供的数据处理装置可执行本发明任一实施例所提供的数据处理方法,具备执行方法相应的功能模块和有益效果;该数据处理装置可以采用硬件和/或软件的形式实现,并配置于具有数据处理功能的设备中,如服务器中。
如图3所示,该数据处理装置具体包括:
获取模块301,用于响应于大模型计算请求,获取大模型计算任务;
确定模块302,用于根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;
执行模块303,用于根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。
本发明实施例的技术方案,响应于大模型计算请求,获取大模型计算任务;根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。通过利用服务器集群中的单个服务器或多个服务器,针对性地对大模型计算任务进行处理,可以有效提高数据处理的效率。
进一步的,其中,服务器集群中的各服务器均配置有具备密码计算能力的芯片、显卡以及专用硬盘;所述专用硬盘用于对大模型进行优化压缩以及对大模型进行预训练。
进一步的,确定模块302具体用于:
若检测到单个大模型计算任务,则确定对大模型计算任务的执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器串行执行任务;
若大模型计算任务的数量为至少两个,则确定对大模型计算任务的执行策略为采用服务器集群中的至少两个服务器并行执行任务。
进一步的,执行模块303可以包括:
第一确定单元,用于若执行策略为采用服务器集群中的至少两个服务器串行执行任务,则根据服务器集群的配置信息和服务器集群中各候选服务器的负载情况,从服务器集群中确定第一目标服务器;
第一下发单元,用于根据第一目标服务器的数量,将各大模型计算任务划分为至少两个子任务并下发至各第一目标服务器;
第一控制单元,用于控制本机服务器和第一目标服务器采用各自大模型的不同分层执行不同子任务,以实现串行的计算任务执行。
进一步的,控制单元具体用于:
控制本机服务器或第一目标服务器的第一分层执行第一子任务;指示下一个第一目标服务器接收第一子任务的执行结果并采用其本地大模型的第二分层执行第二子任务;直到所有子任务均被执行完毕;
反馈大模型计算任务的最终执行结果,以实现本机服务器和第一目标服务器串行执行计算任务。
进一步的,执行模块303可以包括:
第二确定单元,用于若执行策略为采用服务器集群中的至少两个服务器并行执行任务,则根据服务器集群的配置信息和服务器集群中各候选服务器的负载情况,从服务器集群中确定第二目标服务器;
第二下发单元,用于根据第二目标服务器的数量和大模型计算任务的数量,分别将各大模型计算任务划分为至少两个子任务下发至各第二目标服务器;
第二控制单元,用于控制本机服务器和第二目标服务器采用各自大模型的不同分层同时执行不同子任务,以实现并行计算任务的执行。
进一步的,第二控制单元具体用于:
按照大模型分层将N个大模型计算任务进行拆分;
将待第一分层执行的大模型计算任务发送给第一批N个第二目标服务器,利用其本地大模型的第一分层同步执行N个第一子任务;
指示第二批N个第二目标服务器分别接收N个第一子任务的执行结果,基于其本地大模型的第二分层同步执行N个第二子任务,直到所有子任务均被执行完毕;
各子任务的最终执行结果即为N个大模型计算任务的执行结果,以实现并行计算任务的执行。
进一步的,上述装置还用于:
响应于密码计算需求,获取密码计算任务;
根据本机服务器中大模型的分层情况,将密码计算任务划分为至少两个子任务,并将至少两个子任务分发至大模型的各个分层;
控制本机服务器的各分层调用预设密码芯片API进行计算处理,整合各分层的计算结果,以对密码计算需求进行响应。
进一步的,上述装置还用于:
根据应用描述语段与密评方案的对应关系,以及行业数据样本和数据分类分级结果的对应关系,确定问答训练对;
根据问答训练对,进行服务器中大模型的预训练。
实施例四
图4是本发明实施例四提供的电子设备的结构示意图;图4示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如数据处理方法。
在一些实施例中,数据处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (12)
1.一种数据处理方法,其特征在于,包括:
响应于大模型计算请求,获取大模型计算任务;
根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;
根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。
2.根据权利要求1所述的方法,其特征在于,其中,服务器集群中的各服务器均配置有具备密码计算能力的芯片、显卡以及专用硬盘;所述专用硬盘用于对大模型进行优化压缩以及对大模型进行预训练。
3.根据权利要求1所述的方法,其特征在于,根据大模型计算任务的数量,确定对大模型计算任务的执行策略,包括:
若检测到单个大模型计算任务,则确定对大模型计算任务的执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器串行执行任务;
若大模型计算任务的数量为至少两个,则确定对大模型计算任务的执行策略为采用服务器集群中的至少两个服务器并行执行任务。
4.根据权利要求3所述的方法,其特征在于,根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,包括:
若执行策略为采用服务器集群中的至少两个服务器串行执行任务,则根据服务器集群的配置信息和服务器集群中各候选服务器的负载情况,从服务器集群中确定第一目标服务器;
根据第一目标服务器的数量,将各大模型计算任务划分为至少两个子任务并下发至各第一目标服务器;
控制本机服务器和第一目标服务器采用各自大模型的不同分层执行不同子任务,以实现串行的计算任务执行。
5.根据权利要求4所述的方法,其特征在于,控制本机服务器和第一目标服务器采用各自大模型的不同分层执行不同子任务,以实现串行的计算任务执行,包括:
控制本机服务器或第一目标服务器的第一分层执行第一子任务;指示下一个第一目标服务器接收第一子任务的执行结果并采用其本地大模型的第二分层执行第二子任务;直到所有子任务均被执行完毕;
反馈大模型计算任务的最终执行结果,以实现本机服务器和第一目标服务器串行执行计算任务。
6.根据权利要求3所述的方法,其特征在于,根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,包括:
若执行策略为采用服务器集群中的至少两个服务器并行执行任务,则根据服务器集群的配置信息和服务器集群中各候选服务器的负载情况,从服务器集群中确定第二目标服务器;
根据第二目标服务器的数量和大模型计算任务的数量,分别将各大模型计算任务划分为至少两个子任务下发至各第二目标服务器;
控制本机服务器和第二目标服务器采用各自大模型的不同分层同时执行不同子任务,以实现并行计算任务的执行。
7.根据权利要求6所述的方法,其特征在于,控制本机服务器和第二目标服务器采用各自大模型的不同分层同时执行不同子任务,以实现并行计算任务的执行,包括:
按照大模型分层将N个大模型计算任务进行拆分;
将待第一分层执行的大模型计算任务发送给第一批N个第二目标服务器,利用其本地大模型的第一分层同步执行N个第一子任务;
指示第二批N个第二目标服务器接收N个第一子任务的执行结果,基于其本地大模型的第二分层同步执行N个第二子任务,直到所有子任务均被执行完毕;
各子任务的最终执行结果即为N个大模型计算任务的执行结果,以实现并行计算任务的执行。
8.根据权利要求1所述的方法,其特征在于,还包括:
响应于密码计算需求,获取密码计算任务;
根据本机服务器中大模型的分层情况,将密码计算任务划分为至少两个子任务,并将至少两个子任务分发至大模型的各个分层;
控制本机服务器的各分层调用预设密码芯片API进行计算处理,整合各分层的计算结果,以对密码计算需求进行响应。
9.根据权利要求1所述的方法,其特征在于,还包括:
根据应用描述语段与密评方案的对应关系,以及行业数据样本和数据分类分级结果的对应关系,确定问答训练对;
根据问答训练对,进行服务器中大模型的预训练。
10.一种数据处理装置,其特征在于,包括:
获取模块,用于响应于大模型计算请求,获取大模型计算任务;
确定模块,用于根据大模型计算任务的数量,确定对大模型计算任务的执行策略;所述执行策略为采用服务器集群中的单个服务器执行任务,或采用服务器集群中的至少两个服务器执行任务;
执行模块,用于根据执行策略调用至少一个服务器中的大模型执行大模型计算任务,以对大模型计算请求进行响应。
11.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的数据处理方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-9中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410021649.5A CN117519996B (zh) | 2024-01-08 | 2024-01-08 | 一种数据处理方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410021649.5A CN117519996B (zh) | 2024-01-08 | 2024-01-08 | 一种数据处理方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117519996A true CN117519996A (zh) | 2024-02-06 |
CN117519996B CN117519996B (zh) | 2024-03-15 |
Family
ID=89749829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410021649.5A Active CN117519996B (zh) | 2024-01-08 | 2024-01-08 | 一种数据处理方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117519996B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114127741A (zh) * | 2019-07-15 | 2022-03-01 | 微软技术许可有限责任公司 | 用于人工智能建模的动态多层执行 |
CN115248728A (zh) * | 2022-09-21 | 2022-10-28 | 之江实验室 | 面向智能计算的分布式训练任务调度方法、系统和装置 |
CN116594748A (zh) * | 2023-05-19 | 2023-08-15 | 航天宏图信息技术股份有限公司 | 针对任务的模型定制处理方法、装置、设备和介质 |
CN116880995A (zh) * | 2023-09-08 | 2023-10-13 | 之江实验室 | 一种模型任务的执行方法、装置、存储介质及电子设备 |
-
2024
- 2024-01-08 CN CN202410021649.5A patent/CN117519996B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114127741A (zh) * | 2019-07-15 | 2022-03-01 | 微软技术许可有限责任公司 | 用于人工智能建模的动态多层执行 |
CN115248728A (zh) * | 2022-09-21 | 2022-10-28 | 之江实验室 | 面向智能计算的分布式训练任务调度方法、系统和装置 |
CN116594748A (zh) * | 2023-05-19 | 2023-08-15 | 航天宏图信息技术股份有限公司 | 针对任务的模型定制处理方法、装置、设备和介质 |
CN116880995A (zh) * | 2023-09-08 | 2023-10-13 | 之江实验室 | 一种模型任务的执行方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117519996B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009486B (zh) | 一种欺诈检测的方法、系统、设备及计算机可读存储介质 | |
US11423307B2 (en) | Taxonomy construction via graph-based cross-domain knowledge transfer | |
CN114416352A (zh) | 算力资源分配方法、装置、电子设备及储存介质 | |
CN116032663B (zh) | 基于边缘设备的隐私数据处理系统、方法、设备及介质 | |
CN110689136B (zh) | 一种深度学习模型获得方法、装置、设备及存储介质 | |
CN114792359B (zh) | 渲染网络训练和虚拟对象渲染方法、装置、设备及介质 | |
CN112395390B (zh) | 意图识别模型的训练语料生成方法及其相关设备 | |
JP7270691B2 (ja) | データをラベリングするための方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
US20220374219A1 (en) | Deployment of service | |
JP2022136234A (ja) | 連合学習方法及び装置、電子機器、記憶媒体ならびにコンピュータプログラム | |
CN114462577A (zh) | 一种联邦学习系统、方法、计算机设备及存储介质 | |
CN113139660A (zh) | 模型推理方法、装置、电子设备及存储介质 | |
CN113627536A (zh) | 模型训练、视频分类方法,装置,设备以及存储介质 | |
CN115373861A (zh) | Gpu资源调度方法、装置、电子设备及存储介质 | |
CN110750295B (zh) | 一种信息处理方法,装置,电子设备和存储介质 | |
CN109840597A (zh) | 一种模型预测方法、装置、电子设备及存储介质 | |
CN116932147A (zh) | 流式作业处理方法、装置、电子设备及介质 | |
CN117519996B (zh) | 一种数据处理方法、装置、设备以及存储介质 | |
CN116662509A (zh) | 大规模语言模型的开放域问答实现方法、装置及设备 | |
CN114331446B (zh) | 区块链的链外服务实现方法、装置、设备和介质 | |
CN117396865A (zh) | 增强移动设备中的验证 | |
CN111709784B (zh) | 用于生成用户留存时间的方法、装置、设备和介质 | |
CN114565105A (zh) | 处理数据的方法和深度学习模型的训练方法、装置 | |
CN114841267A (zh) | 实时预测方法、装置、电子设备及计算机程序产品 | |
CN115599533A (zh) | 任务处理方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |