CN111783630B - 一种数据处理方法、装置及设备 - Google Patents
一种数据处理方法、装置及设备 Download PDFInfo
- Publication number
- CN111783630B CN111783630B CN202010610046.0A CN202010610046A CN111783630B CN 111783630 B CN111783630 B CN 111783630B CN 202010610046 A CN202010610046 A CN 202010610046A CN 111783630 B CN111783630 B CN 111783630B
- Authority
- CN
- China
- Prior art keywords
- baseline model
- target
- initial
- edge server
- central server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 230000004927 fusion Effects 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000012549 training Methods 0.000 claims description 51
- 238000012546 transfer Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 33
- 238000006243 chemical reaction Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 22
- 230000006835 compression Effects 0.000 claims description 12
- 238000007906 compression Methods 0.000 claims description 12
- 230000006837 decompression Effects 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 5
- 238000013528 artificial neural network Methods 0.000 description 46
- 238000010586 diagram Methods 0.000 description 19
- 238000013473 artificial intelligence Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 238000012360 testing method Methods 0.000 description 17
- 238000010801 machine learning Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 7
- 238000011176 pooling Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000013478 data encryption standard Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioethics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Debugging And Monitoring (AREA)
- Telephonic Communication Services (AREA)
- Computer And Data Communications (AREA)
Abstract
本申请提供一种数据处理方法、装置及设备,该方法包括:中心服务器将初始基线模型发送给边缘服务器;边缘服务器通过场景数据对初始基线模型进行训练,得到目标基线模型,并确定是否部署目标基线模型;若否,则边缘服务器将所述目标基线模型发送给中心服务器;所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型。通过本申请的技术方案,可以得到性能较好的目标基线模型,目标基线模型的智能分析结果的准确度较高。
Description
技术领域
本申请涉及人工智能领域,尤其涉及一种数据处理方法、装置及设备。
背景技术
机器学习是实现人工智能的一种途径,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习用于研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习更加注重算法设计,使计算机能够自动地从数据中学习规律,并利用规律对未知数据进行预测。
机器学习已经有了十分广泛的应用,如深度学习、数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用等。
在智能交通领域,中心服务器可以将车牌图像作为样本数据,通过车牌图像训练用于实现车牌识别的机器学习模型。然而,实际应用中,边缘服务器在获取到车牌图像后,由于车牌图像属于隐私数据,基于对隐私数据的保护需求,边缘服务器不会将车牌图像发送给中心服务器,导致中心服务器无法通过边缘服务器的车牌图像训练机器学习模型,即机器学习模型无法匹配边缘服务器所处环境,在将机器学习模型部署到边缘服务器后,机器学习模型的性能较低。
发明内容
本申请提供一种数据处理方法,所述方法包括:
中心服务器将初始基线模型发送给边缘服务器;
所述边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
若否,则所述边缘服务器将所述目标基线模型发送给所述中心服务器;
所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作。
本申请提供一种数据处理方法,应用于边缘服务器,包括:
从中心服务器获取初始基线模型;
通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
若否,则将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述融合基线模型重新获取初始基线模型。
本申请提供一种数据处理方法,应用于中心服务器,包括:
将初始基线模型发送给边缘服务器,以使所述边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;
从所述边缘服务器获取所述目标基线模型;
基于所述目标基线模型和所述初始基线模型生成融合基线模型;
对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作。
本申请提供一种数据处理装置,应用于边缘服务器,包括:
获取模块,用于从中心服务器获取初始基线模型;
训练模块,用于通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
发送模块,用于在不部署所述目标基线模型时,将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述融合基线模型重新获取初始基线模型。
本申请提供一种数据处理装置,应用于中心服务器,包括:
发送模块,用于将初始基线模型发送给边缘服务器,以使边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;
获取模块,用于从所述边缘服务器获取所述目标基线模型;
生成模块,用于基于所述目标基线模型和所述初始基线模型生成融合基线模型;对融合基线模型进行训练,将训练后的基线模型确定为初始基线模型。
本申请提供一种边缘服务器,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;
所述处理器用于执行机器可执行指令,以实现如下的步骤:
从中心服务器获取初始基线模型;
通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
若否,则将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述融合基线模型重新获取初始基线模型。
本申请提供一种中心服务器,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;
所述处理器用于执行机器可执行指令,以实现如下的步骤:
将初始基线模型发送给边缘服务器,以使所述边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;
从所述边缘服务器获取所述目标基线模型;
基于所述目标基线模型和所述初始基线模型生成融合基线模型;
对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作。
由以上技术方案可见,本申请实施例中,边缘服务器可以从中心服务器获取初始基线模型,通过场景数据对初始基线模型进行训练,得到目标基线模型,将目标基线模型发送给中心服务器,中心服务器基于目标基线模型和初始基线模型生成融合基线模型,对融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,将初始基线模型发送给边缘服务器,以此类推。由于上述过程可循环执行,因此,不断升级初始基线模型和目标基线模型的性能,持续提升初始基线模型和目标基线模型的识别能力,使得目标基线模型达到预期性能,达到高精度的识别能力。经过多次迭代过程,边缘服务器可以得到性能较好的目标基线模型,目标基线模型能够匹配边缘服务器所处环境,智能分析结果的准确度较高。在上述过程中,边缘服务器向中心服务器发送的是目标基线模型,而不是边缘服务器的场景数据(如车牌图像),从而对场景数据进行隐私保护,不会将场景数据发送给中心服务器,从而实现去隐私的数据保护功能,避免将具有隐私性的车牌图像发送给中心服务器。由于目标基线模型是基于场景数据训练的,因此,能够将场景数据的信息体现到初始基线模型和目标基线模型。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1是本申请一种实施方式中的系统结构示意图;
图2是本申请一种实施方式中的数据处理方法的流程示意图;
图3是本申请一种实施方式中的基线模型的结构示意图;
图4是本申请另一种实施方式中的数据处理方法的流程示意图;
图5是本申请另一种实施方式中的数据处理方法的流程示意图;
图6A和图6B是本申请一种实施方式中的数据处理装置的结构示意图;
图7A是本申请一种实施方式中的边缘服务器的硬件结构图;
图7B是本申请一种实施方式中的中心服务器的硬件结构图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在介绍本申请的技术方案之前,先介绍与本申请实施例有关的概念。
机器学习:机器学习是实现人工智能的一种途径,用于研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能。深度学习属于机器学习的子类,是一种使用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。神经网络是深度学习的实现方式,为了方便描述,本文以神经网络为例,介绍神经网络的结构和功能,对于机器学习的其它子类,与神经网络的结构和功能类似。
神经网络:神经网络可以包括但不限于卷积神经网络(简称CNN)、循环神经网络(简称RNN)、全连接网络等,神经网络的结构单元可以包括但不限于卷积层(Conv)、池化层(Pool)、激励层、全连接层(FC)等,对此不做限制。
在实际应用中,可以根据不同需求,将一个或多个卷积层,一个或多个池化层,一个或多个激励层,以及一个或多个全连接层进行组合构建神经网络。
在卷积层中,通过使用卷积核对输入数据特征进行卷积运算,使输入数据特征增强,该卷积核可以是m*n大小的矩阵,卷积层的输入数据特征与卷积核进行卷积,可以得到卷积层的输出数据特征,卷积运算实际是一个滤波过程。
在池化层中,通过对输入数据特征(如卷积层的输出)进行取最大值、取最小值、取平均值等操作,从而利用局部相关性的原理,对输入数据特征进行子抽样,减少处理量,并保持特征不变性,池化层运算实际是一个降采样过程。
在激励层中,可以使用激活函数(如非线性函数)对输入数据特征进行映射,从而引入非线性因素,使得神经网络通过非线性的组合增强表达能力。该激活函数可以包括但不限于ReLU(Rectified Linear Units,整流线性单元)函数,该ReLU函数用于将小于0的特征置0,而大于0的特征保持不变。
在全连接层中,用于将输入给本全连接层的所有数据特征进行全连接处理,从而得到一个特征向量,且该特征向量中可以包括多个数据特征。
神经网络(如卷积神经网络)的基线模型:在神经网络的训练过程中,可以利用样本数据训练神经网络内各神经网络参数,如卷积层参数(如卷积核参数)、池化层参数、激励层参数、全连接层参数等,对此不做限制。通过训练神经网络内各神经网络参数,可以使神经网络拟合出输入和输出的映射关系。
在神经网络训练完成后,已经完成训练的神经网络就是神经网络的基线模型,本文简称为基线模型,可以基于该基线模型实现人工智能处理,如人脸检测、人体检测、车辆检测、车牌识别等人工智能处理。例如,针对车牌识别的应用场景来说,可以将包括车牌的图像(即车牌图像)输入给基线模型,由基线模型对该图像进行人工智能处理,而人工智能处理结果就是车牌识别结果。
样本数据和场景数据:在人工智能场景中,可以部署中心服务器和边缘服务器,中心服务器获取到用于训练基线模型的数据,并基于这些数据训练基线模型,将中心服务器使用的用于训练基线模型的数据称为样本数据。边缘服务器获取到用于训练基线模型的数据(不会发送给中心服务器),并基于这些数据训练基线模型,将边缘服务器使用的用于训练基线模型的数据称为场景数据。
示例性的,样本数据可以是图像数据,也可以是其它类型的数据,对此不做限制。场景数据可以是图像数据,也可以是其它类型的数据,对此不做限制。
示例性的,当人工智能场景是智能交通领域的人工智能场景时,上述基线模型可以是用于实现车牌识别的基线模型。在此基础上,样本数据可以是中心服务器获取到的用于训练基线模型的车牌图像(即包括车牌信息的图像),中心服务器可以基于车牌图像训练基线模型,当然,车牌图像只是样本数据的示例,对此不做限制。场景数据可以是边缘服务器获取到的用于训练基线模型的车牌图像,该车牌图像不会发送给中心服务器,边缘服务器可以基于车牌图像训练基线模型,当然,车牌图像只是场景数据的示例,对此不做限制。
综上所述,由于边缘服务器不会将场景数据发送给中心服务器,导致中心服务器无法通过边缘服务器的场景数据训练基线模型,即基线模型无法匹配边缘服务器所处环境,将基线模型部署到边缘服务器后,基线模型的性能较低。
针对上述发现,本申请实施例中,在将基线模型部署到边缘服务器后,边缘服务器可以利用自身所处环境的场景数据对基线模型进行训练,得到新基线模型。由于是利用边缘服务器所处环境的场景数据对基线模型进行训练,因此,新基线模型能够匹配边缘服务器所处环境,新基线模型的性能较好。
以下结合具体实施例,对本申请实施例的技术方案进行说明。
参见图1所示,为本申请实施例的系统结构示意图,可以包括中心服务器110和边缘服务器120,与中心服务器110连接的第一中转设备130,与边缘服务器120连接的第二中转设备140,第一中转设备130与第二中转设备140通过网络连接。边缘服务器120的数量为至少一个,每个边缘服务器120连接一个第二中转设备140,即第二中转设备140的数量与边缘服务器120的数量相同。
可以将中心服务器110组成识别中心系统,将多个边缘服务器120组成识别端侧系统,将第一中转设备130和多个第二中转设备140组成去隐私系统。
中心服务器110为用于提供基线模型的服务平台,可以为多个边缘服务器120提供基线模型。边缘服务器120为具有基线模型需求的服务器,即,需要从中心服务器110获取基线模型,继而根据该基线模型实现人工智能处理。
第一中转设备130是与中心服务器110连接的网络设备(如路由器,交换机等),用于将中心服务器110发送的基线模型转发给边缘服务器120,将边缘服务器120发送的基线模型转发给中心服务器110。第二中转设备140是与边缘服务器120连接的网络设备,用于将中心服务器110发送的基线模型转发给边缘服务器120,将边缘服务器120发送的基线模型转发给中心服务器110。
本申请实施例中提出一种数据处理方法,参见图2所示,该方法包括:
步骤201,中心服务器将初始基线模型发送给边缘服务器。
示例性的,中心服务器可以获取大量样本数据,对此获取方式不做限制,针对每个样本数据来说,该样本数据具有标签信息,如实际类别和/或目标框等,对此标签信息不做限制。例如,针对车牌识别的应用场景来说,样本数据可以是车牌图像,目标框可以是车牌图像中某个矩形框的坐标信息(如矩形框的左上角坐标,矩形框的宽度和高度等),实际类别表示矩形框区域的车牌标识。
中心服务器根据样本数据和样本数据的标签信息对神经网络(如卷积神经网络)进行训练,得到基线模型,为了区分方便,将该基线模型称为初始基线模型。比如说,将大量样本数据及该样本数据对应的标签信息输入给神经网络,从而利用这些样本数据及标签信息对神经网络内的各神经网络参数进行训练,在神经网络训练完成后,已经完成训练的神经网络可以是初始基线模型。
在神经网络的训练过程中,将样本数据输入给神经网络后,可以得到与该样本数据对应的输出数据,该输出数据是特征向量,可以基于该特征向量确定神经网络是否已收敛。例如,根据该特征向量确定损失函数(可以根据经验进行配置)的损失值,并根据损失函数的损失值确定神经网络是否已收敛,例如,若该损失值小于预设阈值,则神经网络已收敛,否则,神经网络未收敛。
若神经网络已收敛,则完成训练过程,得到初始基线模型,若神经网络未收敛,则继续对神经网络内的各神经网络参数进行调整,得到调整后的神经网络,然后,可以将样本数据及该样本数据对应的标签信息输入给调整后的神经网络,继续对神经网络进行训练,以此类推,一直到神经网络已收敛。
在实际应用中,还可以采用其它方式确定神经网络是否已收敛,对此确定方式不做限制。例如,若迭代次数达到预设次数阈值,则确定神经网络已收敛;又例如,若迭代时长达到预设时长阈值,则确定神经网络已收敛。
中心服务器在得到初始基线模型后,可以将该初始基线模型发送给边缘服务器,在边缘服务器为多个时,可以将该初始基线模型发送给全部边缘服务器或部分边缘服务器,以下结合一个边缘服务器对此发送过程进行说明:
方式一、中心服务器将该初始基线模型发送给第一中转设备,由第一中转设备将该初始基线模型发送给第二中转设备,第二中转设备可以将该初始基线模型发送给边缘服务器,至此,成功将该初始基线模型发送给边缘服务器。
方式二、中心服务器将该初始基线模型发送给第一中转设备,第一中转设备对该初始基线模型进行第一转换操作,得到第一低维基线模型,将该第一低维基线模型发送给第二中转设备。第二中转设备对该第一低维基线模型进行第二转换操作,得到该初始基线模型,并将该初始基线模型发送给边缘服务器。
示例性的,第一转换操作可以为加密操作,第二转换操作为解密操作。或者,第一转换操作可以为压缩操作,第二转换操作为解压缩操作。或者,第一转换操作可以为加密操作和压缩操作,第二转换操作为解密操作和解压缩操作。当然,上述只是第一转换操作和第二转换操作的示例,对此不做限制。
在一种可能的实施方式中,第一中转设备接收到初始基线模型后,对初始基线模型进行压缩操作,从而将初始基线模型转换为第一低维基线模型,并将第一低维基线模型发送给第二中转设备。第二中转设备接收到第一低维基线模型后,对第一低维基线模型进行解压缩操作,得到解压缩后的初始基线模型。
由于在网络中传输的是经过压缩的第一低维基线模型,而不是未经压缩的初始基线模型,因此,可以减少传输的数据量,节省模型传输时间。
在一种可能的实施方式中,第一中转设备接收到初始基线模型后,对初始基线模型进行加密操作,从而将初始基线模型转换为第一低维基线模型,并将第一低维基线模型发送给第二中转设备。第二中转设备接收到第一低维基线模型后,对第一低维基线模型进行解密操作,得到解密后的初始基线模型。
由于在网络中传输的是经过加密的第一低维基线模型,而不是未经加密的初始基线模型,因此,可以保证模型安全,避免攻击者非法截获初始基线模型。
在一种可能的实施方式中,第一中转设备接收到初始基线模型后,对初始基线模型进行压缩操作,对压缩后的初始基线模型进行加密操作,从而将初始基线模型转换为第一低维基线模型,将第一低维基线模型发送给第二中转设备。第二中转设备接收到第一低维基线模型后,对第一低维基线模型进行解密操作,对解密后的第一低维基线模型进行解压缩操作,得到解压缩后的初始基线模型。
由于在网络中传输的是经过压缩和加密的第一低维基线模型,因此,可以减少传输的数据量,节省模型传输时间,避免攻击者非法截获初始基线模型。
在一种可能的实施方式中,第一中转设备接收到初始基线模型后,对初始基线模型进行加密操作,对加密后的初始基线模型进行压缩操作,从而将初始基线模型转换为第一低维基线模型,将第一低维基线模型发送给第二中转设备。第二中转设备接收到第一低维基线模型后,对第一低维基线模型进行解压缩操作,对解压缩后的第一低维基线模型进行解密操作,得到初始基线模型。
在上述实施例中,第一低维基线模型与初始基线模型相比,由于已经对初始基线模型进行加密和/或压缩,因此,初始基线模型可以理解为高维参数向量,而第一低维基线模型可以理解为低维参数向量,即参数的数量更少。
在上述实施例中,可以采用稀疏化算法对初始基线模型进行压缩,且采用稀疏化算法对第一低维基线模型进行解压缩,当然,稀疏化算法只是压缩算法的示例,对此不做限制,可以采用能够对初始基线模型进行压缩的任意算法。
在上述实施例中,可以采用密码算法对初始基线模型进行加密,且采用该密码算法对第一低维基线模型进行解密,该密码算法可以为任意类型的密码算法,对此密码算法不做限制,只要能够对初始基线模型进行加密即可。比如说,该密码算法可以是SM1(Security Manager,安全管理),SM2,SM3,SM4等国产商用密码算法,也可以是DES(DataEncryption Standard,数据加密标准),AES(Advanced Encryption Standard,高级加密标准),IDEA(International Data Encryption Algorithm,国际数据加密算法)等国际商用密码算法。
步骤202,边缘服务器通过边缘服务器的场景数据对该初始基线模型进行训练,得到目标基线模型,即经过训练的初始基线模型为目标基线模型。
示例性的,边缘服务器可以获取大量场景数据,该场景数据可以是边缘服务器所处环境的场景数据,对此获取方式不做限制。针对每个场景数据来说,该场景数据具有标签信息,如实际类别和/或目标框等,对此标签信息不做限制。
例如,针对车牌识别的应用场景来说,该场景数据可以是车牌图像,该目标框可以是车牌图像中某个矩形框的坐标信息(如矩形框的左上角坐标,矩形框的宽度和高度等),该实际类别可以表示矩形框区域的车牌标识。
边缘服务器根据场景数据和场景数据的标签信息对初始基线模型进行训练,得到训练后的基线模型,为了区分方便,将该基线模型称为目标基线模型。比如说,将大量场景数据及该场景数据对应的标签信息输入给初始基线模型,从而利用这些场景数据及标签信息对初始基线模型内的各神经网络参数进行训练,在神经网络训练完成后,已经完成训练的初始基线模型可以是目标基线模型。
在初始基线模型的训练过程中,将场景数据输入给初始基线模型后,可以得到与场景数据对应的输出数据,该输出数据是特征向量,基于该特征向量确定初始基线模型是否已收敛。例如,根据特征向量确定损失函数(根据经验配置)的损失值,并根据该损失值确定初始基线模型是否已收敛,例如,若该损失值小于预设阈值,则初始基线模型已收敛,否则,初始基线模型未收敛。
若初始基线模型已收敛,则完成训练过程,得到目标基线模型。若初始基线模型未收敛,则继续对初始基线模型内的各神经网络参数进行调整,得到调整后的初始基线模型,将场景数据及标签信息输入给调整后的初始基线模型,继续对初始基线模型进行训练,以此类推,一直到初始基线模型已收敛。
在实际应用中,还可以采用其它方式确定初始基线模型是否已收敛,对此不做限制。例如,若迭代次数达到预设次数阈值,则确定初始基线模型已收敛;又例如,若迭代时长达到预设时长阈值,则确定初始基线模型已收敛。
在上述实施例中,可以基于边缘服务器的场景数据对初始基线模型进行训练,得到目标基线模型。由于场景数据是边缘服务器所处环境的数据,且未将场景数据发送给中心服务器,即中心服务器未使用这些场景数据训练初始基线模型,因此,边缘服务器利用这些场景数据对初始基线模型进行训练,使得目标基线模型具有样本数据信息,且具有场景数据的新知识,提升模型性能。
步骤203,边缘服务器确定是否部署目标基线模型。示例性的,若部署目标基线模型,则执行步骤204,若不部署目标基线模型,则执行步骤205。
示例性的,若目标基线模型已经满足性能需求,则可以部署目标基线模型,若目标基线模型未满足性能需求,则可以不部署目标基线模型。
比如说,获取测试数据集合,该测试数据集合包括多个测试数据,每个测试数据对应有该测试数据的实际类别。针对测试数据集合中的每个测试数据,将该测试数据输入给目标基线模型,通过目标基线模型对该测试数据进行人工智能处理,得到人工智能处理结果,该人工智能处理结果是该测试数据的预测类别。若该测试数据的预测类别与该测试数据的实际类别一致,则表示目标基线模型对该测试数据的识别结果正确,若该测试数据的预测类别与该测试数据的实际类别不一致,则表示目标基线模型对该测试数据的识别结果错误。
在对每个测试数据进行上述处理后,可以得到识别结果正确的数量(记为a1)和识别结果错误的数量(记为a2),并根据识别结果正确的数量a1和识别结果错误的数量a2,确定目标基线模型的性能指标。比如说,性能指标可以为a1/(a1+a2),显然,性能指标越大,则表示目标基线模型的性能越好。
综上所述,若目标基线模型的性能指标大于预设阈值,则说明目标基线模型已经满足性能需求,部署目标基线模型。若目标基线模型的性能指标不大于预设阈值,则说明目标基线模型未满足性能需求,不部署目标基线模型。
当然,上述只是确定是否部署目标基线模型的示例,对此确定方式不做限制,比如说,若迭代次数(边缘服务器每次训练得到目标基线模型时,表示一次迭代,即迭代次数加1)达到预设次数阈值,则确定部署目标基线模型。又比如,在接收到用户指令时,基于用户指令确定是否部署目标基线模型。
步骤204,边缘服务器通过目标基线模型对应用数据进行处理。
示例性的,边缘服务器可以在本边缘服务器部署目标基线模型,边缘服务器在获取到应用数据后,可以将该应用数据输入给目标基线模型,以通过目标基线模型对该应用数据进行人工智能处理,得到人工智能处理结果。
示例性的,边缘服务器还可以将目标基线模型部署到终端设备,即由边缘服务器管理的终端设备,如模拟摄像机、IPC(网络摄像机)等,终端设备在获取到应用数据后,可以将该应用数据输入给目标基线模型,以通过目标基线模型对该应用数据进行人工智能处理,得到人工智能处理结果。
比如说,假设目标基线模型用于实现车牌识别,则应用数据为包括车牌的图像,将应用数据提供给目标基线模型后,由目标基线模型对应用数据进行人工智能处理,得到人工智能处理结果,该人工智能处理结果可以为车牌标识。
步骤205,边缘服务器将该目标基线模型发送给中心服务器。
边缘服务器在得到目标基线模型后,若确定不部署目标基线模型,则将该目标基线模型发送给中心服务器。若确定部署目标基线模型,可以将该目标基线模型发送给中心服务器,也可以不将该目标基线模型发送给中心服务器。
针对边缘服务器将该目标基线模型发送给中心服务器的过程,可以包括:
方式一、边缘服务器将该目标基线模型发送给第二中转设备,由第二中转设备将该目标基线模型发送给第一中转设备,第一中转设备可以将该目标基线模型发送给中心服务器,至此,成功将目标基线模型发送给中心服务器。
方式二、边缘服务器将该目标基线模型发送给第二中转设备,第二中转设备对该目标基线模型进行第一转换操作,得到第二低维基线模型,将该第二低维基线模型发送给第一中转设备。第一中转设备对该第二低维基线模型进行第二转换操作,得到该目标基线模型,并将该目标基线模型发送给中心服务器。
示例性的,第一转换操作可以为加密操作,第二转换操作为解密操作。或者,第一转换操作可以为压缩操作,第二转换操作为解压缩操作。或者,第一转换操作可以为加密操作和压缩操作,第二转换操作为解密操作和解压缩操作。当然,上述只是第一转换操作和第二转换操作的示例,对此不做限制。
在一种可能的实施方式中,第二中转设备对目标基线模型进行压缩操作,从而将目标基线模型转换为第二低维基线模型,将第二低维基线模型发送给第一中转设备。第一中转设备对第二低维基线模型进行解压缩操作,得到目标基线模型。或者,第二中转设备对目标基线模型进行加密操作,从而将目标基线模型转换为第二低维基线模型,将第二低维基线模型发送给第一中转设备。第一中转设备对第二低维基线模型进行解密操作,得到目标基线模型。或者,第二中转设备对目标基线模型进行压缩操作和加密操作,从而将目标基线模型转换为第二低维基线模型,将第二低维基线模型发送给第一中转设备。第一中转设备对第二低维基线模型进行解密操作和解压缩操作,得到目标基线模型。
步骤206,中心服务器基于目标基线模型和初始基线模型生成融合基线模型。
示例性的,中心服务器可以对至少一个边缘服务器的目标基线模型以及初始基线模型进行融合操作,得到融合基线模型;该融合操作可以包括但不限于以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作。
示例性的,目标基线模型和初始基线模型的网络结构相同,如均包括网络层1和网络层2,网络层1包括参数A和参数B,网络层2包括参数C和参数D。
假设中心服务器获取到目标基线模型1和目标基线模型2,初始基线模型中,参数A的取值为a11,参数B的取值为b11,参数C的取值为c11,参数D的取值为d11。目标基线模型1中,参数A的取值为a21,参数B的取值为b21,参数C的取值为c21,参数D的取值为d21。目标基线模型2中,参数A的取值为a31,参数B的取值为b31,参数C的取值为c31,参数D的取值为d31。
在此基础上,中心服务器可以对初始基线模型,目标基线模型1和目标基线模型2进行融合操作,得到融合基线模型,该融合基线模型可以包括网络层1和网络层2,网络层1包括参数A和参数B,网络层2包括参数C和参数D。
在融合基线模型中,参数A的取值为对a11,a21和a31进行融合操作得到的。比如说,参数A的取值为a11,a21和a31的平均值;或,参数A的取值为a11,a21和a31中的最大值;或,参数A的取值为a11,a21和a31中的最小值;或,参数A的取值为a11,a21和a31的加权值,如初始基线模型的权重(如2)大于目标基线模型的权重(如1)时,参数A的取值为(a11*2+a21*1+a31*1)/4,初始基线模型的权重(如1)小于目标基线模型的权重(如1)时,参数A的取值为(a11*1+a21*2+a31*2)/5。当然,上述只是几个示例,对此不做限制。
在融合基线模型中,参数B的取值为对b11,b21和b31进行融合操作得到的。比如说,参数B的取值为b11,b21和b31的平均值;或,参数B的取值为b11,b21和b31中的最大值;或,参数B的取值为b11,b21和b31中的最小值;或,参数B的取值为b11,b21和b31的加权值,对此不做限制。
在融合基线模型中,参数C的取值为对c11,c21和c31进行融合操作得到的。比如说,参数C的取值为c11,c21和c31的平均值;或,参数C的取值为c11,c21和c31中的最大值;或,参数C的取值为c11,c21和c31中的最小值;或,参数C的取值为c11,c21和c31的加权值,对此不做限制。
在融合基线模型中,参数D的取值为对d11,d21和d31进行融合操作得到的。比如说,参数D的取值为d11,d21和d31的平均值;或,参数D的取值为d11,d21和d31中的最大值;或,参数D的取值为d11,d21和d31中的最小值;或,参数D的取值为d11,d21和d31的加权值,对此不做限制。
步骤207,中心服务器对该融合基线模型进行训练,得到训练后的基线模型,将训练后的基线模型确定为初始基线模型,返回执行步骤201。
示例性的,在得到该融合基线模型后,中心服务器可以根据样本数据和样本数据的标签信息对该融合基线模型进行训练,得到训练后的基线模型,该训练过程可以参见步骤201,在此不再赘述。将训练后的基线模型确定为初始基线模型,返回执行步骤201,即将该初始基线模型发送给边缘服务器。
由以上技术方案可见,本申请实施例中,边缘服务器可以从中心服务器获取初始基线模型,通过场景数据对初始基线模型进行训练,得到目标基线模型,将目标基线模型发送给中心服务器,中心服务器基于目标基线模型和初始基线模型生成融合基线模型,对融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,将初始基线模型发送给边缘服务器,以此类推。由于上述过程可循环执行,因此,不断升级初始基线模型和目标基线模型的性能,持续提升初始基线模型和目标基线模型的识别能力,使得目标基线模型达到预期性能,达到高精度的识别能力。经过多次迭代过程,边缘服务器可以得到性能较好的目标基线模型,目标基线模型能够匹配边缘服务器所处环境,智能分析结果的准确度较高。在上述过程中,边缘服务器向中心服务器发送的是目标基线模型,而不是边缘服务器的场景数据(如车牌图像),从而对场景数据进行隐私保护,不会将场景数据发送给中心服务器。由于目标基线模型是基于场景数据训练的,因此,能够将场景数据的信息体现到初始基线模型和目标基线模型。
在一种可能的实施方式中,在智能交通领域,边缘服务器的场景数据可以为车牌图像,中心服务器的样本数据可以为车牌图像,目标基线模型用于对应用数据进行车牌识别处理,即识别出车牌图像中的车牌标识。在此应用场景下,本实施例中,提出去隐私的车牌识别方式,能够在不涉及用户隐私数据情况下达到良好的车牌识别能力,即不需要将隐私的车牌图像发送给中心服务器。
针对边缘服务器和中心服务器来说,基线模型的网络结构相同,中心服务器训练得到的初始基线模型与边缘服务器训练得到的目标基线模型的网络结构相同。参见图3所示,为基线模型的网络结构示意图,二者采用相同网络结构。
由于边缘服务器与中心服务器没有直接相连,因此,单个边缘服务器的问题不会直接影响中心服务器的运行,可以方便地增加或删除边缘服务器。
示例性的,边缘服务器也可以称为端侧服务器,边缘服务器由合法(满足当地法规)的地区支持商/代理维护,边缘服务器具有模型训练功能。中心服务器由识别系统服务提供商维护,中心服务器具有模型训练功能。边缘服务器可以从中心服务器获取到初始基线模型,取得较好的初步识别能力,并根据本地的车牌图像对初始基线模型进行训练,得到目标基线模型,使目标基线模型能够适配本边缘服务器。中心服务器可以获取边缘服务器发送的目标基线模型,完成目标基线模型与初始基线模型的融合,使得初始基线模型进一步升级,具备更强的泛化能力。
在上述应用场景下,本申请实施例中提出一种数据处理方法,该方法包括:
步骤S1,中心服务器根据样本数据训练得到初始基线模型。
步骤S2,中心服务器将该初始基线模型发送给第一中转设备。
步骤S3,第一中转设备对该初始基线模型进行第一转换操作,得到第一低维基线模型,将该第一低维基线模型发送给第二中转设备。
示例性的,当第二中转设备的数量为多个时,可以将该第一低维基线模型发送给每个第二中转设备,后续以一个第二中转设备为例进行说明。
步骤S4,第二中转设备对该第一低维基线模型进行第二转换操作,得到该初始基线模型,并将该初始基线模型发送给边缘服务器。
示例性的,针对每个第二中转设备来说,可以将该初始基线模型发送给与本第二中转设备连接的边缘服务器,即可以将该初始基线模型发送给多个边缘服务器,为了方便描述,后续以一个边缘服务器的处理过程为例。
步骤S5,边缘服务器通过边缘服务器的场景数据对该初始基线模型进行训练,得到目标基线模型,即经过训练的初始基线模型为目标基线模型。
步骤S6,边缘服务器确定是否部署目标基线模型。示例性的,若部署目标基线模型,则执行步骤S7,若不部署目标基线模型,则执行步骤S8。
步骤S7,边缘服务器通过目标基线模型对应用数据进行处理。
步骤S8,边缘服务器将该目标基线模型发送给第二中转设备。
步骤S9,第二中转设备对该目标基线模型进行第一转换操作,得到第二低维基线模型,将该第二低维基线模型发送给第一中转设备。
步骤S10,第一中转设备对该第二低维基线模型进行第二转换操作,得到该目标基线模型,并将该目标基线模型发送给中心服务器。
步骤S11,中心服务器基于目标基线模型和初始基线模型生成融合基线模型。
步骤S12,中心服务器对该融合基线模型进行训练,得到训练后的基线模型,将训练后的基线模型确定为初始基线模型,返回执行步骤S2。
综上所述,由于上述过程可以循环执行,因此,在保护各边缘服务器的数据隐私的前提下,能够不断升级中心服务器的初始基线模型的性能,持续提升车牌识别能力。随着中心服务器与边缘服务器之间交互次数的提升,初始基线模型和目标基线模型的性能能够持续提升,达到预期的性能。
基于与上述方法同样的申请构思,本申请实施例中还提出另一种数据处理方法,该方法可以应用于边缘服务器,参见图4所示,该方法可以包括:
步骤401,从中心服务器获取初始基线模型。
步骤402,通过边缘服务器的场景数据对该初始基线模型进行训练,得到目标基线模型,并确定是否部署该目标基线模型。示例性的,若部署该目标基线模型,则执行步骤403,若不部署该目标基线模型,则执行步骤404。
步骤403,通过该目标基线模型对应用数据进行处理。
步骤404,将目标基线模型发送给中心服务器,以使中心服务器基于该目标基线模型和该初始基线模型生成融合基线模型,并基于该融合基线模型重新获取初始基线模型,这样,边缘服务器可以重新从中心服务器获取初始基线模型。
基于与上述方法同样的申请构思,本申请实施例中还提出另一种数据处理方法,该方法可以应用于中心服务器,参见图5所示,该方法可以包括:
步骤501,将初始基线模型发送给边缘服务器,以使边缘服务器通过边缘服务器的场景数据对该初始基线模型进行训练,得到目标基线模型。
步骤502,从边缘服务器获取该目标基线模型。
步骤503,基于该目标基线模型和该初始基线模型生成融合基线模型。
步骤504,对该融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作,即执行步骤501。
基于与上述方法同样的申请构思,本申请实施例中提出一种数据处理装置,应用于边缘服务器,参见图6A所示,为所述装置的结构示意图,所述装置包括:
获取模块611,用于从中心服务器获取初始基线模型;
训练模块612,用于通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
发送模块613,用于在不部署所述目标基线模型时,将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述融合基线模型重新获取初始基线模型。
示例性的,所述数据处理装置还可以包括:处理模块,用于在部署所述目标基线模型时,通过所述目标基线模型对应用数据进行处理。
基于与上述方法同样的申请构思,本申请实施例中提出一种数据处理装置,应用于中心服务器,参见图6B所示,为所述装置的结构示意图,所述装置包括:
发送模块621,用于将初始基线模型发送给边缘服务器,以使边缘服务器通过边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;
获取模块622,用于从所述边缘服务器获取所述目标基线模型;
生成模块623,用于基于所述目标基线模型和所述初始基线模型生成融合基线模型;对融合基线模型进行训练,将训练后的基线模型确定为初始基线模型。
所述生成模块623基于所述目标基线模型和所述初始基线模型生成融合基线模型时具体用于:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作。
基于与上述方法同样的申请构思,本申请实施例中提出一种边缘服务器,参见图7A所示,所述边缘服务器包括:处理器711和机器可读存储介质712,所述机器可读存储介质712存储有能够被所述处理器711执行的机器可执行指令;所述处理器711用于执行机器可执行指令,以实现如下步骤:
从中心服务器获取初始基线模型;
通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
若否,则将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述融合基线模型重新获取初始基线模型。
基于与上述方法同样的申请构思,本申请实施例中提出一种中心服务器,参见图7B所示,所述中心服务器包括:处理器721和机器可读存储介质722,所述机器可读存储介质722存储有能够被所述处理器721执行的机器可执行指令;所述处理器721用于执行机器可执行指令,以实现如下步骤:
将初始基线模型发送给边缘服务器,以使所述边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;
从所述边缘服务器获取所述目标基线模型;
基于所述目标基线模型和所述初始基线模型生成融合基线模型;
对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作。
基于与上述方法同样的申请构思,本申请实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述计算机指令被处理器执行时,能够实现本申请上述示例公开的数据处理方法。
其中,上述机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(Radom Access Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (11)
1.一种数据处理方法,其特征在于,所述方法包括:
中心服务器将初始基线模型发送给边缘服务器;其中,所述初始基线模型是根据所述中心服务器的样本数据和所述样本数据的标签信息训练得到;
所述边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
若否,则所述边缘服务器将所述目标基线模型发送给所述中心服务器;
所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并根据所述中心服务器的样本数据和所述样本数据的标签信息对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作;
其中,所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,包括:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作,在所述融合操作为加权操作时,初始基线模型的权重大于目标基线模型的权重。
2.根据权利要求1所述的方法,其特征在于,
所述中心服务器将初始基线模型发送给边缘服务器,包括:
所述中心服务器将所述初始基线模型发送给第一中转设备;
所述第一中转设备对所述初始基线模型进行第一转换操作,得到第一低维基线模型,并将所述第一低维基线模型发送给第二中转设备;
所述第二中转设备对所述第一低维基线模型进行第二转换操作,得到所述初始基线模型,并将所述初始基线模型发送给所述边缘服务器。
3.根据权利要求1所述的方法,其特征在于,
所述边缘服务器将所述目标基线模型发送给所述中心服务器,包括:
所述边缘服务器将所述目标基线模型发送给第二中转设备;
所述第二中转设备对所述目标基线模型进行第一转换操作,得到第二低维基线模型,并将所述第二低维基线模型发送给第一中转设备;
所述第一中转设备对所述第二低维基线模型进行第二转换操作,得到所述目标基线模型,并将所述目标基线模型发送给所述中心服务器。
4.根据权利要求2或者3所述的方法,其特征在于,
所述第一转换操作为加密操作,所述第二转换操作为解密操作;或者,
所述第一转换操作为压缩操作,所述第二转换操作为解压缩操作;或者,
所述第一转换操作为加密操作和压缩操作,所述第二转换操作为解密操作和解压缩操作。
5.根据权利要求1所述的方法,其特征在于,
所述确定是否部署所述目标基线模型之后,所述方法还包括:
若是,则所述边缘服务器通过所述目标基线模型对应用数据进行处理。
6.一种数据处理方法,其特征在于,应用于边缘服务器,包括:
从中心服务器获取初始基线模型;其中,所述初始基线模型是根据所述中心服务器的样本数据和所述样本数据的标签信息训练得到;
通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
若否,则将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述中心服务器的样本数据和所述样本数据的标签信息对所述融合基线模型进行训练,以重新获取初始基线模型;
其中,所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,包括:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作,在所述融合操作为加权操作时,初始基线模型的权重大于目标基线模型的权重。
7.一种数据处理方法,其特征在于,应用于中心服务器,包括:
将初始基线模型发送给边缘服务器,以使所述边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;其中,所述初始基线模型是根据所述中心服务器的样本数据和所述样本数据的标签信息训练得到;
从所述边缘服务器获取所述目标基线模型;
基于所述目标基线模型和所述初始基线模型生成融合基线模型;其中,所述基于所述目标基线模型和所述初始基线模型生成融合基线模型,包括:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作,在所述融合操作为加权操作时,初始基线模型的权重大于目标基线模型的权重;
根据所述中心服务器的样本数据和所述样本数据的标签信息对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作。
8.一种数据处理装置,其特征在于,应用于边缘服务器,包括:
获取模块,用于从中心服务器获取初始基线模型;其中,所述初始基线模型是根据所述中心服务器的样本数据和所述样本数据的标签信息训练得到;
训练模块,用于通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
发送模块,用于在不部署所述目标基线模型时,将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述中心服务器的样本数据和所述样本数据的标签信息对所述融合基线模型进行训练,以重新获取初始基线模型;
其中,所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,包括:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作,在所述融合操作为加权操作时,初始基线模型的权重大于目标基线模型的权重。
9.一种数据处理装置,其特征在于,应用于中心服务器,包括:
发送模块,用于将初始基线模型发送给边缘服务器,以使边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;其中,所述初始基线模型是根据所述中心服务器的样本数据和所述样本数据的标签信息训练得到;
获取模块,用于从所述边缘服务器获取所述目标基线模型;
生成模块,用于基于所述目标基线模型和所述初始基线模型生成融合基线模型;根据所述中心服务器的样本数据和所述样本数据的标签信息对融合基线模型进行训练,将训练后的基线模型确定为初始基线模型;
其中,所述基于所述目标基线模型和所述初始基线模型生成融合基线模型,包括:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作,在所述融合操作为加权操作时,初始基线模型的权重大于目标基线模型的权重。
10.一种边缘服务器,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;
所述处理器用于执行机器可执行指令,以实现如下的步骤:
从中心服务器获取初始基线模型;其中,所述初始基线模型是根据所述中心服务器的样本数据和所述样本数据的标签信息训练得到;
通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型,并确定是否部署所述目标基线模型;
若否,则将所述目标基线模型发送给所述中心服务器,以使所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,并基于所述中心服务器的样本数据和所述样本数据的标签信息对所述融合基线模型进行训练,以重新获取初始基线模型;
其中,所述中心服务器基于所述目标基线模型和所述初始基线模型生成融合基线模型,包括:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作,在所述融合操作为加权操作时,初始基线模型的权重大于目标基线模型的权重。
11.一种中心服务器,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;
所述处理器用于执行机器可执行指令,以实现如下的步骤:
将初始基线模型发送给边缘服务器,以使所述边缘服务器通过所述边缘服务器的场景数据对所述初始基线模型进行训练,得到目标基线模型;其中,所述初始基线模型是根据所述中心服务器的样本数据和所述样本数据的标签信息训练得到;
从所述边缘服务器获取所述目标基线模型;
基于所述目标基线模型和所述初始基线模型生成融合基线模型;其中,所述基于所述目标基线模型和所述初始基线模型生成融合基线模型,包括:对至少一个边缘服务器的目标基线模型以及所述初始基线模型进行融合操作,得到所述融合基线模型;其中,所述融合操作包括以下操作的一种:加权操作,平均操作,取最大值操作,取最小值操作,在所述融合操作为加权操作时,初始基线模型的权重大于目标基线模型的权重;
根据所述中心服务器的样本数据和所述样本数据的标签信息对所述融合基线模型进行训练,将训练后的基线模型确定为初始基线模型,返回执行将初始基线模型发送给边缘服务器的操作。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010610046.0A CN111783630B (zh) | 2020-06-29 | 2020-06-29 | 一种数据处理方法、装置及设备 |
PCT/CN2021/073615 WO2022001092A1 (zh) | 2020-06-29 | 2021-01-25 | 一种数据处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010610046.0A CN111783630B (zh) | 2020-06-29 | 2020-06-29 | 一种数据处理方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783630A CN111783630A (zh) | 2020-10-16 |
CN111783630B true CN111783630B (zh) | 2022-07-01 |
Family
ID=72760352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010610046.0A Active CN111783630B (zh) | 2020-06-29 | 2020-06-29 | 一种数据处理方法、装置及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111783630B (zh) |
WO (1) | WO2022001092A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783630B (zh) * | 2020-06-29 | 2022-07-01 | 上海高德威智能交通系统有限公司 | 一种数据处理方法、装置及设备 |
CN112686300B (zh) * | 2020-12-29 | 2023-09-26 | 杭州海康威视数字技术股份有限公司 | 一种数据处理方法、装置及设备 |
CN113222014A (zh) * | 2021-05-12 | 2021-08-06 | 深圳思谋信息科技有限公司 | 图像分类模型训练方法、装置、计算机设备和存储介质 |
CN116451276B (zh) * | 2023-06-15 | 2023-09-26 | 杭州海康威视数字技术股份有限公司 | 一种图像处理方法、装置、设备及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711556A (zh) * | 2018-12-24 | 2019-05-03 | 中国南方电网有限责任公司 | 机巡数据处理方法、装置、网级服务器和省级服务器 |
CN110263936A (zh) * | 2019-06-14 | 2019-09-20 | 深圳前海微众银行股份有限公司 | 横向联邦学习方法、装置、设备及计算机存储介质 |
CN111091199A (zh) * | 2019-12-20 | 2020-05-01 | 哈尔滨工业大学(深圳) | 一种基于差分隐私的联邦学习方法、装置及存储介质 |
CN111222647A (zh) * | 2020-01-09 | 2020-06-02 | 深圳前海微众银行股份有限公司 | 联邦学习系统优化方法、装置、设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8194938B2 (en) * | 2009-06-02 | 2012-06-05 | George Mason Intellectual Properties, Inc. | Face authentication using recognition-by-parts, boosting, and transduction |
CN108510000B (zh) * | 2018-03-30 | 2021-06-15 | 北京工商大学 | 复杂场景下行人细粒度属性的检测与识别方法 |
WO2020033967A1 (en) * | 2018-08-10 | 2020-02-13 | Buffalo Automation Group Inc. | Training a deep learning system for maritime applications |
US12052145B2 (en) * | 2018-12-07 | 2024-07-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Predicting network communication performance using federated learning |
CN111783630B (zh) * | 2020-06-29 | 2022-07-01 | 上海高德威智能交通系统有限公司 | 一种数据处理方法、装置及设备 |
-
2020
- 2020-06-29 CN CN202010610046.0A patent/CN111783630B/zh active Active
-
2021
- 2021-01-25 WO PCT/CN2021/073615 patent/WO2022001092A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711556A (zh) * | 2018-12-24 | 2019-05-03 | 中国南方电网有限责任公司 | 机巡数据处理方法、装置、网级服务器和省级服务器 |
CN110263936A (zh) * | 2019-06-14 | 2019-09-20 | 深圳前海微众银行股份有限公司 | 横向联邦学习方法、装置、设备及计算机存储介质 |
CN111091199A (zh) * | 2019-12-20 | 2020-05-01 | 哈尔滨工业大学(深圳) | 一种基于差分隐私的联邦学习方法、装置及存储介质 |
CN111222647A (zh) * | 2020-01-09 | 2020-06-02 | 深圳前海微众银行股份有限公司 | 联邦学习系统优化方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111783630A (zh) | 2020-10-16 |
WO2022001092A1 (zh) | 2022-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111783630B (zh) | 一种数据处理方法、装置及设备 | |
CN113688855B (zh) | 数据处理方法、联邦学习的训练方法及相关装置、设备 | |
Adler | Sample images can be independently restored from face recognition templates | |
CN109886417A (zh) | 基于联邦学习的模型参数训练方法、装置、设备及介质 | |
CN111191267B (zh) | 一种模型数据的处理方法、装置及设备 | |
CN111611873A (zh) | 人脸替换检测方法及装置、电子设备、计算机存储介质 | |
KR20220076398A (ko) | Ar장치를 위한 객체 인식 처리 장치 및 방법 | |
CN113096055B (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
CN113537633A (zh) | 基于纵向联邦学习的预测方法、装置、设备、介质和系统 | |
CN111783996A (zh) | 一种数据处理方法、装置及设备 | |
CN111091102B (zh) | 一种视频分析装置、服务器、系统及保护身份隐私的方法 | |
CN113240430A (zh) | 移动支付验证方法及装置 | |
Jami et al. | Biometric template protection through adversarial learning | |
Du et al. | Privacyeye: A privacy-preserving and computationally efficient deep learning-based mobile video analytics system | |
Karri | Secure robot face recognition in cloud environments | |
CN111062019A (zh) | 用户攻击检测方法、装置、电子设备 | |
CN112733635B (zh) | 对象识别方法、装置及电子设备 | |
CN109121133A (zh) | 一种位置隐私保护方法及装置 | |
CN111931148A (zh) | 图像处理方法、装置和电子设备 | |
CN111539008A (zh) | 保护隐私的图像处理方法及装置 | |
CN116450524A (zh) | 对抗网络模型训练方法、装置、生成方法和设备 | |
RU2704538C1 (ru) | Сетевая архитектура человекоподобной сети и способ реализации | |
CN111091489A (zh) | 图片优化方法、装置、电子设备及存储介质 | |
Sarkar et al. | Leveraging test-time consensus prediction for robustness against unseen noise | |
CN113190858B (zh) | 一种基于隐私保护的图像处理方法、系统、介质和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |