CN117271647A

CN117271647A - 一种依托分布式数据库实现服务器间数据交换系统

Info

Publication number: CN117271647A
Application number: CN202311517464.5A
Authority: CN
Inventors: 陈玉刚
Original assignee: Zhongke Xunlian Intelligent Network Technology Beijing Co ltd
Current assignee: Zhongke Xunlian Intelligent Network Technology Beijing Co ltd
Priority date: 2023-11-15
Filing date: 2023-11-15
Publication date: 2023-12-22
Anticipated expiration: 2043-11-15
Also published as: CN117271647B

Abstract

本发明涉及数据处理技术领域，公开了一种依托分布式数据库实现服务器间数据交换系统，该系统包括数据采集模块、数据处理模块、数据分析模块、数据请求模块、数据交换模块和数据传输模块，通过采集不同地理位置的服务器产生的第一待处理数据，将第一待处理数据传输至分布式数据库；对采集到的第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据；对第二待处理数据进行数据分析，发起数据交换请求，确定数据消费者的服务器，并获取数据消费者的服务器对应的数据通道；提取数据交换请求中携带的需求数据信息，提取数据单元；通过数据通道加密传输数据单元至数据消费者的服务器；本发明提高了数据交换的效率和安全性。

Description

一种依托分布式数据库实现服务器间数据交换系统

技术领域

本发明涉及数据处理技术领域，具体涉及一种依托分布式数据库实现服务器间数据交换系统。

背景技术

随着信息化的发展，建立统一的数据中心将成为趋势，分布式架构中包括多个节点，每个节点具有数据处理能力和数据存储能力，节点间可以共享数据资源，并发的多个数据会造成数据冲突，无法对持续产生的大量数据进行数据交换，数据交换的效率较低，因此，研究一种依托分布式数据库实现服务器间数据交换系统对于数据交换效率具有重要的意义。

发明内容

本发明的目的是为了解决上述问题，设计了一种依托分布式数据库实现服务器间数据交换系统。

本发明提供一种依托分布式数据库实现服务器间数据交换系统，所述依托分布式数据库实现服务器间数据交换系统包括数据采集模块、数据处理模块、数据分析模块、数据请求模块、数据交换模块和数据传输模块，其中，

数据采集模块，用于采集不同地理位置的服务器产生的第一待处理数据，并将所述第一待处理数据传输至分布式数据库；

数据处理模块，用于对采集到的所述第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据；

数据分析模块，用于对所述第二待处理数据进行数据分析，并将分析后得到的数据进行划分，得到多个数据单元，并将所述数据单元传入到数据传输节点中；

数据请求模块，用于发起数据交换请求，基于所述数据交换请求确定数据消费者的服务器，并获取所述数据消费者的服务器对应的数据通道；

数据交换模块，用于提取所述数据交换请求中携带的需求数据信息，从所述数据传输节点中提取所述需求数据信息对应的数据单元；

数据传输模块，用于通过所述数据通道加密传输所述需求数据信息对应的数据单元至数据消费者的服务器。

可选的，在本发明第一种实现方式中，所述数据采集模块包括抽取子模块、运行子模块和抓取子模块，其中，

抽取子模块，用于建立数据抓取任务，从所述数据抓取任务中确定需要抽取的数据元素，根据所述数据元素从不同地理位置的服务器中抽取数据，得到初始数据；

运行子模块，用于对所述初始数据进行第一数据清洗，并确定数据字段，判断所述初始数据是否符合目标格式，若是，则运行数据抓取任务，通过数据抓取工具将从不同地理位置的服务器中进行抓取，得到抓取的数据；

抓取子模块，用于对所述抓取的数据进行第二数据清洗和数据处理，以去除重复项和处理缺失值，得到第一待处理数据。

可选的，在本发明第二种实现方式中，所述数据处理模块包括聚类子模块、计算子模块、求解子模块和标准化子模块，其中，

聚类子模块，用于读取所述第一待处理数据，建立多个基本聚类，计算多个基础聚类中存在相同数据点的聚类簇，得到聚类簇结果；

计算子模块，用于计算所述聚类簇结果的相似度，得到相似度结果，并基于所述相似度结果计算所述第一待处理数据的整合信息熵；

求解子模块，用于以所述整合信息熵为初始聚类中心选择标准，重复求解整合信息熵，直至不产生新的聚类，输出所述第一待处理数据的数据整合结果；

标准化子模块，用于对所述数据整合结果得到的数据进行数据标准化处理，得到第二待处理数据。

可选的，在本发明第三种实现方式中，所述数据分析模块包括初始化子模块、降序排序子模块和判断子模块，其中，

初始化子模块，用于初始化LightGBM模型参数，输入迭代步数、大梯度数据采样率、小梯度数据采样率和损失函数；

降序排序子模块，用于将梯度绝对值进行降序排序，得到排序结果生成一个大梯度样本点的子集和一个小梯度样本点的子集，合并大梯度样本与小梯度样本；

判断子模块，用于将小梯度样本与权重系数因子相乘，使用采样后的样本学习一个新的弱学习器，判断是否达到迭代次数或者模型是否收敛，若是则输出训练好的数据分析模型。

可选的，在本发明第四种实现方式中，所述判断子模块包括选取单元、计算单元、比较单元和输出单元，其中，

选取单元，用于通过均匀随机采样得到的超参数，选取前n个元素放入第一结果集合中，其中n不等于0；

计算单元，用于从所述第一结果集合中选取随机数，并计算各元素的特征值，得到第一特征值集合，将所述第一特征值集合中最小的特征值作为评判阈值；

比较单元，用于将所述第一结果集合之外的元素计算出各元素的特征值，得到第二特征值集合，将所述第二特征值集合与所述评判阈值进行比较，若所述第二特征值集合中的值大于所述评判阈值，则用所述第二特征值集合中的值所对应的元素替换所述第一结果集合中拥有最小特征值的元素；

输出单元，用于通过排序，直至将元素全部替换完成，得到最终的第二结果集合，根据超参数所对应的验证误差，将所述第二结果集合连续减半，将最后一组超参数设置作为最优超参数输出。

可选的，在本发明第五种实现方式中，所述数据请求模块包括构造子模块、转换子模块和选择子模块，其中，

构造子模块，用于获取数据消费者的服务器的神经网络处理器单元，构造决策矩阵，其中所述决策矩阵的集合至少包括神经网络处理器单元的动态参数；

转换子模块，用于选取成本权重值和效益权重值，基于所述成本权重值和效益权重值将所述矩阵转换为规范化矩阵；

选择子模块，用于计算所述规范化矩阵中可用神经网络处理器单元的加权平均值，并选择加权平均值最高的神经网络处理器单元作为所述数据消费者的服务器对应的数据通道。

可选的，在本发明第六种实现方式中，所述数据传输模块包括选择子模块、数据聚拢子模块和密文转换子模块，其中，

选择子模块，用于随机选择初始第一素数和初始第二素数，将所述初始第一素数与初始第二素数作为两个因数，并基于所述初始第一素数与初始第二素数构建数据单元中的核心数据的提取函数；

数据聚拢子模块，用于设定RSA算法的最大素数长度为100位，采用十进制机制对所述核心数据的提取函数进行数据聚拢，并数据聚拢到200位以下，得到当前第一素数和当前第二素数，将所述当前第一素数和当前第二素数作为RSA算法加密过程中的加密参数，得到所述需求数据信息对应的数据单元加密传输中的子密钥；

密文转换子模块，用于通过所述子密钥对所述需求数据信息对应的数据单元进行密文转换，得到传输密文数据，将所述传输密文数据传输至数据消费者的服务器。

可选的，在本发明第七种实现方式中，所述依托分布式数据库实现服务器间数据交换系统的运行方法包括以下步骤：

采集不同地理位置的服务器产生的第一待处理数据，并将所述第一待处理数据传输至分布式数据库；

对采集到的所述第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据；

对所述第二待处理数据进行数据分析，并将分析后得到的数据进行划分，得到多个数据单元，并将所述数据单元传入到数据传输节点中；

发起数据交换请求，基于所述数据交换请求确定数据消费者的服务器，并获取所述数据消费者的服务器对应的数据通道；

提取所述数据交换请求中携带的需求数据信息，从所述数据传输节点中提取所述需求数据信息对应的数据单元；

通过所述数据通道加密传输所述需求数据信息对应的数据单元至数据消费者的服务器。

可选的，在本发明第八种实现方式中，所述采集不同地理位置的服务器产生的第一待处理数据，并将所述第一待处理数据传输至分布式数据库，包括：

建立数据抓取任务，从所述数据抓取任务中确定需要抽取的数据元素，根据所述数据元素从不同地理位置的服务器中抽取数据，得到初始数据；

对所述初始数据进行第一数据清洗，并确定数据字段，判断所述初始数据是否符合目标格式，若是，则运行数据抓取任务，通过数据抓取工具将从不同地理位置的服务器中进行抓取，得到抓取的数据。

可选的，在本发明第九种实现方式中，所述对采集到的所述第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据，包括：

读取所述第一待处理数据，建立多个基本聚类，计算多个基础聚类中存在相同数据点的聚类簇，得到聚类簇结果；

计算所述聚类簇结果的相似度，得到相似度结果，并基于所述相似度结果计算所述第一待处理数据的整合信息熵；

以所述整合信息熵为初始聚类中心选择标准，重复求解整合信息熵，直至不产生新的聚类，输出所述第一待处理数据的数据整合结果；

对所述数据整合结果得到的数据进行数据标准化处理，得到第二待处理数据。

本发明提供的技术方案中，该系统包括数据采集模块、数据处理模块、数据分析模块、数据请求模块、数据交换模块和数据传输模块，通过采集不同地理位置的服务器产生的第一待处理数据，并将所述第一待处理数据传输至分布式数据库；对采集到的所述第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据；对所述第二待处理数据进行数据分析，并将分析后得到的数据进行划分，得到多个数据单元，并将所述数据单元传入到数据传输节点中；发起数据交换请求，基于所述数据交换请求确定数据消费者的服务器，并获取所述数据消费者的服务器对应的数据通道；提取所述数据交换请求中携带的需求数据信息，从所述数据传输节点中提取所述需求数据信息对应的数据单元；通过所述数据通道加密传输所述需求数据信息对应的数据单元至数据消费者的服务器；本发明提高了数据交换的效率和安全性。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。

图1为本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第一个结构示意图；

图2为本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第二个结构示意图；

图3为本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第三个结构示意图；

图4为本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第四个结构示意图。

具体实施方式

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、设备、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第一个结构示意图，该系统包括数据采集模块、数据处理模块、数据分析模块、数据请求模块、数据交换模块和数据传输模块，其中，

数据采集模块101，用于采集不同地理位置的服务器产生的第一待处理数据，并将第一待处理数据传输至分布式数据库；

数据处理模块102，用于对采集到的第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据；

数据分析模块103，用于对第二待处理数据进行数据分析，并将分析后得到的数据进行划分，得到多个数据单元，并将数据单元传入到数据传输节点中；

数据请求模块104，用于发起数据交换请求，基于数据交换请求确定数据消费者的服务器，并获取数据消费者的服务器对应的数据通道；

数据交换模块105，用于提取数据交换请求中携带的需求数据信息，从数据传输节点中提取需求数据信息对应的数据单元；

数据传输模块106，用于通过数据通道加密传输需求数据信息对应的数据单元至数据消费者的服务器。

本实施例中，数据采集模块包括抽取子模块、运行子模块和抓取子模块，其中，

抽取子模块，用于建立数据抓取任务，从数据抓取任务中确定需要抽取的数据元素，根据数据元素从不同地理位置的服务器中抽取数据，得到初始数据；

运行子模块，用于对初始数据进行第一数据清洗，并确定数据字段，判断初始数据是否符合目标格式，若是，则运行数据抓取任务，通过数据抓取工具将从不同地理位置的服务器中进行抓取，得到抓取的数据；

抓取子模块，用于对抓取的数据进行第二数据清洗和数据处理，以去除重复项和处理缺失值，得到第一待处理数据。

本实施例中，数据请求模块包括构造子模块、转换子模块和选择子模块，其中，

构造子模块，用于获取数据消费者的服务器的神经网络处理器单元，构造决策矩阵，其中决策矩阵的集合至少包括神经网络处理器单元的动态参数；

转换子模块，用于选取成本权重值和效益权重值，基于成本权重值和效益权重值将矩阵转换为规范化矩阵；

选择子模块，用于计算规范化矩阵中可用神经网络处理器单元的加权平均值，并选择加权平均值最高的神经网络处理器单元作为数据消费者的服务器对应的数据通道。

本实施例中，依托分布式数据库实现服务器间数据交换系统的运行方法包括以下步骤：

采集不同地理位置的服务器产生的第一待处理数据，并将第一待处理数据传输至分布式数据库；

对采集到的第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据；

对第二待处理数据进行数据分析，并将分析后得到的数据进行划分，得到多个数据单元，并将数据单元传入到数据传输节点中；

发起数据交换请求，基于数据交换请求确定数据消费者的服务器，并获取数据消费者的服务器对应的数据通道；

提取数据交换请求中携带的需求数据信息，从数据传输节点中提取需求数据信息对应的数据单元；

通过数据通道加密传输需求数据信息对应的数据单元至数据消费者的服务器。

本实施例中，建立数据抓取任务，从数据抓取任务中确定需要抽取的数据元素，根据数据元素从不同地理位置的服务器中抽取数据，得到初始数据；对初始数据进行第一数据清洗，并确定数据字段，判断初始数据是否符合目标格式，若是，则运行数据抓取任务，通过数据抓取工具将从不同地理位置的服务器中进行抓取，得到抓取的数据；对抓取的数据进行第二数据清洗和数据处理，以去除重复项和处理缺失值，得到第一待处理数据。

本实施例中，读取第一待处理数据，建立多个基本聚类，计算多个基础聚类中存在相同数据点的聚类簇，得到聚类簇结果；计算聚类簇结果的相似度，得到相似度结果，并基于相似度结果计算第一待处理数据的整合信息熵；以整合信息熵为初始聚类中心选择标准，重复求解整合信息熵，直至不产生新的聚类，输出第一待处理数据的数据整合结果；对数据整合结果得到的数据进行数据标准化处理，得到第二待处理数据。

请参阅图2，本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第二个结构示意图，数据处理模块102包括聚类子模块、计算子模块、求解子模块和标准化子模块，其中，

聚类子模块1021，用于读取第一待处理数据，建立多个基本聚类，计算多个基础聚类中存在相同数据点的聚类簇，得到聚类簇结果；

计算子模块1022，用于计算聚类簇结果的相似度，得到相似度结果，并基于相似度结果计算第一待处理数据的整合信息熵；

求解子模块1023，用于以整合信息熵为初始聚类中心选择标准，重复求解整合信息熵，直至不产生新的聚类，输出第一待处理数据的数据整合结果；

标准化子模块1024，用于对数据整合结果得到的数据进行数据标准化处理，得到第二待处理数据。

请参阅图3，本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第三个结构示意图，数据分析模块103包括初始化子模块、降序排序子模块和判断子模块，其中，

初始化子模块1031，用于初始化LightGBM模型参数，输入迭代步数、大梯度数据采样率、小梯度数据采样率和损失函数；

降序排序子模块1032，用于将梯度绝对值进行降序排序，得到排序结果生成一个大梯度样本点的子集和一个小梯度样本点的子集，合并大梯度样本与小梯度样本；

判断子模块1033，用于将小梯度样本与权重系数因子相乘，使用采样后的样本学习一个新的弱学习器，判断是否达到迭代次数或者模型是否收敛，若是则输出训练好的数据分析模型。

本实施例中，判断子模块包括选取单元、计算单元、比较单元和输出单元，其中，

计算单元，用于从第一结果集合中选取随机数，并计算各元素的特征值，得到第一特征值集合，将第一特征值集合中最小的特征值作为评判阈值；

比较单元，用于将第一结果集合之外的元素计算出各元素的特征值，得到第二特征值集合，将第二特征值集合与评判阈值进行比较，若第二特征值集合中的值大于评判阈值，则用第二特征值集合中的值所对应的元素替换第一结果集合中拥有最小特征值的元素；

输出单元，用于通过排序，直至将元素全部替换完成，得到最终的第二结果集合，根据超参数所对应的验证误差，将第二结果集合连续减半，将最后一组超参数设置作为最优超参数输出。

请参阅图4，本发明实施例提供的依托分布式数据库实现服务器间数据交换系统的第四个结构示意图，数据传输模块106包括选择子模块、数据聚拢子模块和密文转换子模块，其中，

选择子模块1061，用于随机选择初始第一素数和初始第二素数，将初始第一素数与初始第二素数作为两个因数，并基于初始第一素数与初始第二素数构建数据单元中的核心数据的提取函数；

数据聚拢子模块1062，用于设定RSA算法的最大素数长度为100位，采用十进制机制对核心数据的提取函数进行数据聚拢，并数据聚拢到200位以下，得到当前第一素数和当前第二素数，将当前第一素数和当前第二素数作为RSA算法加密过程中的加密参数，得到需求数据信息对应的数据单元加密传输中的子密钥；

密文转换子模块1063，用于通过子密钥对需求数据信息对应的数据单元进行密文转换，得到传输密文数据，将传输密文数据传输至数据消费者的服务器。

通过上述方案的实施，该系统包括数据采集模块、数据处理模块、数据分析模块、数据请求模块、数据交换模块和数据传输模块，本发明提高了数据交换的效率和安全性。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的仅为本发明的优选例，并不用来限制本发明，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述依托分布式数据库实现服务器间数据交换系统包括数据采集模块、数据处理模块、数据分析模块、数据请求模块、数据交换模块和数据传输模块，其中，

2.如权利要求1所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述数据采集模块包括抽取子模块、运行子模块和抓取子模块，其中，

3.如权利要求1所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述数据处理模块包括聚类子模块、计算子模块、求解子模块和标准化子模块，其中，

4.如权利要求1所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述数据分析模块包括初始化子模块、降序排序子模块和判断子模块，其中，

5.如权利要求4所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述判断子模块包括选取单元、计算单元、比较单元和输出单元，其中，

6.如权利要求1所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述数据请求模块包括构造子模块、转换子模块和选择子模块，其中，

7.如权利要求1所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述数据传输模块包括选择子模块、数据聚拢子模块和密文转换子模块，其中，

8.如权利要求1所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述依托分布式数据库实现服务器间数据交换系统的运行方法包括以下步骤：

9.如权利要求8所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述采集不同地理位置的服务器产生的第一待处理数据，并将所述第一待处理数据传输至分布式数据库，包括：

对所述初始数据进行第一数据清洗，并确定数据字段，判断所述初始数据是否符合目标格式，若是，则运行数据抓取任务，通过数据抓取工具将从不同地理位置的服务器中进行抓取，得到抓取的数据；

对所述抓取的数据进行第二数据清洗和数据处理，以去除重复项和处理缺失值，得到第一待处理数据。

10.如权利要求8所述的一种依托分布式数据库实现服务器间数据交换系统，其特征在于，所述对采集到的所述第一待处理数据进行数据整合及数据标准化处理，得到第二待处理数据，包括：