CN116050698A - 铁路建设大数据管理方法、装置、设备及可读存储介质 - Google Patents

铁路建设大数据管理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN116050698A
CN116050698A CN202310225012.3A CN202310225012A CN116050698A CN 116050698 A CN116050698 A CN 116050698A CN 202310225012 A CN202310225012 A CN 202310225012A CN 116050698 A CN116050698 A CN 116050698A
Authority
CN
China
Prior art keywords
data
information
linear regression
decision tree
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310225012.3A
Other languages
English (en)
Inventor
王基全
王晓刚
谷存雷
彭寿钧
陈翔
周亮亮
司剑锋
张鹏
刘彬堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lunan High Speed Railway Co ltd
Shandong Railway Investment Holding Group Co ltd
China Railway Engineering Consulting Group Co Ltd
Original Assignee
Lunan High Speed Railway Co ltd
Shandong Railway Investment Holding Group Co ltd
China Railway Engineering Consulting Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lunan High Speed Railway Co ltd, Shandong Railway Investment Holding Group Co ltd, China Railway Engineering Consulting Group Co Ltd filed Critical Lunan High Speed Railway Co ltd
Priority to CN202310225012.3A priority Critical patent/CN116050698A/zh
Publication of CN116050698A publication Critical patent/CN116050698A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种铁路建设大数据管理方法、装置、设备及可读存储介质,涉及工程建设技术领域,包括获取第一信息,第一信息包括至少两个工程项目业务系统的数据;将第一信息进行标准化处理,得到第二信息,并根据预设的神经网络模型、预设的线性回归模型和第二信息创建每个工程项目业务系统的数据对应的决策树模型索引,决策树模型索引中包括将第二信息的业务主键映射到决策树模型索引中的排序数组,业务主键为工程项目信息;将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端。本发明解决了已有的工程项目业务系统的数据难利用和铁路工程数据管理难度较大、成本较高的问题,用于铁路工程数据管理。

Description

铁路建设大数据管理方法、装置、设备及可读存储介质
技术领域
本发明涉及铁路工程建设大数据管理技术领域,具体而言,涉及铁路建设大数据管理方法、装置、设备及可读存储介质。
背景技术
铁路工程建设经历过几十年的发展,历史信息已经达到了TB级甚至PB级别的规模,传统的关系型数据库已经很难存储和管理这些数据,导致了工程建设数据孤岛问题,增加了工程建设数据的管理难度以及数据共享难度。
为了解决上述问题,一些铁路工程企业采用了新建数据中台的方式去实现企业各个业务系统数据之间的数据共享。然而这种方式对于已经具有各个成熟业务系统以及大规模数据的铁路工程建设企业而言具有以下缺陷:一方面对于企业已经建立的各个业务系统不能很好地利用,会造成信息资源浪费;另一方面需要耗费大量的人力物力财力去搭建新的数据管理平台,并且对于新的数据管理平台的存储能力要求很高,大大增加了平台搭建难度和成本。
发明内容
本发明的目的在于提供一种铁路建设大数据管理方法、装置、设备及可读存储介质,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:
第一方面,本申请提供了一种铁路建设大数据管理方法,包括:
获取第一信息,所述第一信息包括至少两个工程项目业务系统的数据,每个所述工程项目业务系统的数据包括工程项目信息;
将所述第一信息进行标准化处理,得到第二信息,并根据预设的神经网络模型、预设的线性回归模型和所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,所述决策树模型索引中包括将第二信息的业务主键映射到决策树模型索引中的排序数组,所述业务主键为工程项目信息;
将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端,所述决策树模型索引用于触发所述区块链存储服务端接受数据获取请求,并根据区块链存储服务端上与数据获取请求对应的决策树模型索引获取对应的标准化处理后的数据。“获取对应的标准化处理后的数据”指的是:获取对应的工程项目业务系统的数据经过标准化处理后所得到的数据。
第二方面,本申请还提供了一种铁路建设大数据管理装置,包括:
获取模块,用于获取第一信息,所述第一信息包括至少两个工程项目业务系统的数据,每个所述工程项目业务系统的数据包括工程项目信息;
创建模块,用于将所述第一信息进行标准化处理,得到第二信息,并根据预设的神经网络模型、预设的线性回归模型和所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,所述决策树模型索引中包括将第二信息的业务主键映射到决策树模型索引中的排序数组,所述业务主键为工程项目信息;
发送模块,用于将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端,所述决策树模型索引用于触发所述区块链存储服务端接受数据获取请求,并根据区块链存储服务端上与数据获取请求对应的决策树模型索引获取对应的标准化处理后的数据。
第三方面,本申请还提供了一种铁路建设大数据管理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述铁路建设大数据管理方法的步骤。
第四方面,本申请还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于铁路建设大数据管理方法的步骤。
本发明的有益效果为:本发明一方面避免了耗费大量的人力物力财力去搭建新的数据管理平台,对已有的工程项目业务系统进行了充分利用;另一方面降低了区块链的存储压力,使得各个工程项目业务系统数据得到高效率的数字化管理,降低了工程企业的数字化管理难度。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例中所述的铁路建设大数据管理方法流程示意图;
图2为本发明实施例中所述的铁路建设大数据管理装置结构示意图;
图3为本发明实施例中所述的铁路建设大数据管理设备结构示意图。
图中标记:400、获取模块;500、创建模块;501、划分模块;502、第一构建模块;503、第二构建模块;504、分解模块;505、加密模块;506、生成模块;507、分发模块;600、发送模块;700、铁路建设大数据管理设备;701、处理器;702、存储器;703、多媒体组件;704、I/O接口;705、通信组件。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在排序数组中搜索目标值直到超出目标值在排序数组中的位置为止,所述目标值为业务主键在排序数组中的位置。
实施例1:
本实施例提供了一种铁路建设大数据管理方法。
参见图1,图中示出了本方法包括步骤S100、步骤S200和步骤S300。
步骤S100:获取第一信息,所述第一信息包括至少两个工程项目业务系统的数据,每个所述工程项目业务系统的数据包括工程项目信息。第一信息包括工程项目设计业务系统数据、工程项目招标业务系统数据、工程项目施工业务系统数据、工程项目验收业务系统数据。
步骤S200:将所述第一信息进行标准化处理,得到第二信息,并根据预设的神经网络模型、预设的线性回归模型和所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,所述决策树模型索引中包括将第二信息的业务主键映射到决策树模型索引中的排序数组,所述业务主键为工程项目信息;
其中步骤S200具体包括:
S201:将所述第一信息进行标准化处理,得到第二信息,根据一个预设的规则划分第二信息,得到第一数据和第二数据。
其中标准化处理过程包括:
首先根据所述第一信息设计并定义数据标准,得到已定义的数据标准,所述已定义的数据标准包括主题、信息大类、信息小类、信息项、数据类型、数据长度、数据定义和数据规则这几类数据标准;
将已定义的数据标准与各业务系统的系统范围、应用领域、数据库表、数据字典和数据字段进行映射获得标准数据。
本申请所述的预设的规则为:将第二信息中的按照主题、信息大类、信息小类、信息项这些数据标准处理后的数据划分为第一数据,将按照其余数据标准处理后的数据划分为第二数据。
具体而言,在本申请中所述决策树模型索引为一个分层模型结构,具体而言,其构建方法如下:
S202:根据神经网络模型拟合第一数据构建决策树模型索引的内部节点,根据神经网络模型拟合第一数据构建所述分层模型结构的神经网络预测层,所述神经网络预测层的输入为所述业务主键;
需要说明的是,为了便于说明将神经网络预测层称为神经网络数学模型。
S203:根据线性回归模型拟合第二数据构建决策树模型索引的叶节点,根据线性回归模型拟合第二数据构建所述分层模型结构的至少两个线性回归层,每个所述线性回归层均包含多个线性回归数学模型,神经网络预测层的输入为所述业务主键,所述神经网络预测层的输出信息用于触发选择神经网络预测层下面一层线性回归层中的线性回归数学模型并且作为下面一层线性回归层中的线性回归数学模型的输入,上一线性回归层的输出用于触发选择下一线性回归层的线性回归数学模型并作为下一线性回归层的线性回归数学模型的输入,直到输出第三信息,所述第三信息为所述业务主键位于所述排序数组中的预测位置。
由此上述决策树模型索引负责将业务主键以较低的误差做出更准确的位置预测。
所述决策树模型索引是通过对神经网络数学模型以及线性回归层中的线性回归数学模型进行迭代地训练获得,通过每个数学模型输出信息的训练误差实现上述触发选择,令所述决策树模型索引中每个数学模型均表示为,其中为业务主键,所述业务主键位于所述排序数组中的位置,其中L为排序数组中排序范围的最大值,即排序数组中元素的最后一个位置。记在决策树模型索引中的第m个线性回归层有N个数学模型,则神经网络数学模型为,业务主键在神经网络数学模型输出信息的真实值为Y,在第m个线性回归层的线性回归数学模型P可以表示为,第m-1个线性回归层的输出为,决策树模型索引的神经网络数学模型中的训练误差函数为如下公式:
决策树模型索引在第m个线性回归层中的训练误差函数为如下公式:
其中,训练误差函数在本申请中对每个数学模型的训练过程中使用,通过上述训练误差函数,可以提高决策树模型索引的准确性。
S204:所述决策树模型索引中将第二信息的业务主键映射到决策树模型索引中的排序数组,之后包括:
获取需要搜索的目标值,将第三信息设为二进制搜索的中间元素,在所述排序数组上执行二进制搜索;
若需要搜索的业务主键的位置等于中间元素,则找到目标值;
若需要搜索的业务主键的位置在中间元素的左侧,则在中间元素的左侧继续搜索,直到找到目标值;
若需要搜索的业务主键的位置在中间元素的右侧,则在中间元素的右侧继续搜索,直到找到目标值。
步骤S300:将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端,所述决策树模型索引用于触发所述区块链存储服务端接受数据获取请求,并根据区块链存储服务端上与数据获取请求对应的决策树模型索引获取对应的标准化处理后的数据。
其中步骤S300具体包括:
S301:接受数据获取请求,所述数据获取请求包括与请求获取的工程项目业务系统的数据中标准化处理后的数据对应的唯一哈希值;
S302:对所述数据获取请求进行电子签章和智能合约校验,获得校验结果;
S303:区块链基于校验结果获取所述对应的索引分片相应工程项目业务系统中的工程项目业务系统的标准化处理后的数据。
本发明一方面充分利用了工程企业已经建立的工程项目业务系统,获取的数据直接来源于这些工程企业已经建立完善的工程项目业务系统,避免了数据信息资源浪费;另一方面根据预设的神经网络模型、预设的线性回归模型对前述这些工程项目业务系统中的数据分别构建决策树模型索引,以工程项目信息作为业务主键,将第二信息的业务主键映射到决策树模型索引中的排序数组,并且将这些决策树模型索引发送至区块链存储服务端进行存储,由此当需要调用工程项目业务系统中的数据时,只需要在区块链存储服务端上发送相应的获取数据请求,即可实现对相应数据的及时调取,该过程中不需要新建大存储的数据管理平台,并且区块链存储服务端还可以保证决策树模型索引不被其他人随意篡改,保证了数据的安全和稳定性。
实施例2:
如图2所示,本实施例提供了一种铁路建设大数据管理装置,所述装置包括:
获取模块400,用于获取第一信息,所述第一信息包括至少两个工程项目业务系统的数据,每个所述工程项目业务系统的数据包括工程项目信息。
创建模块500,用于将所述第一信息进行标准化处理,得到第二信息,并根据预设的神经网络模型、预设的线性回归模型和所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,所述决策树模型索引中包括将第二信息的业务主键映射到决策树模型索引中的排序数组,所述业务主键为工程项目信息,工程项目信息包括工程项目号、采购订单号、建筑材料商品编号、机械设备编号、人员编号、工程项目设计图纸编号。
所述创建模块500具体包括:
划分模块501,用于根据一个预设的规则划分第二信息,得到第一数据和第二数据。
第一构建模块502,用于根据神经网络模型拟合第一数据构建决策树模型索引的内部节点,具体用于根据神经网络模型拟合第一数据构建所述分层模型结构的神经网络预测层,所述神经网络预测层的输入为所述业务主键。
第二构建模块503,用于根据线性回归模型拟合第二数据构建决策树模型索引的叶节点,具体用于根据线性回归模型拟合第二数据构建所述分层模型结构的至少两个线性回归层,每个所述线性回归层均包含多个线性回归数学模型,神经网络预测层的输入为所述业务主键,所述神经网络预测层的输出信息用于触发选择神经网络预测层下面一层线性回归层中的线性回归数学模型并且作为下面一层线性回归层中的线性回归数学模型的输入,上一线性回归层的输出用于触发选择下一线性回归层的线性回归数学模型并作为下一线性回归层的线性回归数学模型的输入,直到输出第三信息,所述第三信息为所述业务主键位于所述排序数组中的预测位置;还用于获取需要搜索的目标值,将第三信息设为二进制搜索的中间元素,在所述排序数组上执行二进制搜索;若需要搜索的业务主键的位置等于中间元素,则找到目标值;若需要搜索的业务主键的位置在中间元素的左侧,则在中间元素的左侧继续搜索,直到找到目标值;若需要搜索的业务主键的位置在中间元素的右侧,则在中间元素的右侧继续搜索,直到找到目标值。
分解模块504,用于将决策树模型索引分解为索引分片。
加密模块505,用于对每个索引分片进行加密。
生成模块506,用于根据加密的密钥生成添加到区块链存储服务端的唯一哈希值。
分发模块507,用于复制每个索引分片,并根据所述唯一哈希值将复制所得的索引分片分发到区块链存储服务端的各个节点上。
发送模块600,用于将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端,所述决策树模型索引用于触发所述区块链存储服务端接受数据获取请求,并根据区块链存储服务端上与数据获取请求对应的决策树模型索引获取对应的标准化处理后的数据;具体用于接受数据获取请求,所述数据获取请求包括与请求获取的工程项目业务系统的数据中标准化处理后的数据对应的唯一哈希值;对所述数据获取请求进行电子签章和智能合约校验,获得校验结果;区块链基于校验结果获取所述对应的索引分片相应业务系统中的业务系统标准数据。
需要说明的是,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3:
相应于上面的方法实施例,本实施例中还提供了一种铁路建设大数据管理设备,下文描述的一种铁路建设大数据管理设备与上文描述的一种铁路建设大数据管理方法可相互对应参照。
图3是根据示例性实施例示出的一种铁路建设大数据管理设备700的框图。如图3所示,该铁路建设大数据管理设备700可以包括:处理器701,存储器702。该铁路建设大数据管理设备700还可以包括多媒体组件703, I/O接口704,以及通信组件705中的一者或多者。
其中,处理器701用于控制该铁路建设大数据管理设备700的整体操作,以完成上述的铁路建设大数据管理方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该铁路建设大数据管理设备700的操作,这些数据例如可以包括用于在该铁路建设大数据管理设备700上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static RandomAccess Memory,简称SRAM),电可擦除可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该铁路建设大数据管理设备700与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件705可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,铁路建设大数据管理设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的铁路建设大数据管理方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的铁路建设大数据管理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器702,上述程序指令可由铁路建设大数据管理设备700的处理器701执行以完成上述的铁路建设大数据管理方法。
实施例4:
相应于上面的方法实施例,本实施例中还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种铁路建设大数据管理方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的铁路建设大数据管理方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
本发明通过一方面充分利用了工程企业已经建立的工程项目业务系统,获取的数据直接来源于这些工程企业已经建立完善的工程项目业务系统,避免了数据信息资源浪费;另一方面根据预设的神经网络模型、预设的线性回归模型对前述这些工程项目业务系统中的数据分别构建决策树模型索引,以工程项目信息作为业务主键将决策树模型索引,将第二信息的业务主键映射到决策树模型索引中的排序数组,并且将这些决策树模型索引发送至区块链存储服务端,由此当需要调用工程项目业务系统中的数据时,只需要在区块链存储服务端上发送相应的获取数据请求,即可实现对相应数据的及时调取,该过程中不需要新建大存储的数据管理平台,并且区块链存储服务端还可以保证决策树模型索引不被其他人随意篡改,保证了数据的安全和稳定性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种铁路建设大数据管理方法,其特征在于,包括:
获取第一信息,所述第一信息包括至少两个工程项目业务系统的数据,每个所述工程项目业务系统的数据包括工程项目信息;
将所述第一信息进行标准化处理,得到第二信息,并根据预设的神经网络模型、预设的线性回归模型和所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,所述决策树模型索引中包括将第二信息的业务主键映射到决策树模型索引中的排序数组,所述业务主键为工程项目信息;
将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端,所述决策树模型索引用于触发所述区块链存储服务端接受数据获取请求,并根据区块链存储服务端上与数据获取请求对应的决策树模型索引获取对应的标准化处理后的数据。
2.根据权利要求1所述的铁路建设大数据管理方法,其特征在于,根据神经网络模型、线性回归模型对所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,包括:
根据一个预设的规则划分第二信息,得到第一数据和第二数据;
根据神经网络模型拟合第一数据构建决策树模型索引的内部节点;
根据线性回归模型拟合第二数据构建决策树模型索引的叶节点。
3.根据权利要求2所述的铁路建设大数据管理方法,其特征在于,所述决策树模型索引为分层模型结构,根据神经网络模型、线性回归模型对所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,包括:
根据神经网络模型拟合第一数据构建所述分层模型结构的神经网络预测层,所述神经网络预测层的输入为所述业务主键;
根据线性回归模型拟合第二数据构建所述分层模型结构的至少两个线性回归层,每个所述线性回归层均包含多个线性回归数学模型,神经网络预测层的输入为所述业务主键,所述神经网络预测层的输出信息用于触发选择神经网络预测层下面一层线性回归层中的线性回归数学模型并且作为下面一层线性回归层中的线性回归数学模型的输入,上一线性回归层的输出用于触发选择下一线性回归层的线性回归数学模型并作为下一线性回归层的线性回归数学模型的输入,直到输出第三信息,所述第三信息为所述业务主键位于所述排序数组中的预测位置。
4.根据权利要求1所述的铁路建设大数据管理方法,其特征在于,将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端,包括:
将决策树模型索引分解为索引分片;
对每个索引分片进行加密;
根据加密的密钥生成添加到区块链存储服务端的唯一哈希值;
复制每个索引分片,并根据所述唯一哈希值将复制所得的索引分片分发到区块链存储服务端的各个节点上。
5.一种铁路建设大数据管理装置,其特征在于,包括:
获取模块,用于获取第一信息,所述第一信息包括至少两个工程项目业务系统的数据,每个所述工程项目业务系统的数据包括工程项目信息;
创建模块,用于将所述第一信息进行标准化处理,得到第二信息,并根据预设的神经网络模型、预设的线性回归模型和所述第二信息创建每个所述工程项目业务系统的数据对应的决策树模型索引,所述决策树模型索引中包括将第二信息的业务主键映射到决策树模型索引中的排序数组,所述业务主键为工程项目信息;
发送模块,用于将各工程项目业务系统的数据对应的决策树模型索引发送至区块链存储服务端,所述决策树模型索引用于触发所述区块链存储服务端接受数据获取请求,并根据区块链存储服务端上与数据获取请求对应的决策树模型索引获取对应的标准化处理后的数据。
6.根据权利要求5所述的铁路建设大数据管理装置,其特征在于,所述创建模块,包括:
划分模块,用于根据一个预设的规则划分第二信息,得到第一数据和第二数据;
第一构建模块,用于根据神经网络模型拟合第一数据构建决策树模型索引的内部节点;
第二构建模块,用于根据线性回归模型拟合第二数据构建决策树模型索引的叶节点。
7.根据权利要求6所述的铁路建设大数据管理装置,其特征在于,所述决策树模型索引为分层模型结构,所述创建模块,包括:
第一构建模块,用于根据神经网络模型拟合第一数据构建所述分层模型结构的神经网络预测层,所述神经网络预测层的输入为所述业务主键;
第二构建模块,用于根据线性回归模型拟合第二数据构建所述分层模型结构的至少两个线性回归层,每个所述线性回归层均包含多个线性回归数学模型,神经网络预测层的输入为所述业务主键,所述神经网络预测层的输出信息用于触发选择神经网络预测层下面一层线性回归层中的线性回归数学模型并且作为下面一层线性回归层中的线性回归数学模型的输入,上一线性回归层的输出用于触发选择下一线性回归层的线性回归数学模型并作为下一线性回归层的线性回归数学模型的输入,直到输出第三信息,所述第三信息为所述业务主键位于所述排序数组中的预测位置。
8.根据权利要求5所述的铁路建设大数据管理装置,其特征在于,所述创建模块,包括:
分解模块,用于将决策树模型索引分解为索引分片;
加密模块,用于对每个索引分片进行加密;
生成模块,用于根据加密的密钥生成添加到区块链存储服务端的唯一哈希值;
分发模块,用于复制每个索引分片,并根据所述唯一哈希值将复制所得的索引分片分发到区块链存储服务端的各个节点上。
9.一种铁路建设大数据管理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述铁路建设大数据管理方法的步骤。
10.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述铁路建设大数据管理方法的步骤。
CN202310225012.3A 2023-03-10 2023-03-10 铁路建设大数据管理方法、装置、设备及可读存储介质 Pending CN116050698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310225012.3A CN116050698A (zh) 2023-03-10 2023-03-10 铁路建设大数据管理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310225012.3A CN116050698A (zh) 2023-03-10 2023-03-10 铁路建设大数据管理方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN116050698A true CN116050698A (zh) 2023-05-02

Family

ID=86127564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310225012.3A Pending CN116050698A (zh) 2023-03-10 2023-03-10 铁路建设大数据管理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN116050698A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230327885A1 (en) * 2019-03-26 2023-10-12 Wells Fargo Bank, N.A. Quantum-safe blockchain vault system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737720A (zh) * 2020-07-21 2020-10-02 腾讯科技(深圳)有限公司 数据处理方法、装置及电子设备
CN113157735A (zh) * 2021-04-20 2021-07-23 清华大学 一种区块链存储数据的查询方法及装置
CN114969023A (zh) * 2022-02-18 2022-08-30 北京大学 一种数据库学习型索引构建方法和系统
CN115221238A (zh) * 2021-04-20 2022-10-21 中国移动通信有限公司研究院 基于业务的数据共享方法、装置及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737720A (zh) * 2020-07-21 2020-10-02 腾讯科技(深圳)有限公司 数据处理方法、装置及电子设备
CN113157735A (zh) * 2021-04-20 2021-07-23 清华大学 一种区块链存储数据的查询方法及装置
CN115221238A (zh) * 2021-04-20 2022-10-21 中国移动通信有限公司研究院 基于业务的数据共享方法、装置及存储介质
CN114969023A (zh) * 2022-02-18 2022-08-30 北京大学 一种数据库学习型索引构建方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TIM KRASKA等: "The Case for Learned Index Structures", 《ARXIV》, pages 1 - 30 *
张洲: "学习索引:现状与研究展望", 《软件学报》, vol. 32, no. 4, pages 1129 - 1150 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230327885A1 (en) * 2019-03-26 2023-10-12 Wells Fargo Bank, N.A. Quantum-safe blockchain vault system

Similar Documents

Publication Publication Date Title
CN104376237B (zh) 一种针对生产过程中信息的安全控制方法和系统
CN111032319B (zh) 编码体积数据以支持可信交易交付
CN112069165A (zh) 文档编校和协调
US11500929B2 (en) Hierarchical federated learning using access permissions
CN112703499A (zh) 用于计算以及可信验证的分布式平台
CN104967620A (zh) 一种基于属性访问控制策略的访问控制方法
CN115211093A (zh) 数据对象的有效阈值存储
US20230344813A1 (en) Method and system for securing asset data in a computing environment
CN115699054A (zh) 区块链的更快查看改变
US10700934B2 (en) Communication control device, communication control method, and computer program product
CN116050698A (zh) 铁路建设大数据管理方法、装置、设备及可读存储介质
CN110599384B (zh) 组织关系的转移方法、装置、设备及存储介质
CN113626519A (zh) 数据级联系统
CN114641782A (zh) 基于区块链的施工文档管理混合系统及其方法
CN110598475A (zh) 基于区块链的作品属性信息获取方法、装置和计算机设备
CN116719799A (zh) 环保数据治理方法、装置、计算机设备和存储介质
CN115952146A (zh) 一种应用于直流控制保护装置关键信息监管的文件管理系统
CN115660615A (zh) 项目自动辅助系统及可视化方法
JP2023520634A (ja) 文脈完全性の維持
Gong et al. Qualitative Analysis of Commercial Services in MEC as Phased‐Mission Systems
Ji The G-asymptotic tracking property and G-asymptotic average tracking property in the inverse limit spaces under group action
US11392587B1 (en) Rule generation and data certification onboarding process for cloud database platform
US11966489B2 (en) Data certification process for cloud database platform
US11907186B2 (en) System and method for electronic data archival in a distributed data network
US20230185809A1 (en) Data Certification Process for Updates to Data in Cloud Database Platform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination