CN116361974A - 一种基于公路业务及数据网络的数据源重要性判别方法 - Google Patents

一种基于公路业务及数据网络的数据源重要性判别方法 Download PDF

Info

Publication number
CN116361974A
CN116361974A CN202310499531.9A CN202310499531A CN116361974A CN 116361974 A CN116361974 A CN 116361974A CN 202310499531 A CN202310499531 A CN 202310499531A CN 116361974 A CN116361974 A CN 116361974A
Authority
CN
China
Prior art keywords
data
network
importance
service
highway
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310499531.9A
Other languages
English (en)
Inventor
郭建华
史祥雨
李美叶
钟晓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202310499531.9A priority Critical patent/CN116361974A/zh
Publication of CN116361974A publication Critical patent/CN116361974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/18Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/02Data centres

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Geometry (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于公路业务及数据网络的数据源重要性判别方法,包括:通过梳理公路网的业务需求、数据源采集现状,获取各类数据资源,建立不同类数据资源之间的关联关系;构建公路业务及数据网络的拓扑结构,并生成公路业务及数据网络的邻接矩阵;确定业务及数据复杂网络中数据源节点的重要性评价指标,计算在不同指标下各数据源的评价指标参数值;基于指标参数值计算各评价指标的权重系数;计算复杂网络中各数据源的节点重要度,根据节点重要度确定所述网络中数据源的重要性排序列表。通过本发明的技术方案,提供了一种全面、客观、准确的数据源重要性判别方法,为交通数据治理、数据资源结构优化提供有效支撑。

Description

一种基于公路业务及数据网络的数据源重要性判别方法
技术领域
本发明涉及一种基于公路业务及数据网络的数据源重要性判别方法,属于交通管理技术领域。
背景技术
公路网的业务及数据资源是公路网管理的基础,业务及数据资源的重要性分析是保障公路网实现建设目标的关键,当前迫切需要采取一定的手段判别出公路网业务实现所需的关键数据源。其中,公路网管理业务主要包括监测指标业务、事件检测业务、交通流预测业务、事件影响分析业务、应急资源调度业务以及出行服务业务等;公路网的数据源包括车辆检测器数据、公路交调站数据、治超信息系统数据、普通公路收费数据、桥梁健康监测数据、ETC数据、手机信令数据、视频图像识别数据等。
然而,目前在公路网管理过程中,缺乏有效分析方法识别出数据资源中的重要数据源。在实际工作中往往从定性的角度出发来评判各数据源的重要性,缺乏定量分析。采用复杂网络分析方法对公路业务及数据资源的关键节点进行评估可以甄别出重要数据源,从而有针对性地对重要数据源进行优先维护和处理,提高数据资源的可用性,优化当前数据资源结构,进而提升路网的管理手段与服务水平。
发明内容
为实现上述目标,需要梳理公路网的管理业务,分析数据源采集现状,提取公路网的业务及业务数据、数据源及数据字段,获取业务及数据之间的关联关系,建立从业务模型到业务实现所需数据项,再到数据字段,最后到数据源系统之间的数据集成网络关系,构建公路业务及数据的复杂网络,为数据源的重要性判别提供理论支撑。基于此,本发明提供一种基于公路业务及数据网络的数据源重要性判别方法,可对公路网管理业务中的关键数据源进行甄别,从而克服现有技术的不足。
本发明为了解决上述技术问题采用以下技术方案:
本发明提出的一种基于公路业务及数据网络的数据源重要性判别方法,包括以下步骤:
步骤1、通过梳理公路网的业务需求、数据源采集现状,获取各业务的名称作为业务类数据资源,获取各业务实现所需的所有数据项作为数据项类数据资源,获取各数据源系统的名称作为数据源类数据资源,获取各数据源所提供的数据字段作为数据字段类数据资源,并建立不同类数据资源之间的关联关系;
步骤2、以步骤1获取的各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据网络的拓扑结构,并生成公路业务及数据网络的邻接矩阵;
步骤3、确定各网络节点的重要性评价指标值;其中,重要性评价指标包括度中心性、介数中心性以及接近度中心性;
步骤4、确定各重要性评价指标的权重系数;
步骤5、计算各网络节点的重要度,并根据网络节点的重要度确定各类数据资源的重要性排序列表。
作为本发明所述的一种基于公路业务及数据网络的数据源重要性判别方法进一步优化方案,所述步骤1中不同类数据资源之间的关联关系表示为:
A→B
式中,→表示指向关系,A→B表示A与B直接相关。
作为本发明所述的一种基于公路业务及数据网络的数据源重要性判别方法进一步优化方案,所述步骤2包括如下步骤:
步骤21、以步骤1获取的各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据网络的拓扑结构,表达式为:
G=(N,Z)
式中,G表示公路业务及数据网络的拓扑结构;N表示网络节点集合;Z表示网络边的集合;
步骤22、确定网络边的权重,网络边的权重是对应两个网络节点之间的直接相关的次数;
步骤23、确定网络边的方向,网络边的方向是由业务类数据资源指向数据项类数据资源,由数据项类数据资源指向数据字段类数据资源,由数据字段类数据资源指向数据源类数据资源;
步骤24、生成公路业务及数据网络的邻接矩阵M:
Figure BDA0004213339450000021
式中,miv为邻接矩阵的第i行第v列的元素,
Figure BDA0004213339450000022
n为网络节点总数。
作为本发明所述的一种基于公路业务及数据网络的数据源重要性判别方法进一步优化方案,所述步骤3包括如下步骤:
步骤31、计算节点的度中心性,网络节点i的度中心性xi1计算公式如下:
Figure BDA0004213339450000031
Figure BDA0004213339450000032
步骤32、计算节点的介数中心性,网络节点i的介数中心性xi2计算公式如下:
Figure BDA0004213339450000033
Figure BDA0004213339450000034
式中,ast表示网络节点s和网络节点t间最短路径的总条数;ast(i)表示网络节点s和网络节点t间最短路径中经过网络节点i的路径条数;
步骤34、计算节点接近度中心性,网络节点i的接近度中心性xi3计算公式如下:
Figure BDA0004213339450000035
式中,div表示网络节点i到网络节点v的最短距离,即网络节点i到网络节点v路径上网络边的权重之和的最小值。
作为本发明所述的一种基于公路业务及数据网络的数据源重要性判别方法进一步优化方案,所述步骤4包括如下步骤:
步骤41、对各重要性评价指标参数进行标准化处理;
步骤42、计算各重要性评价指标的信息熵,重要性评价指标j的信息熵Ej的计算公式如下:
Figure BDA0004213339450000036
Figure BDA0004213339450000037
式中,fij为xij的标准化值;j=1,2,3表示度中心性、介数中心性、接近度中心性;
步骤43、根据信息熵Ej的计算结果确定重要性评价指标的权重系数,权重计算公式如下:
Figure BDA0004213339450000038
式中,ωj表示为重要性评价指标j的权重系数。
作为本发明所述的一种基于公路业务及数据网络的数据源重要性判别方法进一步优化方案,所述步骤5包括如下步骤:
步骤51、确定重要性评价指标的正负理想解,计算公式如下:
Figure BDA0004213339450000041
Figure BDA0004213339450000042
式中,
Figure BDA0004213339450000046
表示重要性评价指标j的正理想解;/>
Figure BDA0004213339450000047
表示重要性评价指标j的负理想解;
步骤52、计算各网络节点的整体效益值和个体遗憾值:
Figure BDA0004213339450000043
Figure BDA0004213339450000044
式中,Pi表示网络节点i的整体效益值;Ni表示网络节点i的个体遗憾值;
步骤53、计算网络节点i的重要度Ii
Figure BDA0004213339450000045
式中,Pmax、Pmin分别表示所有网络节点的整体效益值中的最大值和最小值;Nmax、Nmin分别表示所有网络节点的个体遗憾值中的最大值和最小值。
本发明还提供一种基于公路业务及数据网络的数据源重要性判别系统,包括:
数据资源获取模块,用于通过梳理公路网的业务需求、数据源采集现状,获取各业务的名称作为业务类数据资源,获取各业务实现所需的所有数据项作为数据项类数据资源,获取各数据源系统的名称作为数据源类数据资源,获取各数据源所提供的数据字段作为数据字段类数据资源,并建立不同类数据资源之间的关联关系;
公路业务及数据网络构建模块,用于以各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据网络的拓扑结构,并生成公路业务及数据网络的邻接矩阵;
重要性评价指标确定模块,用于确定各网络节点的重要性评价指标值以及各重要性评价指标的权重系数;
重要性排序模块,用于计算各网络节点的重要度,并根据网络节点的重要度确定各类数据资源的重要性排序列表。
本发明还提供一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如上所述的方法。
本发明还提供一种电子设备,包括一个或多个处理器、一个或多个存储器以及一个或多个程序,其中一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如上所述方法的指令。
本发明采用以上技术方案带来的有益效果:
上述方案提出了一种基于公路业务及数据网络的数据源重要性判别方法,旨在解决实际公路网管理工作中重要数据源难以判别的问题,提供识别数据资源中关键数据源的有效手段,创新性的提出了一种基于公路业务及数据网络的数据源重要性判别方法。本发明实施例可有效辨别出公路业务及数据复杂网络中的关键数据源节点,有助于提升数据资源可用性,可在实际工作中有的放矢的重点维护和优化关键的数据源,为交通数据治理、数据资源结构优化提供有效的支撑。
附图说明
图1为一种基于公路业务及数据网络的数据源重要性判别方法的流程图;
图2为不同类数据资源之间的关联关系示意图。
具体实施方式
下面结合说明书附图,对本发明的具体实施方案进行详细描述。
本发明设计了一种基于公路业务及数据网络的数据源重要性判别方法,用于根据数据源的重要性排序列表定位公路网数据资源中关键数据源。在实际应用时,如图1所示,执行如下步骤1至步骤5。
步骤1、通过梳理公路网的业务需求、数据源采集现状,提取公路网的业务及业务数据、数据源及数据字段,并建立不同类数据资源之间的关联关系。
具体实施例应用中,如图2所示,给出不同类数据资源之间的关联关系示意图,具体分析步骤如下:
步骤11、围绕公路网管理业务开展数据需求分析,获取每一业务的名称作为业务类数据资源,记作Aa;获取各业务实现所需的所有数据项作为数据项类数据资源,记作Bb。本实施例中,公路网业务主要包括监测指标业务、事件检测业务、交通流预测业务、事件影响分析业务、应急资源调度业务以及出行服务等业务。
步骤12、根据数据源系统的数据采集现状,获取各数据源系统的名称作为数据源类数据资源,记作Dd;获取各数据源所提供的数据字段作为数据字段类数据资源,记作Cc。本实施例中,常见的数据源系统主要有交调站、车检器、普通公路收费系统和ETC等系统,整理出各数据源系统所存储的字段信息。
步骤13、不同类数据资源之间的关联关系可以表示为:
Aa→Bb→Cc→Dd
式中,→表示指向关系,两个不同类数据资源之间若存在指向关系则表明两者之间直接相关。如图2中业务A1与数据项B1,B2,B3等之间的关联关系,数据项B1与字段C1,C2之间的关联关系,数据源D1与多个数据字段C1,C3,C4等之间的关联关系。a=1,2,...,e1;b=1,2,...,e2;c=1,2,...,e3;d=1,2,...,e4;e1,e2,e3,e4分别表示所获取的各类数据资源的数量。
步骤2、以步骤1获取的各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据的复杂网络拓扑结构,并生成网络的邻接矩阵。
实际应用当中,业务及数据复杂网络拓扑结构的具体构建步骤如下:
步骤21、建立业务及数据复杂网络模型,将步骤1所获取的各数据资源Aa、Bb、Cc、Dd抽象为复杂网络的节点,不同类数据资源之间的关联关系抽象为网络的边,该网络共有n个节点、z条边,且节点之间由有向边连接,建立的业务及数据网络的图模型用G表示,表达式为:
G=(N,Z)
式中,G表示业务及数据的复杂网络图;N表示节点集合,N={i|i∈(0,n]};Z表示边的集合,Z={l|l∈(0,z]}。
步骤22、确定网络边的权重,以节点i与节点v之间的关联关系出现的次数作为边的权重miv,i,v=1,2,...,n。
步骤23、确定网络边的方向,网络中边的方向由Aa指向Bb,由Bb指向Cc,由Cc指向Dd
步骤24、生成网络邻接矩阵,计算复杂网络邻接矩阵M:
Figure BDA0004213339450000061
式中,miv为邻接矩阵的第i行第v列的元素,miv=0则表示节点i,v之间没有直接相连。
步骤3、确定业务及数据复杂网络中节点的重要性评价指标,并计算指标值,具体计算步骤如下:
步骤31、确定业务及数据网络中数据源节点的重要性评价指标,包括度中心性、介数中心性以及接近度中心性。
步骤32、计算节点度中心性,节点i的度中心性xi1计算公式如下:
Figure BDA0004213339450000071
Figure BDA0004213339450000072
式中,ki表示邻接矩阵中与节点i所有相邻节点边的权重和。
步骤33、计算节点介数中心性,节点i的介数中心性xi2计算公式如下:
Figure BDA0004213339450000073
Figure BDA0004213339450000074
式中,Fi表示节点i的介数;ast表示节点s和节点t间最短路径的总条数;ast(i)表示最短路径中经过节点i的路径条数。
步骤34、计算节点接近度中心性,节点i的接近度中心性xi3计算公式如下:
Figure BDA0004213339450000075
式中,div表示节点i到节点v的最短距离,即路径上边的权重之和的最小值;
步骤4、根据步骤3中计算出的网络节点各项指标参数,确定各指标的权重系数。
上述步骤在实际应用当中,具体执行如下步骤:
步骤41、参数标准化步骤,用于将步骤3计算的指标参数xij进行规范化处理,消除指标间量纲上的差异,指标的标准化处理如下:
Figure BDA0004213339450000076
式中,fij表示参数的标准化值;xij表示为节点i下指标j的评价值;
Figure BDA0004213339450000077
分别表示指标j下参数序列的最小和最大值;i=1,2,...,n;j=1,2,3;n为网络节点总数。
步骤42、计算各指标的信息熵,指标j的信息熵Ej的计算公式如下:
Figure BDA0004213339450000078
Figure BDA0004213339450000079
式中,pij为指标j下第i个节点的参数标准化值所占比重;Ej表示指标j的熵值,其值越小,说明该指标所提供的信息量越多,指标权重越大。
步骤43、根据信息熵Ej的计算结果确定指标权重系数,权重计算公式如下:
Figure BDA0004213339450000081
式中,ωj表示为指标j的权重系数。
步骤5、计算复杂网络中各数据源的节点重要度,对数据源节点的多项重要性评价指标进行加权融合,获取节点重要度,根据节点重要度确定所述网络中数据源的重要性排序列表。
实际应用当中,公路网业务及数据网络中各数据源的节点重要度具体计算步骤如下:
步骤51、确定参数标准化步骤的正负理想解,其计算公式如下:
Figure BDA0004213339450000082
Figure BDA0004213339450000083
式中,
Figure BDA0004213339450000087
表示指标j的正理想解,即指标j下参数标准化的最大值;/>
Figure BDA0004213339450000088
表示指标j的负理想解,即指标j下参数标准化的最小值;max1≤i≤n[fij]、min1≤i≤n[fij]分别表示最大值计算函数和最小值计算函数。
步骤52、计算复杂网络中各数据源节点的整体效益值Pi和个体遗憾值Ni
Figure BDA0004213339450000084
Figure BDA0004213339450000085
式中,Pi表示节点i的整体效益值,即所有指标效用值的加权和,代表节点i对于整个群体的效用水平;Ni表示节点i的个体遗憾值,即用指标效用值的最大值代表个体遗憾程度;max1≤j≤m[·]表示最大值计算函数。
步骤53、计算复杂网络中各数据源节点的重要度,根据节点重要度确定所述网络中数据源的重要性排序列表,节点i的重要度Ii计算公式如下:
Figure BDA0004213339450000086
式中,Pmax、Pmin分别表示为Pi中的最大值和最小值;Nmax、Nmin分别表示Ni中的最大值和最小值。
本发明还公开了一种基于公路业务及数据网络的数据源重要性判别系统,包括:
数据资源获取模块,用于通过梳理公路网的业务需求、数据源采集现状,获取各业务的名称作为业务类数据资源,获取各业务实现所需的所有数据项作为数据项类数据资源,获取各数据源系统的名称作为数据源类数据资源,获取各数据源所提供的数据字段作为数据字段类数据资源,并建立不同类数据资源之间的关联关系;
公路业务及数据网络构建模块,用于以各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据网络的拓扑结构,并生成公路业务及数据网络的邻接矩阵;
重要性评价指标确定模块,用于确定各网络节点的重要性评价指标值以及各重要性评价指标的权重系数;
重要性排序模块,用于计算各网络节点的重要度,并根据网络节点的重要度确定各类数据资源的重要性排序列表。
上述基于公路业务及数据网络的数据源重要性判别系统的技术方案与前述方法类似,这里不再赘述。
基于相同的技术方案,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如上述的基于公路业务及数据网络的数据源重要性判别方法。
基于相同的技术方案,一种电子设备,包括一个或多个处理器、一个或多个存储器以及一个或多个程序,其中一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如上述的基于公路业务及数据网络的数据源重要性判别方法的指令。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围内。

Claims (9)

1.一种基于公路业务及数据网络的数据源重要性判别方法,其特征在于,包括以下步骤:
步骤1、通过梳理公路网的业务需求、数据源采集现状,获取各业务的名称作为业务类数据资源,获取各业务实现所需的所有数据项作为数据项类数据资源,获取各数据源系统的名称作为数据源类数据资源,获取各数据源所提供的数据字段作为数据字段类数据资源,并建立不同类数据资源之间的关联关系;
步骤2、以步骤1获取的各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据网络的拓扑结构,并生成公路业务及数据网络的邻接矩阵;
步骤3、确定各网络节点的重要性评价指标值;其中,重要性评价指标包括度中心性、介数中心性以及接近度中心性;
步骤4、确定各重要性评价指标的权重系数;
步骤5、计算各网络节点的重要度,并根据网络节点的重要度确定各类数据资源的重要性排序列表。
2.根据权利要求1所述的一种基于公路业务及数据网络的数据源重要性判别方法,其特征在于,所述步骤1中不同类数据资源之间的关联关系表示为:
A→B
式中,→表示指向关系,A→B表示A与B直接相关。
3.根据权利要求1所述的一种基于公路业务及数据网络的数据源重要性判别方法,其特征在于,所述步骤2包括如下步骤:
步骤21、以步骤1获取的各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据网络的拓扑结构,表达式为:
G=(N,Z)
式中,G表示公路业务及数据网络的拓扑结构;N表示网络节点集合;Z表示网络边的集合;
步骤22、确定网络边的权重,网络边的权重是对应两个网络节点之间的直接相关的次数;
步骤23、确定网络边的方向,网络边的方向是由业务类数据资源指向数据项类数据资源,由数据项类数据资源指向数据字段类数据资源,由数据字段类数据资源指向数据源类数据资源;
步骤24、生成公路业务及数据网络的邻接矩阵M:
Figure FDA0004213339430000021
式中,miv为邻接矩阵的第i行第v列的元素,
Figure FDA0004213339430000022
n为网络节点总数。
4.根据权利要求3所述的一种基于公路业务及数据网络的数据源重要性判别方法,其特征在于,所述步骤3包括如下步骤:
步骤31、计算节点的度中心性,网络节点i的度中心性xi1计算公式如下:
Figure FDA0004213339430000023
Figure FDA0004213339430000024
步骤32、计算节点的介数中心性,网络节点i的介数中心性xi2计算公式如下:
Figure FDA0004213339430000025
Figure FDA0004213339430000026
式中,ast表示网络节点s和网络节点t间最短路径的总条数;ast(i)表示网络节点s和网络节点t间最短路径中经过网络节点i的路径条数;
步骤34、计算节点接近度中心性,网络节点i的接近度中心性xi3计算公式如下:
Figure FDA0004213339430000027
式中,div表示网络节点i到网络节点v的最短距离,即网络节点i到网络节点v路径上网络边的权重之和的最小值。
5.根据权利要求4所述的一种基于公路业务及数据网络的数据源重要性判别方法,其特征在于,所述步骤4包括如下步骤:
步骤41、对各重要性评价指标参数进行标准化处理;
步骤42、计算各重要性评价指标的信息熵,重要性评价指标j的信息熵Ej的计算公式如下:
Figure FDA0004213339430000028
Figure FDA0004213339430000031
式中,fij为xij的标准化值;j=1,2,3表示度中心性、介数中心性、接近度中心性;
步骤43、根据信息熵Ej的计算结果确定重要性评价指标的权重系数,权重计算公式如下:
Figure FDA0004213339430000032
式中,ωj表示为重要性评价指标j的权重系数。
6.根据权利要求5所述的一种基于公路业务及数据网络的数据源重要性判别方法,其特征在于,所述步骤5包括如下步骤:
步骤51、确定重要性评价指标的正负理想解,计算公式如下:
Figure FDA0004213339430000033
Figure FDA0004213339430000034
式中,
Figure FDA0004213339430000035
表示重要性评价指标j的正理想解;/>
Figure FDA0004213339430000036
表示重要性评价指标j的负理想解;
步骤52、计算各网络节点的整体效益值和个体遗憾值:
Figure FDA0004213339430000037
Figure FDA0004213339430000038
式中,Pi表示网络节点i的整体效益值;Ni表示网络节点i的个体遗憾值;
步骤53、计算网络节点i的重要度Ii
Figure FDA0004213339430000039
式中,Pmax、Pmin分别表示所有网络节点的整体效益值中的最大值和最小值;Nmax、Nmin分别表示所有网络节点的个体遗憾值中的最大值和最小值。
7.一种基于公路业务及数据网络的数据源重要性判别系统,其特征在于,包括:
数据资源获取模块,用于通过梳理公路网的业务需求、数据源采集现状,获取各业务的名称作为业务类数据资源,获取各业务实现所需的所有数据项作为数据项类数据资源,获取各数据源系统的名称作为数据源类数据资源,获取各数据源所提供的数据字段作为数据字段类数据资源,并建立不同类数据资源之间的关联关系;
公路业务及数据网络构建模块,用于以各类数据资源为网络节点,不同类数据资源之间的关联关系为网络边,构建公路业务及数据网络的拓扑结构,并生成公路业务及数据网络的邻接矩阵;
重要性评价指标确定模块,用于确定各网络节点的重要性评价指标值以及各重要性评价指标的权重系数;
重要性排序模块,用于计算各网络节点的重要度,并根据网络节点的重要度确定各类数据资源的重要性排序列表。
8.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,其特征在于,所述指令当由计算设备执行时,使得所述计算设备执行如权利要求1至6中任一所述的方法。
9.一种电子设备,其特征在于,包括一个或多个处理器、一个或多个存储器以及一个或多个程序,其中一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如权利要求1至6中任一所述方法的指令。
CN202310499531.9A 2023-05-06 2023-05-06 一种基于公路业务及数据网络的数据源重要性判别方法 Pending CN116361974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310499531.9A CN116361974A (zh) 2023-05-06 2023-05-06 一种基于公路业务及数据网络的数据源重要性判别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310499531.9A CN116361974A (zh) 2023-05-06 2023-05-06 一种基于公路业务及数据网络的数据源重要性判别方法

Publications (1)

Publication Number Publication Date
CN116361974A true CN116361974A (zh) 2023-06-30

Family

ID=86905113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310499531.9A Pending CN116361974A (zh) 2023-05-06 2023-05-06 一种基于公路业务及数据网络的数据源重要性判别方法

Country Status (1)

Country Link
CN (1) CN116361974A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116645087A (zh) * 2023-07-27 2023-08-25 交通运输部科学研究院 一种农村公路养护决策生成方法、系统、装置及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116645087A (zh) * 2023-07-27 2023-08-25 交通运输部科学研究院 一种农村公路养护决策生成方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
CN108415975B (zh) 基于bdch-dbscan的出租车载客热点识别方法
CN111614690B (zh) 一种异常行为检测方法及装置
CN110457175B (zh) 业务数据处理方法、装置、电子设备及介质
CN107809766B (zh) 一种用于网络优化的机器学习样本的生成方法及装置
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
CN112148986B (zh) 一种基于众包的top-N服务再推荐方法及系统
CN116361974A (zh) 一种基于公路业务及数据网络的数据源重要性判别方法
CN113469578A (zh) 基于多目标优化的业务策略生成方法、装置及系统
CN111159241B (zh) 一种点击转化预估方法及装置
CN109002996A (zh) 基于水费回收的风险评估方法及系统
CN111652403A (zh) 一种基于反馈修正的工作平台任务工作量预测方法
CN111090401B (zh) 存储设备性能预测方法及装置
CN115438190B (zh) 一种配电网故障辅助决策知识抽取方法及系统
CN107517474B (zh) 一种网络分析优化方法及装置
CN110880117A (zh) 虚假业务识别方法、装置、设备和存储介质
CN113516302B (zh) 业务风险分析方法、装置、设备及存储介质
CN113285977B (zh) 基于区块链和大数据的网络维护方法及系统
Huo et al. Traffic anomaly detection method based on improved GRU and EFMS-Kmeans clustering
CN113822412A (zh) 一种图节点标注方法、装置、设备及存储介质
CN113098884A (zh) 基于大数据的网络安全监控方法、云平台系统及介质
CN113158084A (zh) 移动轨迹数据处理的方法、装置、计算机设备及存储介质
Yang et al. Public bicycle prediction based on generalized regression neural network
CN106301880A (zh) 一种确定网络关系稳定度、互联网业务推荐方法和设备
Nair et al. Mining frequent patterns with generalized linear model for traffic density analysis
CN117391644B (zh) 一种合同管理过程中参数调整方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination