CN116933146A - 一种数字孪生空间实体的分类体系创建方法及装置 - Google Patents
一种数字孪生空间实体的分类体系创建方法及装置 Download PDFInfo
- Publication number
- CN116933146A CN116933146A CN202311204560.4A CN202311204560A CN116933146A CN 116933146 A CN116933146 A CN 116933146A CN 202311204560 A CN202311204560 A CN 202311204560A CN 116933146 A CN116933146 A CN 116933146A
- Authority
- CN
- China
- Prior art keywords
- entity
- space
- digital twin
- data
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000005516 engineering process Methods 0.000 claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 23
- 238000000513 principal component analysis Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000000547 structure data Methods 0.000 claims description 27
- 238000004891 communication Methods 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000013145 classification model Methods 0.000 claims description 12
- 235000019580 granularity Nutrition 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 10
- 238000007405 data analysis Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 239000002689 soil Substances 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000012706 support-vector machine Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 claims 15
- 230000002596 correlated effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012876 topography Methods 0.000 description 2
- 101100042793 Gallus gallus SMC2 gene Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 235000019587 texture Nutrition 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种数字孪生空间实体的分类体系创建方法及装置。该方法基于目标空间环境中的多源异构数据,构建目标空间环境的数字孪生空间实体;对各数字孪生空间实体的实体数据进行主成分分析,得到各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;基于各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果。该方法实现了对多个领域的数字孪生实体进行统一管理和调用。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种数字孪生空间实体的分类体系创建方法及装置。
背景技术
地理信息系统技术,通过将地理空间数据与属性数据进行关联,实现对空间实体的分类和管理。对地理实体数据的分类体系、颗粒度分割、描述与表达体系的研究还相对薄弱,没有考虑时空关联特性。分类后的地理实体的标识码需要具有唯一性,且要求是全球唯一的身份识别码,作为数据提取、分析、共享等用途的唯一标识,同时能在一定程度上反应其地理位置和类别属性,地理位置不但要体现其平面位置,还要体现出地下、地面、空中等位置特性,这就导致地理实体的唯一编码实现上面临着较大的困难,导致相关信息难聚合和共享交换困难。
数字孪生技术是近年来兴起的一种新型技术,它能够将真实世界中的物理实体以数字化形式进行建模,并在数字空间中模拟物理实体的行为和特性。数字孪生技术得到广泛应用,各行业均建立起空间环境不同领域的大量数字孪生实体,这些实体之间存在复杂的关联关系,现有的数字孪生空间实体分类分级及储存方法已经无法满足对实体的精细度需求,如何对这些实体进行有效分类和统一管理成为一个重要问题。数据汇聚难、关联难、计算难等问题成为制约发展的关键性技术瓶颈,为了实现空间环境信息在系统中的存贮、检索、管理、应用分析、集成与共享等功能,必须按照一定的分类原则和方法,将空间环境信息按照内容、性质与管理者的使用要求进行分类与编码,建立唯一标识编码体系。
然而,现有的技术涉及的数据较少进行实体化,基本是属性挂接,且各个领域的数据比较割裂,没有层级关系网表达实体之间的上下级关系,无法满足不同粒度层次的要求,对多个领域的数字孪生实体缺乏统一的管理和调用。
发明内容
本申请实施例的目的在于提供一种数字孪生空间实体的分类体系创建方法及装置,用以解决了现有技术存在的上述问题,可以将目标空间环境进行实体化,并按照数字孪生的内涵及其性质,对目标空间环境中的数字孪生空间实体进行分类分级,实现对多个领域的数字孪生实体统一的管理和调用。
第一方面,提供了一种数字孪生空间实体的分类体系创建方法,该方法可以包括:
基于目标空间环境中的多源异构数据,构建所述目标空间环境的数字孪生空间实体;其中,所述目标空间环境是集陆地、海洋、空中、太空、电磁、网络的全空间域一体,以及包含自然环境、社会人文环境、信息环境的全要素域一体的基础数据资源;所述数字孪生空间实体是描述客观所述目标空间环境中的基本单元,是所述空间环境中的具有一定空间形态、占据连续空间,且时空上与社会、经济、人口、地质、土壤、气象、网络电磁关联的环境信息,并与其他事物普遍联系的空间对象在数字空间的映射;所述数字孪生空间实体的实体数据包括实体结构数据、实体属性数据和关联关系数据;
对各数字孪生空间实体标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;所述目标实体数据包括实体结构数据和实体属性数据;
基于所述各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果。
在一个可能的实现中,创建不同类别的实体分类体系之后,所述方法还包括:
针对任一类别的实体分类体系,采用所述实体分类体系对一个支持向量机联合决策模型进行训练,得到相应类别的实体分类模型;所述相应类别的实体分类模型用于验证输入的数字孪生空间实体是否与自身所属类别相同。
在一个可能的实现中,对各数字孪生空间实体标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数,包括:
对所述各数字孪生空间实体的标准化后的实体数据进行降维,得到所述各数字孪生空间实体的数据分析矩阵;
采用正交变换算法,对所述各数字孪生空间实体的数据分析矩阵进行处理,得到所述各数字孪生空间实体的目标实体数据,所述目标实体数据包括实体结构数据和实体属性数据;
针对任一数字孪生空间实体,采用相关系数算法,对所述数字孪生空间实体的目标实体数据进行处理,得到不同目标实体数据间的相关系数矩阵;
基于所述相关系数矩阵进行特征值分解得到目标特征值对应的特征向量和相应目标实体数据,确定所述数字孪生空间实体的实体主成分特征向量;所述目标特征值为满足预设特征条件的特征值;
基于所述不同目标实体数据间的相关系数矩阵,确定所述不同目标实体数据间的相关系数。
在一个可能的实现中,基于所述各数字孪生空间实体的不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系,包括:
针对任一实体结构数据或实体属性数据,基于所述不同目标实体数据间的相关系数,分别检测不同数字孪生空间实体的相同目标实体数据间的相似程度;
采用层级聚类技术,将满足预设条件的相似程度对应的数字孪生空间实体归类到二元聚集体中;
针对任一实体结构数据或实体属性数据,基于所述不同目标实体数据间的相关系数,分别检测未聚类的数字孪生空间实体的不同目标实体数据间的相似程度,返回执行步骤:采用层级聚类技术,将满足预设条件的相似程度对应的数字孪生空间实体归类到二元聚集体中,直至遍历各聚类的数字孪生空间实体;
创建与聚类结果相对应类别的实体分类体系。
在一个可能的实现中,创建不同类别的实体分类体系之后,所述方法还包括:
按照数字孪生空间实体的实体特征数据和相应目标实体数据间的相似程度,对各类别的实体分类体系中的不同二元聚集体配置分类级别;
将未知类别的数字孪生空间实体分别输入不同类别的实体分类模型,获取所述数字孪生空间实体的目标类别;
基于所述目标类别的实体分类体系,并结合自然裂点法配置不同二元聚集体的分类级别,确定所述目标类别的数字孪生空间实体的分类级别。
在一个可能的实现中,创建不同类别的实体分类体系之后,所述方法还包括:
根据所述不同类别的实体分类体系,对所述各数字孪生空间实体进行标识,得到所述各数字孪生空间实体的唯一标识码;其中,所述唯一标识码包括分类码、位置码、时间码和顺序码;
基于所述各数字孪生空间实体的唯一标识码和不同类别的实体分类体系,对所述各数字孪生空间实体进行管理。
在一个可能的实现中,创建不同类别的实体分类体系之后,所述方法还包括:
以地球表面和球体空间一体化的网格剖分方法,结合地球圈层的划分方式,将所述目标空间环境以连续空间离散为不同层级、不同粒度的网格单元集合,形成网格化的地球空间剖分模型;
在经纬方向,对地球空间剖分模型以2n进行整数剖分至n=23级,得到所述各数字孪生空间实体对应的经纬方向网格;
在高度域方向,对地球空间剖分模型以剖分级数m,将高度域空间分为2m-1层,得到所述各数字孪生空间实体对应的高度方向网格。
第二方面,提供了一种数字孪生空间实体的分类体系创建装置,该装置可以包括:
构建单元,用于基于目标空间环境中的多源异构数据,构建所述目标空间环境的数字孪生空间实体;其中,所述目标空间环境是集陆地、海洋、空中、太空、电磁、网络的全空间域一体,以及包含自然环境、社会人文环境、信息环境的全要素域一体的基础数据资源;所述数字孪生空间实体是描述客观所述目标空间环境中的基本单元,是所述空间环境中的具有一定空间形态、占据连续空间,且时空上与社会、经济、人口、地质、土壤、气象、网络电磁关联的环境信息,并与其他事物普遍联系的空间对象在数字空间的映射;所述数字孪生空间实体的实体数据包括实体结构数据、实体属性数据和关联关系数据;
分析单元,用于对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;所述目标实体数据包括实体结构数据和实体属性数据;
聚类单元,用于基于所述各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果。
第三方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的数字孪生空间实体的分类体系创建方法步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的数字孪生空间实体的分类体系创建方法步骤。
本申请提供的数字孪生空间实体的分类体系创建方法,该方法基于目标空间环境中的多源异构数据,构建目标空间环境的数字孪生空间实体;目标空间环境是集陆地、海洋、空中、太空、电磁、网络的全空间域一体,以及包含自然环境、社会人文环境、信息环境的全要素域一体的基础数据资源;数字孪生空间实体是描述客观目标空间环境中的基本单元,是空间环境中的具有一定空间形态、占据连续空间,且时空上与社会、经济、人口、地质、土壤、气象、网络电磁关联的环境信息,并与其他事物普遍联系的空间对象在数字空间的映射;数字孪生空间实体的实体数据包括实体结构数据、实体属性数据和关联关系数据;对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;目标实体数据包括实体结构数据和实体属性数据;基于各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果。该方法将目标空间环境进行实体化,并按照数字孪生的内涵及其性质,对目标空间环境中的数字孪生空间实体进行分类体系的构建,以实现了对多个领域的数字孪生实体进行统一管理和调用。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种数字孪生空间实体的分类体系创建方法的流程示意图;
图2为本申请实施例提供的一种实体分类码的码位排列结构图;
图3为本申请实施例提供的一种高度域的网格编码结构图;
图4为本申请实施例提供的一种数字孪生空间实体的分类体系创建装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的数字孪生空间实体的分类体系创建方法中的目标空间环境是集陆地、海洋、空中、太空、电磁、网络(陆、海、空、天、电、网)全空间域一体,自然环境、社会人文环境、信息环境等全要素域一体,是新时代信息化、智能化建设的基础数据资源,是网络信息体系资源要素的重要组成部分。
基于数字孪生世界对陆、海、空、天、电、网等空间域中实体映射的需求,本申请提出一种新型的实体概念,即数字孪生空间实体——现实世界中具有一定空间形态、占据连续空间,且时空关联社会、经济、人口和地质、土壤、气象、网络电磁等环境信息,并与其他事物普遍联系的空间对象在数字空间的映射,由实体结构、属性和关联关系三部分构成,如房子由墙、窗户、屋檐等结构信息,材质、纹理等属性信息,以及和其他房子的拓扑关系构成。
(1)实体是现实世界客观存在的事物和现象,可能是物质、有形的,也可能是非物质的(如能量)、无形的,实体反映现实世界事物和现象的本质内涵。
数字孪生空间实体是描述客观世界中物理环境的基本单元,是现实空间中具有一定地理空间位置、几何形态、属性描述和无限时空分辨率的事物和现象,如水系、交通、居民地、山体等有形的物质,地形起伏形态、温度、湿度、重力场、磁力场等无形的现象或能量,大气环流、洋流等流体现象,以及地理单元、境界、行政区划等人为设想和规定的事物。数字孪生空间实体由结构、属性和关联关系三部分构成,可用{结构,属性,关联关系}三元组表示。
(2)数字孪生空间实体定义为,其中/>表示/>个组成实体的对象,每个实体对象由结构/>、属性/>、关联关系/>三个部分构成,/>为实体三元组信息采集时间。结构为实体几何结构和实体外观,用于表达实体的空间位置、空间范围或形态;属性用于表达实体可能携带的要素信息,除时间信息、空间位置属性以外的其他属性信息,包括结构化属性和非结构化属性;关联关系用于表达与实体相关的普遍联系。则数字孪生空间实体可以表示为/>。实体构建系统采用2000国家大地坐标系系统,1985国家高程基准,理论最低潮面深度基准,公元纪年和北京时间时间基准。
以某大厦实体为例,由裙楼、观景台、办公楼三个实体对象组成。裙楼实体对象由{三维模型表达的结构信息,类型、占地面积、高度、材质等表示的属性信息,与观景台/办公楼间存在的方位关系等关联关系}三元组构成;观景台实体对象由{三维模型表达的结构信息,占地面积、材质等表示的属性信息,与裙楼/办公楼之间存在方位关系等关联关系}三元组构成;办公楼实体对象由{三维模型表达的结构信息,层高、层数、材质、用途等表示属性信息,与大厦实体存在几何构成关系等关联关系}三元组构成,三个实体对象共同组合成大厦实体,实体信息可随时间动态更新。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1为本申请实施例提供的一种数字孪生空间实体的分类体系创建方法的流程示意图。如图1所示,该方法可以包括:
步骤S110、基于目标空间环境中的多源异构数据,构建目标空间环境的数字孪生空间实体。
数字孪生空间实体的实体数据可以包括实体结构数据、实体属性数据和关联关系数据。
具体的,按照空间环境各构成要素,综合考虑其本质内涵与运行机理,以及数据的历史现状,可将空间环境数据划分为:自然环境数据、设施环境数据、社会人文环境数据、网络电磁干扰数据,以及用于描述事件变化或者理化现象的机理数据五大类,这些数据覆盖陆、海、空、天、网、电等空间域。
根据实体的构建规则,获取实体相关的实体结构数据、实体属性数据、关联关系数据,基于目标空间环境中的地貌、地质、水文、植被、气象、海洋、太空等多源异构数据,获取自然环境类数据;基于目标空间环境中的作战区域、境界与政区、交通、市政管线、居民地、经济、人口、文化、政治法律等多源异构数据,获取社会人文类数据;基于目标空间环境中的重要经济设施、重要交通设施、城市重要机构及设施、重要后勤装备设施等多源异构数据,获取设施环境类数据;基于目标空间环境中的网络电磁载体、网络IP频段、电磁频谱等多源异构数据,获取网络电磁类数据;基于目标空间环境中的动态事件、物理、化学等多源异构数据,获取机理模型数据。
步骤S120、对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数。
具体的,对各数字孪生空间实体的标准化后的实体数据进行降维,得到各数字孪生空间实体的数据分析矩阵;
采用正交变换算法,对各数字孪生空间实体的数据分析矩阵进行处理,得到各数字孪生空间实体的目标实体数据;其中,目标实体数据可以包括实体结构数据和实体属性数据,可以理解的是,从空间实体的结构和属性的筛选,足以解释实体结果的独立成分。
针对任一数字孪生空间实体,采用相关系数算法,对数字孪生空间实体的目标实体数据进行处理,得到不同目标实体数据间的相关系数矩阵;
基于相关系数矩阵进行特征值分解得到目标特征值对应的特征向量和相应目标实体数据,确定数字孪生空间实体的实体主成分特征向量;其中,目标特征值为满足预设特征条件的特征值;
基于不同目标实体数据间的相关系数矩阵,确定不同目标实体数据间的相关系数。
在一个例子中,设原始变量输入数据(包含结构、属性和关联关系的实体数据)为,/>,⋯,/>,主成分分析后,得到的新变量为/>,/>,⋯,/>,它们是/>,/>,⋯,/>的线性组合(m<n)。新变量/>,/>,⋯,/>构成的坐标系是原坐标系经平移和正交旋转后得的,为:/>,/>,⋯,/>构成的空间为m维主超平面。
对数据进行标准化,如数字孪生实体的地理几何特征、现象影响范围、管理权属、军事活动范围等指标内容。数字孪生实体各数据变量之间并非完全独立,存在一定的内在联系,根据标准化后的数据,计算相关系数矩阵[R]。
其中,表示方差,/>表示协方差,/>表示原始数据,/>表示对象标准化后的数据。
构建特征矩阵 |λI-R|=0 其中,R为矩阵[R];λ为常数,表示特征值;I为单位矩阵[I],即对角线上元素为1,其余元素为0的方阵,大小与矩阵[R]相同。
通过计算相关系数矩阵得到特征值与特征向量,特征值即主成分中的方差,一般选用特征值大于1的实体主成分向量进行分析,计算方差贡献率,确定实体主成分特征向量。
步骤S130、基于各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对各数字孪生空间实体进行聚类,创建不同类别的实体分类体系。
其中,各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果。
针对任一实体结构数据或实体属性数据,基于不同目标实体数据间的相关系数,分别检测各数字孪生空间实体的不同目标实体数据间的相似程度;
采用层级聚类技术,将满足预设条件的相似程度对应的数字孪生空间实体归类到二元聚集体中;
针对任一实体结构数据或实体属性数据,基于不同目标实体数据间的相关系数,分别检测未聚类的不同数字孪生空间实体的相同目标实体数据间的相似程度,并返回执行步骤:采用层级聚类技术,将满足预设条件的相似程度对应的数字孪生空间实体归类到二元聚集体中,直至遍历各聚类的数字孪生空间实体;创建与聚类结果相对应类别的实体分类体系。
需要说明的是,本申请上述评估相似程度的方法可以是现有的欧几里得距离算法,或现有的皮尔逊相关系数算法,本申请在此不做赘述。
在一个可能的实现中,在采用正交变换算法,对各数字孪生空间实体的数据分析矩阵进行处理,得到各数字孪生空间实体的目标实体数据后,可以采用相关系数算法,对数字孪生空间实体的目标实体数据进行处理,得到不同目标实体数据间的相关系数矩阵的特征向量;该特征向量为目标实体数据的特征向量,其可以包括实体结构的特征向量和实体属性的特征向量。
针对任一实体结构数据或实体属性数据,分别检测未聚类的不同数字孪生空间实体的相同目标实体数据的特征向量间的距离,将特征向量进行归一化,通过欧几里得距离评估不同数字孪生空间实体间的相似程度,并返回执行步骤:采用层级聚类技术,将满足预设条件的相似程度对应的数字孪生空间实体归类到二元聚集体中,直至遍历各聚类的数字孪生空间实体;创建与聚类结果相对应类别的实体分类体系。
在一些实施例中,创建不同类别的实体分类体系之后,可以针对任一类别的实体分类体系,采用该实体分类体系对一个支持向量机联合决策模型进行训练,得到相应类别的实体分类模型;其中,相应类别的实体分类模型用于验证输入的数字孪生空间实体是否与自身所属类别相同。
具体的,将数字孪生实体相关的五大类数据进行主成分分析,并聚类后得到4层12类实体。即人工地物实体、地形地貌实体、地质实体、海洋实体、气象水文实体、军事区域实体、重要设施实体、太空环境实体、社会人文实体、事件实体、地球场实体,各类实体依据其数据特征及相似性划分为一级类、二级类和三级类。
本申请对数字孪生实体聚类后的结果,采用高斯径向基核函数映射到高维特征空间,并确定使类间间隔最大的超平面,将实体的数据划分开。
基于结构风险最小化准则,支持向量决定支持向量机网络拓扑结构,通过支撑向量确定超平面,并引入松弛变量,解决实体类间的重叠问题,可规避实体分类的局部极小以及过拟合现象。
基于支持向量机建立12个并行的二分类器,每个分类器评估对应编号类别的可信度,通过得分评判实体的所属分类,串联主成分分析法、层次聚类与支持向量机分类器,组建数字孪生实体分类的支持向量机联合决策模型,用于数字孪生空间环境实体的分类快速判别与主成分数据的空间区域划分。
基于“整体-局部”的认知规则,从“认知规则”和“关联规则”两个角度出发,再根据实体的结构、属性要素数据,通过实时计算,实体能够按需动态进行组合、聚合与分解,是数字孪生空间环境的基本单元。
进一步的,在业务应用中,可以按照数字孪生空间实体的实体数据特征和相应目标实体数据的相似程度,对各类别的实体分类体系中的不同二元聚集体配置分类级别,即一级类、二级类和三级类。
将未知类别的数字孪生空间实体分别输入不同类别的实体分类模型,获取数字孪生空间实体的目标类别;
基于目标类别的实体分类体系和配置的不同二元聚集体的分类级别,确定目标类别的数字孪生空间实体的分类级别。
可选的,针对任一类别的实体分类体系中不同的分类级别分别对应训练出相应分类级别的子实体分类模型,以在获取数字孪生空间实体的目标类别后,将该目标类别的数字孪生空间实体输入不同的子实体分类模型中,得到目标分类级别的子实体分类模型的输出结果,即该目标类别的数字孪生空间实体的分类级别。
进一步的,本申请还可以对输出目标类别、分类级别的数字孪生空间实体进行分析,确定数字孪生空间实体是属于单实体、组合实体还是聚合实体。其中,单实体是指不存在与其他实体的关联关系的实体,如路灯实体;组合实体是指该实体与同类实体间存在关联关系的实体,如房屋与楼层实体;聚合实体是指该实体与不同类的实体间存在关联关系的实体,如房屋与院落实体。
在一些实施例中,根据不同类别的实体分类体系,对各数字孪生空间实体进行标识,得到各数字孪生空间实体的唯一标识码;其中,唯一标识码包括分类码、位置码、时间码和顺序码;之后,可基于各数字孪生空间实体的唯一标识码和不同类别的实体分类体系,对各数字孪生空间实体进行管理。
具体的,1)根据数字孪生空间实体的实体分类体系,建立实体分类码;
建立实体分类码需要兼容通用标准,代码采用数字字母混合型,不定长字码位设计,码位排列体系分类框架,按门类、编码体系标识、是否自定义编码标识、分类码等级依次排列。
门类,用于标识数字孪生实体的基本分类,采用十进制2字节定长数字码表示。
编码体系标识,用于标识基本分类下所有收录的国际标准、行业标准、团体标准的顺序编号,采用十进制2字节定长数字码表示。
是否自定义编码标识,用于标识分类码是否使用现有标准分类,0标识采用现有标准,1标识采用自定义分类编码,采用十进制1字节定长数字码表示。
分类码,用于标识子类编码组合,当使用现有标准时,分类码直接使用该标准编码,采用该标准编码的编码格式。当使用自定义编码时,分类码采用三级分级编码组合,分为一级类,二级类,三级类,各级编码长度为十进制2字节定长数字码表示。按从属关系顺序编码,从1开始,空余位置补0。如图2所示。图2中的x表示可自定义的字符。
2)根据数字孪生空间实体的分类码、位置码、时间码和顺序码,获取对应的唯一标识编码:
实体编码是识别实体的唯一身份ID,通过此身份ID获取实体结构和属性信息,与其他实体建立关联关系。
本申请基于对实体分类和统一时空框架的研究为基础,立足当前多模态全域的空间实体数据,构建数字孪生空间实体唯一标识编码体系,分别由分类码、位置码、时间码和顺序码组成,为了方便索引提取,在每一类编码部分前用一字母作为其开头标识,其中,F作为分类分级码的开头标识字母;位置码中,G作为经纬网格码的开头标识字母,H作为高度域码的开头标识字母;T作为时间码的开头标识字母;S作为顺序码的开头标识字母。
(1)分类码
空间实体的分类由门类、编码体系标识、是否自定义编码标识、分类码等级类别层级组成,采用不定长字码位。
(2)位置码
位置码由经纬网格码和高度域码构成,经纬网格码用“G+m位四进制数字”编码,码长不定,最长为24位;高度域码用“圈层标识+二级及以下网格编码”组成,码长不定,最长为9位。
在立体空间环境网格剖分基础上,将空间实体按照经纬度方向或高度域方向抽象为点、线、面或体,通过“包围盒+定位点”方式判断实体剖分级别并进行位置码转换,一般情况下取实体的几何中心作为定位点,或根据实际应用需求,选取实体的某一关键点(如某建筑的入口点等)作为定位点。
针对实体定位点为(0,0)的特殊实体,以西南方向根据实体包围盒经纬方向的跨度确定最小剖分级别;针对实体中心在网格交叉点位置的特殊实体,依据其所在半球方向确定最小剖分级别。
例如,体育场包围盒在经度方向最大跨度为333m,纬度方向最大跨度为294m,高为69m,判断其经纬网格剖分至16级,由定位点到大地高的距离判断其在地表附近圈层第9级第97层,其位置码为G0013103222330222HfL090097。
(3)时间码
时间码采用SCII码技术,即14位数字不定长编码,以实体首次采集、调查或建库等的北京时间为依据。格式为“YYYYMMDDHHmmss”,其中YYYY为年的标识,MM为月的标识,DD为日的标识,HH为时的标识,mm为分的标识,ss为秒的标识。
(4)顺序码
顺序码采用4位定长数字或字母编码,当分类分级码、位置码和时间码完全一致时,以0~9、a~z的流水号顺序,从右至左依次编码,即每一位可取值有36个,顺序码不足4位则补“0”。顺序码初始设置时,可根据实体所在的位置,从东至西、从南至北依次编码。当新增实体时,应在与该实体同一空间网格、同一类别的实体顺序最大码后依次追加编码。通过Python技术对要素数据集的循环、更新以及对要素数据属性值顺序码重复值进行批处理。
3)存储各实体的唯一标识码和层级关系,实现对各数字孪生空间实体的管理:
数字孪生空间实体的实体数据的物理存储根据各类数据格式、内容、数据量的不同,采用图数据库、关系型数据库、分布式文件存储的存储混合模式,实现空间实体数据的分类存储与分级管理。使用JSON或XML文件存储系统存储各实体的分类码和层级关系网,实现数据的简单存储和管理。关系型数据库中,设计实体表、分类表、关系表等多张表进行存储和管理。图数据库中,使用节点、边等图元素进行存储和管理,主要使用Neo4j图数据库存储各实体之间的关系和作用,实现实体之间的图形化展示和可视化查询。通过对各实体进行分类分级管理,将实体按照不同的属性和特征进行划分和管理,方便实体的分类和查询。在实际应用中,需要根据具体情况选择合适的存储技术,并结合实体之间的关联结构进行综合分析,以确保分类体系的科学性和实用性。
在一些实施例中,以地球表面和球体空间一体化的网格剖分方法,结合地球圈层的划分方式,将目标空间环境以连续空间离散为不同层级、不同粒度的网格单元集合,形成网格化的地球空间剖分模型;
在经纬方向,对地球空间剖分模型以2n进行整数剖分至n=23级,得到各数字孪生空间实体对应的经纬方向网格;
在高度域方向,对地球空间剖分模型以剖分级数m,将高度域空间分为2m-1层,得到各数字孪生空间实体对应的高度方向网格。
具体的,空间环境三维网格体系的构建遵循空间实体全空间和全域信息覆盖的特征,以地球表面和球体空间一体化的网格剖分方法,结合地球圈层的划分方式,将数字孪生空间以连续空间离散为不同层级、不同粒度的网格单元集合,形成网格化的统一空间环境框架,实现空间环境多领域全要素的资源整合共享。
在经纬方向参照地球空间剖分模型,通过对空间扩展以2n进行整数剖分至23级,最小网格粒度为米级。经纬方向网格为实现等经度、等纬度四叉树剖分,依据地球空间剖分模型,将地球表面空间扩展为512°×512°的剖分空间,将经纬度网格分别扩展为64′×64′和64″×64″的网格,剖分后形成整分、整秒网格,在每一级网格中,对处于扩展区域没有实际空间意义的网格不再向下剖分,截取经纬方向网格剖分至23级((1/4)"网格,最小粒度为7.7m);
对于更小的实体,在23级网格内部以顺序码加以区分。经纬度坐标转换为编码的计算方式遵循《地球空间网格编码规则》,将实体在地球表面上的经纬度坐标转换为指定剖分级数的四进制不定长编码,0级由G标识;例如坐标39°59′57.6672″N,116°24′10.9764″E对应的十六级网格编码为G0013103222330222。
高度域方向为满足空间实体应用需求,针对实体在高度方向分布密度不均匀的特点,借用地理学圈层的概念,将高度域空间在一级剖分为地下外圈层、地表附近圈层、临近空间圈层、太空现象圈层和太空外圈层五个圈层再继续向下二分,任意剖分级数m,将高度域空间分为2m-1层;且高度域方向在不同圈层内网格划分粒度不同,越接近地表划分越细,地表附近层最小网格粒度达到米级粒度,避免剖分空间及编码长度冗余浪费。
高度码以“圈层标识(一级网格编码)+二级及以下网格编码”组成的不定长编码。例如,如图3所示的一种高度域的网格编码结构中圈层标识为以H开头的两个字符,二级及以下网格编码可以包括4位十进制剖分层数、2位十进制剖分层数和1位的层级字母标识L。图3中的X和x表示可自定义的字符。
圈层标识代表一级剖分的圈层编码,即地下外圈层为Hd,地表附近圈层为Hf,临近空间圈层为Hj,太空空间圈层为Hk,太空外圈层为Hs;“二级及以下网格编码”针对地表附近圈层、临近空间圈层和太空空间圈层继续剖分形成的网格进行编码,用“L+2位十进制剖分级数+4位十进制剖分层数”由地下至太空方向进行编码,其中地表附近圈层内剖分级数取值为02~13,圈层内层数取值为0001~4096;临近空间圈层内剖分级数取值为02~11,圈层内层数取值为0001~1024;太空空间圈层内剖分级数取值为02~10,圈层内层数取值为0001~0512。
例如,地表附近圈层内第2级第2层的网格高度码为HfL020002,第12级第4096层的网格高度码为HfL124096;临近空间圈层第3级第8层的网格高度码为HjL030008,第11级第1023层的网格高度码为HjL111023;太空空间圈层第3级第8层的网格高度码为HkL030008,第10级第512层的网格高度码为HkL100512。
与上述方法对应的,本申请实施例还提供一种数字孪生空间实体的分类体系创建装置,如图4所示,该装置包括:
构建单元410,用于基于目标空间环境中的多源异构数据,构建所述目标空间环境的数字孪生空间实体;其中,所述目标空间环境是集陆地、海洋、空中、太空、电磁、网络的全空间域一体,以及包含自然环境、社会人文环境、信息环境的全要素域一体的基础数据资源;所述数字孪生空间实体是描述客观所述目标空间环境中的基本单元,是所述空间环境中的具有一定空间形态、占据连续空间,且时空上与社会、经济、人口、地质、土壤、气象、网络电磁关联的环境信息,并与其他事物普遍联系的空间对象在数字空间的映射;所述数字孪生空间实体的实体数据包括实体结构数据、实体属性数据和关联关系;
分析单元420,用于对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;所述目标实体数据包括实体结构数据和实体属性数据;
聚类单元430,用于基于所述各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果。
本申请上述实施例提供的数字孪生空间实体的分类体系创建装置的各功能单元的功能,可以通过上述各方法步骤来实现,因此,本申请实施例提供的数字孪生空间实体的分类体系创建装置中的各个单元的具体工作过程和有益效果,在此不复赘述。
本申请实施例还提供了一种电子设备,如图5所示,包括处理器510、通信接口520、存储器530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。
存储器530,用于存放计算机程序;
处理器510,用于执行存储器530上所存放的程序时,实现如下步骤:
基于目标空间环境中的多源异构数据,构建所述目标空间环境的数字孪生空间实体;其中,所述目标空间环境是集陆地、海洋、空中、太空、电磁、网络的全空间域一体,以及包含自然环境、社会人文环境、信息环境的全要素域一体的基础数据资源;所述数字孪生空间实体是描述客观所述目标空间环境中的基本单元,是所述空间环境中的具有一定空间形态、占据连续空间,且时空上与社会、经济、人口、地质、土壤、气象、网络电磁关联的环境信息,并与其他事物普遍联系的空间对象在数字空间的映射;所述数字孪生空间实体的实体数据包括实体结构数据、实体属性数据和关联关系数据;
对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;所述目标实体数据包括实体结构数据和实体属性数据;
基于所述各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果。
上述提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图1所示的实施例中的各步骤来实现,因此,本申请实施例提供的电子设备的具体工作过程和有益效果,在此不复赘述。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数字孪生空间实体的分类体系创建方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数字孪生空间实体的分类体系创建方法。
本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附实施例意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。
Claims (9)
1.一种数字孪生空间实体的分类体系创建方法,其特征在于,所述方法包括:
基于目标空间环境中的多源异构数据,构建所述目标空间环境的数字孪生空间实体;其中,所述目标空间环境是集陆地、海洋、空中、太空、电磁、网络的全空间域一体,以及包含自然环境、信息环境的全要素域一体的基础数据资源;所述数字孪生空间实体是描述客观所述目标空间环境中的基本单元,是所述空间环境中的具有空间形态、占据连续空间,且时空上与社会、经济、人口、地质、土壤、气象、网络、电磁关联的环境信息,并与其他事物普遍联系的空间对象在数字空间的映射;所述数字孪生空间实体的实体数据包括实体结构数据、实体属性数据和关联关系数据;
对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;所述目标实体数据包括实体结构数据和实体属性数据;
基于所述各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果;
其中,对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数,包括:
对所述各数字孪生空间实体的标准化后的实体数据进行降维,得到所述各数字孪生空间实体的数据分析矩阵;
采用正交变换算法,对所述各数字孪生空间实体的数据分析矩阵进行处理,得到所述各数字孪生空间实体的目标实体数据,所述目标实体数据包括实体结构数据和实体属性数据;
针对任一数字孪生空间实体,采用相关系数算法,对所述数字孪生空间实体的目标实体数据进行处理,得到不同目标实体数据间的相关系数矩阵;
基于所述相关系数矩阵进行特征值分解得到目标特征值对应的特征向量和相应目标实体数据,确定所述数字孪生空间实体的实体主成分特征向量;所述目标特征值为满足预设特征条件的特征值;
基于所述不同目标实体数据间的相关系数矩阵,确定所述不同目标实体数据间的相关系数。
2.如权利要求1所述的方法,其特征在于,创建不同类别的实体分类体系之后,所述方法还包括:
针对任一类别的实体分类体系,采用所述实体分类体系对一个支持向量机联合决策模型网络进行训练,得到相应类别的实体分类模型;所述相应类别的实体分类模型用于验证输入的数字孪生空间实体是否与自身所属类别相同。
3.如权利要求1所述的方法,其特征在于,基于所述各数字孪生空间实体的不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系,包括:
针对任一实体结构数据或实体属性数据,基于所述不同目标实体数据间的相关系数,分别检测不同数字孪生空间实体的相同目标实体数据间的相似程度;
采用层级聚类技术,将满足预设条件的相似程度对应的数字孪生空间实体归类到二元聚集体中;
针对任一实体结构数据或实体属性数据,基于所述不同目标实体数据间的相关系数,分别检测未聚类的数字孪生空间实体的不同目标实体数据间的相似程度,返回执行步骤:采用层级聚类技术,将满足预设条件的相似程度对应的数字孪生空间实体归类到二元聚集体中,直至遍历各聚类的数字孪生空间实体;
创建与聚类结果相对应类别的实体分类体系。
4.如权利要求2所述的方法,其特征在于,创建不同类别的实体分类体系之后,所述方法还包括:
按照数字孪生空间实体的实体特征数据和相应目标实体数据间的相似程度,对各类别的实体分类体系中的不同二元聚集体配置分类级别;
将未知类别的数字孪生空间实体分别输入不同类别的实体分类模型,获取所述数字孪生空间实体的目标类别;
基于所述目标类别的实体分类体系,并结合自然裂点法配置不同二元聚集体的分类级别,确定所述目标类别的数字孪生空间实体的分类级别。
5.如权利要求1所述的方法,其特征在于,创建不同类别的实体分类体系之后,所述方法还包括:
根据所述不同类别的实体分类体系,对所述各数字孪生空间实体进行标识,得到所述各数字孪生空间实体的唯一标识码;其中,所述唯一标识码包括分类码、位置码、时间码和顺序码;
基于所述各数字孪生空间实体的唯一标识码和不同类别的实体分类体系,对所述各数字孪生空间实体进行管理。
6.如权利要求1所述的方法,其特征在于,创建不同类别的实体分类体系之后,所述方法还包括:
以地球表面和球体空间一体化的网格剖分方法,结合地球圈层的划分方式,将所述目标空间环境以连续空间离散为不同层级、不同粒度的网格单元集合,形成网格化的地球空间剖分模型;
在经纬方向,对地球空间剖分模型以2n进行整数剖分至n=23级,得到所述各数字孪生空间实体对应的经纬方向网格;
在高度域方向,对地球空间剖分模型以剖分级数m,将高度域空间分为2m-1层,得到所述各数字孪生空间实体对应的高度方向网格。
7.一种数字孪生空间实体的分类体系创建装置,其特征在于,所述装置包括:
构建单元,用于基于目标空间环境中的多源异构数据,构建所述目标空间环境的数字孪生空间实体;其中,所述目标空间环境是集陆地、海洋、空中、太空、电磁、网络的全空间域一体,以及包含自然环境、信息环境的全要素域一体的基础数据资源;所述数字孪生空间实体是描述客观所述目标空间环境中的基本单元,是所述空间环境中的具有空间形态、占据连续空间,且时空上与社会、经济、人口、地质、土壤、气象、网络、电磁关联的环境信息,并与其他事物普遍联系的空间对象在数字空间的映射;所述数字孪生空间实体的实体数据包括实体结构数据、实体属性数据和关联关系数据;
分析单元,用于对各数字孪生空间实体的标准化后的实体数据进行主成分分析,得到所述各数字孪生空间实体的实体主成分特征向量和相应数字孪生空间实体中不同目标实体数据间的相关系数;所述目标实体数据包括实体结构数据和实体属性数据;
聚类单元,用于基于所述各数字孪生空间实体中不同目标实体数据间的相关系数,采用层级聚类技术,对所述各数字孪生空间实体进行聚类,创建不同类别的实体分类体系;各类别的分类体系为具有相同类别的不同数字孪生实体的聚类结果;
所述分析单元,具体用于:
对所述各数字孪生空间实体的标准化后的实体数据进行降维,得到所述各数字孪生空间实体的数据分析矩阵;
采用正交变换算法,对所述各数字孪生空间实体的数据分析矩阵进行处理,得到所述各数字孪生空间实体的目标实体数据,所述目标实体数据包括实体结构数据和实体属性数据;
针对任一数字孪生空间实体,采用相关系数算法,对所述数字孪生空间实体的目标实体数据进行处理,得到不同目标实体数据间的相关系数矩阵;
基于所述相关系数矩阵进行特征值分解得到目标特征值对应的特征向量和相应目标实体数据,确定所述数字孪生空间实体的实体主成分特征向量;所述目标特征值为满足预设特征条件的特征值;
基于所述不同目标实体数据间的相关系数矩阵,确定所述不同目标实体数据间的相关系数。
8.一种电子设备,其特征在于,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存储的程序时,实现权利要求1-6任一所述的数字孪生空间实体的分类体系创建方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的数字孪生空间实体的分类体系创建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311204560.4A CN116933146B (zh) | 2023-09-19 | 2023-09-19 | 一种数字孪生空间实体的分类体系创建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311204560.4A CN116933146B (zh) | 2023-09-19 | 2023-09-19 | 一种数字孪生空间实体的分类体系创建方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116933146A true CN116933146A (zh) | 2023-10-24 |
CN116933146B CN116933146B (zh) | 2023-12-26 |
Family
ID=88384709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311204560.4A Active CN116933146B (zh) | 2023-09-19 | 2023-09-19 | 一种数字孪生空间实体的分类体系创建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116933146B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102945570A (zh) * | 2012-11-23 | 2013-02-27 | 华东师范大学 | 一种全空间三维数字地球模型的构建方法 |
US20170288989A1 (en) * | 2016-03-30 | 2017-10-05 | Adobe Systems Incorporated | Systems and Techniques for Determining Associations Between Multiple Types of Data in Large Data Sets |
US20210026920A1 (en) * | 2019-07-25 | 2021-01-28 | Wipro Limited | Method and device for determining a relation between two or more entities |
CN112818484A (zh) * | 2021-01-29 | 2021-05-18 | 山东大学 | 一种物理实体数字孪生综合实施能力评估方法及评估系统 |
CN114493500A (zh) * | 2021-12-31 | 2022-05-13 | 新奥数能科技有限公司 | 基于数字孪生技术的能源设备管理方法及装置 |
CN115039045A (zh) * | 2019-11-25 | 2022-09-09 | 强力物联网投资组合2016有限公司 | 用于工业环境的智能振动数字孪生系统和方法 |
CN115115796A (zh) * | 2022-07-04 | 2022-09-27 | 上海交通大学 | 一种基于语义Web技术的建筑数字孪生框架及建模方法 |
CN115310506A (zh) * | 2022-04-06 | 2022-11-08 | 沈阳航空航天大学 | 基于反馈控制系统的高维流数据聚类方法 |
CN115345987A (zh) * | 2022-07-08 | 2022-11-15 | 北京工商大学 | 一种基于标识解析体系的大米供应链数字孪生模型构建方法 |
US20220391414A1 (en) * | 2021-06-03 | 2022-12-08 | Sap Se | Numeric embeddings for entity-matching |
CN115954933A (zh) * | 2022-12-12 | 2023-04-11 | 国网智能电网研究院有限公司 | 电网数字孪生系统构建方法、装置、电子设备和存储介质 |
CN116127689A (zh) * | 2022-10-09 | 2023-05-16 | 阿里云计算有限公司 | 数字孪生空间的构建方法、装置及计算设备 |
CN116449771A (zh) * | 2023-05-10 | 2023-07-18 | 中国标准化研究院 | 一种数控机床的数字孪生建模方法 |
CN116756594A (zh) * | 2023-06-20 | 2023-09-15 | 中国电力科学研究院有限公司 | 一种电网数据异常点检测方法、系统、设备及介质 |
CN116756837A (zh) * | 2023-08-17 | 2023-09-15 | 广东省科学院广州地理研究所 | 一种数字孪生资源数据建库管理方法及装置 |
-
2023
- 2023-09-19 CN CN202311204560.4A patent/CN116933146B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102945570A (zh) * | 2012-11-23 | 2013-02-27 | 华东师范大学 | 一种全空间三维数字地球模型的构建方法 |
US20170288989A1 (en) * | 2016-03-30 | 2017-10-05 | Adobe Systems Incorporated | Systems and Techniques for Determining Associations Between Multiple Types of Data in Large Data Sets |
US20210026920A1 (en) * | 2019-07-25 | 2021-01-28 | Wipro Limited | Method and device for determining a relation between two or more entities |
CN115039045A (zh) * | 2019-11-25 | 2022-09-09 | 强力物联网投资组合2016有限公司 | 用于工业环境的智能振动数字孪生系统和方法 |
CN112818484A (zh) * | 2021-01-29 | 2021-05-18 | 山东大学 | 一种物理实体数字孪生综合实施能力评估方法及评估系统 |
US20220391414A1 (en) * | 2021-06-03 | 2022-12-08 | Sap Se | Numeric embeddings for entity-matching |
CN114493500A (zh) * | 2021-12-31 | 2022-05-13 | 新奥数能科技有限公司 | 基于数字孪生技术的能源设备管理方法及装置 |
CN115310506A (zh) * | 2022-04-06 | 2022-11-08 | 沈阳航空航天大学 | 基于反馈控制系统的高维流数据聚类方法 |
CN115115796A (zh) * | 2022-07-04 | 2022-09-27 | 上海交通大学 | 一种基于语义Web技术的建筑数字孪生框架及建模方法 |
CN115345987A (zh) * | 2022-07-08 | 2022-11-15 | 北京工商大学 | 一种基于标识解析体系的大米供应链数字孪生模型构建方法 |
CN116127689A (zh) * | 2022-10-09 | 2023-05-16 | 阿里云计算有限公司 | 数字孪生空间的构建方法、装置及计算设备 |
CN115954933A (zh) * | 2022-12-12 | 2023-04-11 | 国网智能电网研究院有限公司 | 电网数字孪生系统构建方法、装置、电子设备和存储介质 |
CN116449771A (zh) * | 2023-05-10 | 2023-07-18 | 中国标准化研究院 | 一种数控机床的数字孪生建模方法 |
CN116756594A (zh) * | 2023-06-20 | 2023-09-15 | 中国电力科学研究院有限公司 | 一种电网数据异常点检测方法、系统、设备及介质 |
CN116756837A (zh) * | 2023-08-17 | 2023-09-15 | 广东省科学院广州地理研究所 | 一种数字孪生资源数据建库管理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116933146B (zh) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Musa et al. | A review of geospatial-based urban growth models and modelling initiatives | |
Shyshatskyi et al. | Complex Methods of Processing Different Data in Intellectual Systems for Decision Support Systems | |
Ke et al. | A partitioned and asynchronous cellular automata model for urban growth simulation | |
Jochem et al. | Tools for mapping multi-scale settlement patterns of building footprints: An introduction to the R package foot | |
CN116863097B (zh) | 一种空间环境数据模型构建方法及装置 | |
Xia et al. | Exploring the effects of partitioned transition rules upon urban growth simulation in a megacity region: A comparative study of cellular automata-based models in the Greater Wuhan Area | |
CN115114455A (zh) | 一种基于本体的多粒度城市暴雨内涝知识图谱构建方法 | |
Dai et al. | Ensemble learning technology for coastal flood forecasting in internet-of-things-enabled smart city | |
Lunga et al. | Resflow: A remote sensing imagery data-flow for improved model generalization | |
Abdelmoty et al. | Deduction and deductive databases for geographic data handling | |
Xu et al. | Building function classification in Nanjing, China, using deep learning | |
CN117079148A (zh) | 城市功能区的识别方法、装置、设备和介质 | |
Zhuang et al. | Integrating a deep forest algorithm with vector‐based cellular automata for urban land change simulation | |
Zhao et al. | Image network teaching resource retrieval algorithm based on deep hash algorithm | |
CN115983385B (zh) | 空间环境实体构建方法及装置 | |
Gui et al. | In‐Depth Analysis of Railway and Company Evolution of Yangtze River Delta with Deep Learning | |
CN116933146B (zh) | 一种数字孪生空间实体的分类体系创建方法及装置 | |
Yu et al. | Integrating domain knowledge and graph convolutional neural networks to support river network selection | |
Rajabi et al. | Comparing Knowledge-Driven and Data-Driven Modeling methods for susceptibility mapping in spatial epidemiology: a case study in Visceral Leishmaniasis | |
Li et al. | Spatial Data Science | |
CN111339446B (zh) | 一种兴趣点挖掘方法、装置、电子设备和存储介质 | |
CN114565730A (zh) | 地图矢量样本的处理方法、设备和计算机可读存储介质 | |
Li et al. | Quantitative morphology of polder landscape based on SOM identification model: Case study of typical polders in the south of Yangtze River | |
Basnet et al. | Analysis of multifactorial social unrest events with spatio-temporal k-dimensional tree-based dbscan | |
CN113032372A (zh) | 一种基于ClickHouse数据库的空间大数据管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |