CN117953167A - 基于点云数据的高速公路附属设施建模方法及系统 - Google Patents
基于点云数据的高速公路附属设施建模方法及系统 Download PDFInfo
- Publication number
- CN117953167A CN117953167A CN202410353984.5A CN202410353984A CN117953167A CN 117953167 A CN117953167 A CN 117953167A CN 202410353984 A CN202410353984 A CN 202410353984A CN 117953167 A CN117953167 A CN 117953167A
- Authority
- CN
- China
- Prior art keywords
- tensor
- point cloud
- cloud data
- voxel
- description
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 134
- 230000000694 effects Effects 0.000 claims abstract description 194
- 238000012512 characterization method Methods 0.000 claims abstract description 172
- 230000001629 suppression Effects 0.000 claims abstract description 90
- 238000010276 construction Methods 0.000 claims abstract description 32
- 239000013598 vector Substances 0.000 claims description 325
- 238000010801 machine learning Methods 0.000 claims description 115
- 230000009466 transformation Effects 0.000 claims description 69
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 51
- 230000015654 memory Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 11
- 230000001965 increasing effect Effects 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 55
- 238000012545 processing Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 24
- 238000013528 artificial neural network Methods 0.000 description 22
- 238000013527 convolutional neural network Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 20
- 230000000007 visual effect Effects 0.000 description 16
- 230000004913 activation Effects 0.000 description 12
- 238000009877 rendering Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 238000011176 pooling Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000005291 magnetic effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000026676 system process Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种基于点云数据的高速公路附属设施建模方法及系统,在对高速公路附属设施进行建模时,采用了三维模型特征构建网络来构建模型的特征信息,该三维模型特征构建网络在调试阶段,依据对初始体素描述张量进行噪声抑制,增加了体素描述张量的表征质量,令噪声抑制体素描述张量对应的模型在数据内容上和设施点云数据学习样例呈现的内容一致性更强,在三维模型建模效果方面和生成效果信息学习样例描述的三维模型建模效果更一致。依据三维模型特征构建网络确定的噪声抑制后的体素描述张量和参考体素描述张量趋同,增加网络的精度,提升依据三维模型特征构建网络生成的体素描述张量的表征质量,使得根据体素描述张量完成的建模模型质量更高。
Description
技术领域
本申请涉及但不限于数据处理技术领域,尤其涉及一种基于点云数据的高速公路附属设施建模方法及系统。
背景技术
随着高速公路建设的不断发展,对附属设施进行精确、高效的建模成为提升公路设计、管理与维护水平的关键技术之一。传统的建模方法往往依赖于手动测量和设计师的经验,这不仅耗时耗力,而且在面对复杂多变的设施结构时,难以保证建模的准确性和效率。因此,寻求一种能够自动化、智能化地进行高速公路附属设施建模的方法显得尤为重要。近年来,点云数据的获取和处理技术得到了迅速发展,为高速公路附属设施的建模提供了新的可能性。点云数据可以通过激光扫描、立体摄影等手段快速获取,包含了设施表面的大量三维坐标信息,为建模提供了丰富的原始数据。然而,如何有效地利用这些点云数据进行建模,仍然是当前面临的一个技术挑战。另一方面,机器学习技术在图像处理、语音识别等领域取得了显著成果,其强大的学习和泛化能力使得机器学习方法在解决复杂问题时具有独特的优势。将机器学习技术应用于高速公路附属设施的建模过程中,有望实现对点云数据的自动解析和模型特征的智能提取,从而提高建模的准确性和效率。如何提高建模的自动化程度和效率,以及确保模型准确性和视觉效果,是需要考虑的技术问题。
发明内容
有鉴于此,本申请实施例至少提供一种基于点云数据的高速公路附属设施建模方法及系统。
本申请实施例的技术方案是这样实现的:
一方面,本申请实施例提供一种基于点云数据的高速公路附属设施建模方法,所述方法包括:获取目标设施点云数据和目标生成效果信息,所述目标设施点云数据用以呈现三维模型的模型内容,所述目标生成效果信息用以指示三维模型建模效果,所述目标设施点云数据为高速公路附属设施的点云数据;依据三维模型特征构建网络,根据所述目标设施点云数据和所述目标生成效果信息,确定第一体素描述张量,所述第一体素描述张量对应的三维模型的模型内容与所述目标设施点云数据呈现的模型内容一致,同时包含所述目标生成效果信息描述的三维模型建模效果;依据所述三维模型特征构建网络,对所述第一体素描述张量进行噪声抑制,得到目标体素描述张量;根据所述目标体素描述张量,构建目标设施三维模型;其中,所述三维模型特征构建网络通过以下步骤调试得到:获取设施点云数据学习样例、生成效果信息学习样例和参考体素描述张量,所述设施点云数据学习样例用以呈现三维模型的模型内容,所述生成效果信息学习样例用以指示三维模型建模效果,所述参考体素描述张量是依据注释获得的体素描述张量;依据机器学习网络,根据所述设施点云数据学习样例和所述生成效果信息学习样例,确定初始体素描述张量,所述初始体素描述张量和所述参考体素描述张量对应的三维模型的模型内容与所述设施点云数据学习样例呈现的模型内容一致,同时包含所述生成效果信息学习样例描述的三维模型建模效果;依据所述机器学习网络,对所述初始体素描述张量进行噪声抑制,得到噪声抑制体素描述张量;根据所述噪声抑制体素描述张量和所述参考体素描述张量,对所述机器学习网络进行调试,得到三维模型特征构建网络,所述三维模型特征构建网络用于生成与目标设施点云数据呈现的模型内容一致同时包含目标生成效果信息描述的三维模型建模效果的体素描述张量。
在一些实施例中,所述依据机器学习网络,根据所述设施点云数据学习样例和所述生成效果信息学习样例,确定初始体素描述张量,包括:依据机器学习网络,根据所述设施点云数据学习样例,确定多个三维坐标的点云语义表征向量;根据所述多个三维坐标的点云语义表征向量和所述生成效果信息学习样例,确定所述多个三维坐标的图像表征要素;根据所述多个三维坐标的图像表征要素、所述多个三维坐标的点云语义表征向量和所述生成效果信息学习样例,确定多个对象区域的体素描述张量;根据所述多个对象区域的体素描述张量和所述生成效果信息学习样例,确定所述初始体素描述张量。
在一些实施例中,所述依据机器学习网络,根据所述设施点云数据学习样例,确定多个三维坐标的点云语义表征向量,包括:依据机器学习网络,对所述设施点云数据学习样例进行嵌入映射,得到点云数据表征向量样例,所述点云数据表征向量样例包括多个三维坐标的点云语义表征向量和多个色度的点云语义表征向量;从所述点云数据表征向量样例中获取所述多个三维坐标的点云语义表征向量;所述方法还包括:对所述点云数据表征向量样例包括的各个色度的点云语义表征向量进行丢弃。
在一些实施例中,所述依据机器学习网络,对所述设施点云数据学习样例进行嵌入映射,得到点云数据表征向量样例,包括:依据机器学习网络,对所述设施点云数据学习样例进行特征聚焦,得到多个模型元素的第一表征向量,所述多个模型元素包括所述多个三维坐标和所述多个色度;针对任意一模型元素,对所述任意一模型元素的关联特征向量和第一表征向量进行非线性变换和仿射变换,得到所述任意一模型元素的第二表征向量,所述任意一模型元素为第一个模型元素时,所述任意一模型元素的关联特征向量为预设特征向量,所述任意一模型元素不是第一个模型元素时,所述任意一模型元素的关联特征向量根据所述预设特征向量和位于所述任意一模型元素之前的各个模型元素的第一表征向量得到;根据所述多个模型元素的第一表征向量和第二表征向量,确定所述点云数据表征向量样例。
在一些实施例中,任意一三维坐标的图像表征要素包括所述任意一三维坐标占对象区域的数量;所述根据所述多个三维坐标的图像表征要素、所述多个三维坐标的点云语义表征向量和所述生成效果信息学习样例,确定多个对象区域的体素描述张量,包括:根据所述多个三维坐标占对象区域的数量和所述多个三维坐标的点云语义表征向量,确定多个对象区域的基础表征向量;根据所述生成效果信息学习样例和所述多个对象区域的基础表征向量,确定所述多个对象区域的体素描述张量。
在一些实施例中,所述根据所述生成效果信息学习样例和所述多个对象区域的基础表征向量,确定所述多个对象区域的体素描述张量,包括:对所述生成效果信息学习样例和所述多个对象区域的基础表征向量进行特征聚焦,得到所述多个对象区域在一个或多个色彩分量的第一表征向量;针对任意一色彩分量,根据所述多个对象区域在所述任意一色彩分量的第一表征向量,确定所述任意一色彩分量的第一采集结果;针对任意一对象区域,根据所述生成效果信息学习样例确定第一仿射变换参变量,根据所述第一仿射变换参变量和所述任意一色彩分量的第一采集结果,对所述任意一对象区域在所述任意一色彩分量的第一表征向量进行仿射变换,得到所述任意一对象区域在所述任意一色彩分量的第二表征向量;根据所述多个对象区域在一个或多个色彩分量的第二表征向量,确定所述多个对象区域的体素描述张量。
在一些实施例中,所述依据所述机器学习网络,对所述初始体素描述张量进行噪声抑制,得到噪声抑制体素描述张量,包括:依据所述机器学习网络,根据所述生成效果信息学习样例和多个对象区域的体素描述张量,对所述初始体素描述张量进行第一次噪声抑制,得到所述第一次噪声抑制后的体素描述张量;根据所述生成效果信息学习样例和所述多个对象区域的体素描述张量,对前一次噪声抑制后的体素描述张量进行噪声抑制,得到噪声抑制后的体素描述张量,将对照次噪声抑制后的体素描述张量作为所述噪声抑制体素描述张量。
在一些实施例中,任意一对象区域的体素描述张量包括所述任意一对象区域在一个或多个色彩分量的第三表征向量;所述依据所述机器学习网络,根据所述生成效果信息学习样例和多个对象区域的体素描述张量,对所述初始体素描述张量进行第一次噪声抑制,得到所述第一次噪声抑制后的体素描述张量,包括:针对任意一色彩分量,依据所述机器学习网络,根据所述多个对象区域在所述任意一色彩分量的第三表征向量,确定所述任意一色彩分量的第二采集结果;针对任意一对象区域,根据所述生成效果信息学习样例确定第二仿射变换参变量,根据所述第二仿射变换参变量和所述任意一色彩分量的第二采集结果,对所述任意一对象区域在所述任意一色彩分量的第三表征向量进行仿射变换,得到所述任意一对象区域在所述任意一色彩分量的第四表征向量;根据所述多个对象区域在一个或多个色彩分量的第四表征向量,对所述初始体素描述张量进行第一次噪声抑制,得到所述第一次噪声抑制后的体素描述张量。
在一些实施例中,所述根据所述噪声抑制体素描述张量和所述参考体素描述张量,对所述机器学习网络进行调试,得到三维模型特征构建网络,包括:根据所述噪声抑制体素描述张量和所述参考体素描述张量,确定第一误差;根据所述第一误差确定机器学习网络的误差;根据所述机器学习网络的误差,对所述机器学习网络进行调试,得到三维模型特征构建网络。
在一些实施例中,所述根据所述第一误差确定机器学习网络的误差,包括:获取第二误差、第三误差、第四误差中的一个或多个;根据所述第二误差、所述第三误差、所述第四误差中的一个或多个和所述第一误差,确定所述机器学习网络的误差;其中,所述第二误差根据所述初始体素描述张量和所述参考体素描述张量计算得到,所述第三误差根据各次噪声抑制对应的噪声计算得到,所述第四误差根据各个三维坐标的图像表征要素计算得到。
在一些实施例中,所述依据三维模型特征构建网络,根据所述目标设施点云数据和所述目标生成效果信息,确定第一体素描述张量,包括:依据三维模型特征构建网络,根据所述目标设施点云数据,确定多个三维坐标的点云语义表征向量;根据所述多个三维坐标的点云语义表征向量和所述目标生成效果信息,确定所述多个三维坐标的图像表征要素;根据所述多个三维坐标的图像表征要素、所述多个三维坐标的点云语义表征向量和所述目标生成效果信息,确定多个对象区域的体素描述张量;根据所述多个对象区域的体素描述张量和所述生成效果信息,确定所述第一体素描述张量。
第二方面,本申请提供一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上所述方法中的步骤。
本申请的有益效果至少包括:本申请实施例在对高速公路附属设施进行建模时,采用了三维模型特征构建网络来构建模型的特征信息,该三维模型特征构建网络在调试阶段,依据机器学习网络,根据设施点云数据学习样例和生成效果信息学习样例确定初始体素描述张量,初始体素描述张量对应的三维模型的模型内容与设施点云数据学习样例呈现的模型内容一致同时包含生成效果信息学习样例描述的三维模型建模效果。接着,依据机器学习网络,对初始体素描述张量进行噪声抑制得到噪声抑制体素描述张量。依据对初始体素描述张量进行噪声抑制,增加了体素描述张量的表征质量,令噪声抑制体素描述张量对应的模型在数据内容上和设施点云数据学习样例呈现的内容一致性更强,在三维模型建模效果方面和生成效果信息学习样例描述的三维模型建模效果更一致。接着根据噪声抑制体素描述张量和参考体素描述张量,对机器学习网络进行调试得到三维模型特征构建网络,使得依据三维模型特征构建网络确定的噪声抑制后的体素描述张量和参考体素描述张量趋同,增加三维模型特征构建网络的精度,提升依据三维模型特征构建网络生成的体素描述张量的表征质量,使得根据体素描述张量完成的建模模型质量更高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请的技术方案。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1为本申请实施例提供的一种三维模型特征构建网络的调试的调试流程示意图。
图2为本申请实施例提供的一种计算机系统的硬件实体示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图和实施例对本申请的技术方案进一步详细阐述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。所涉及的术语“第一/第二/第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请的目的,不是旨在限制本申请。
本申请实施例提供一种基于点云数据的高速公路附属设施建模方法,该方法可以由计算机系统的处理器执行。其中,计算机系统可以指的是服务器、笔记本电脑、平板电脑、台式计算机等具备数据处理能力的设备。
本申请提供的基于点云数据的高速公路附属设施建模方法基于三维模型特征构建网络实现,为了便于理解本申请的方案,本申请实施例先介绍该三维模型特征构建网络的调试过程,具体地,如图1所示,图1为本申请实施例提供的一种基于点云数据的高速公路附属设施建模方法中,三维模型特征构建网络的调试的调试流程示意图,该方法包括如下步骤:可以包括以下步骤:
步骤S10:获取设施点云数据学习样例、生成效果信息学习样例和参考体素描述张量,设施点云数据学习样例用以呈现三维模型的模型内容,生成效果信息学习样例用以指示三维模型建模效果,参考体素描述张量是依据注释获得的体素描述张量,其中,目标设施点云数据为高速公路附属设施的点云数据。
点云数据是由大量的点组成的三维数据集,每个点都包含其在三维空间中的坐标信息。设施点云数据学习样例特指用于机器学习模型训练的点云数据样本,这些数据样本呈现了特定设施(如高速公路上的交通标志、护栏等)的三维形状和结构。例如,假设对一个交通标志建模时,其点云数据学习样例可能包含了标志牌的平面形状、边缘轮廓、文字或符号等特征的所有点的坐标信息。这些点云数据可以是通过三维扫描设备在真实世界中捕获的,或者通过计算机图形学技术生成的。
上述生成效果信息是指用于指示三维模型最终呈现效果的信息,包括颜色、纹理、光照效果等视觉特性。生成效果信息学习样例则是用于机器学习模型训练的这些效果的样本数据。例如,继续以交通标志为例,生成效果信息学习样例可能包括标志的颜色(如红色)、光泽度以及在不同光照条件下的表现等。这些信息可以是文本描述、图像示例或者特定的参数设置,用于指导模型在生成三维模型时如何应用这些效果。
体素(Voxel)是三维空间中的基本单元,类似于二维图像中的像素。体素描述张量是一种数据结构,用于描述三维模型中体素的属性和关系。参考体素描述张量是根据专家注释或其他可靠来源获得的,用于作为机器学习模型训练的“标准答案”。例如,假设已经有了一个正确的三维交通标志模型,那么其对应的参考体素描述张量可能包含了模型中每个体素的位置、颜色、透明度等信息。这些信息被编码成张量形式,便于机器学习模型进行处理和学习。在模型训练过程中,通过比较模型生成的体素描述张量与参考体素描述张量之间的差异,可以不断优化模型的性能。
步骤S10是基于点云数据的高速公路附属设施建模方法中,三维模型特征构建网络调试过程的训练样本准备步骤。在这一步骤中,首先,计算机系统获取设施点云数据学习样例,这些点云数据学习样例是三维模型内容的基础,它们由大量的点组成,每个点都有其在三维空间中的坐标。这些点云数据可以是通过激光雷达扫描仪或其他三维扫描设备获取的,用于精确地表示高速公路附属设施(如交通标志、路灯、护栏等)的实际形状和结构。例如,一个交通标志的点云数据可能包括标志牌的平面形状、边缘轮廓以及任何突出的特征(如文字或符号)。
其次,除了点云数据外,计算机系统还需要获取生成效果信息学习样例,这些信息不同于点云数据,它们不是直接描述物体的三维形状,而是指示了所期望的三维模型建模效果,可以通过文本或者指示标签的形式表示。这些效果可以包括对象的色度、透明度、表面纹理、光照效果等视觉特性,以及可能的动画或交互效果。例如,对于同一个交通标志,生成效果信息可能指定其表面应为特定的颜色(如红色),具有一定的光泽度,并且在不同的光照条件下应如何表现。
最后,计算机系统获取参考体素描述张量,体素描述张量是一种用于描述三维模型内部结构和特性的数据结构。参考体素描述张量是根据专家注释或其他可靠来源获得的,它们对应于根据点云数据和生成效果信息正确构建的三维模型。这些参考张量在机器学习模型的训练过程中起着关键作用,因为它们为模型提供了正确示例,又叫基准,帮助模型学习如何根据输入数据生成准确的三维模型。
步骤S20:依据机器学习网络,根据设施点云数据学习样例和生成效果信息学习样例,确定初始体素描述张量,初始体素描述张量和参考体素描述张量对应的三维模型的模型内容与设施点云数据学习样例呈现的模型内容一致,同时包含生成效果信息学习样例描述的三维模型建模效果。
步骤S20中的机器学习网络可以理解为一个初始的、待训练的神经网络。神经网络是一种模拟人脑神经元连接方式的算法,它能够通过学习输入与输出之间的关系来进行预测和分类等任务。在这个场景中,神经网络被用来根据输入的点云数据和生成效果信息学习样例,来生成一个初始的三维模型描述,即初始体素描述张量。具体来说,计算机系统将设施点云数据学习样例和生成效果信息学习样例作为输入,送入这个初始的神经网络中。设施点云数据学习样例包含了三维模型的形状和结构信息,而生成效果信息学习样例则提供了关于模型最终呈现效果(如颜色、纹理等)的指示。神经网络会根据这些输入数据进行处理,并输出一个初始体素描述张量。
这个初始体素描述张量是一个关键的数据结构,它描述了三维模型的内部结构和特性。与参考体素描述张量类似,它也包含了模型中每个体素的位置、属性等信息。然而,由于此时的神经网络还未经过充分的训练,因此生成的初始体素描述张量可能并不完全准确或符合期望。需要注意的是,初始体素描述张量所对应的三维模型在内容上应与设施点云数据学习样例所呈现的模型内容保持一致。同时,它还应包含生成效果信息学习样例所描述的三维模型建模效果。这意味着神经网络在生成初始体素描述张量时,需要同时考虑模型的形状、结构以及最终的呈现效果。
举例而言,假设对一个交通标志建模时,有一个包含标志牌形状和文字的点云数据学习样例,以及一个指示标志牌应为红色和具有特定光泽度的生成效果信息学习样例。将这些数据输入到神经网络中,神经网络会处理这些数据并输出一个初始体素描述张量。这个张量描述了标志牌的三维形状、文字的位置以及颜色和光泽度等特性。然后,可以使用这个初始体素描述张量来构建一个初始的三维模型,这个模型在内容上应与点云数据学习样例一致,并且具有红色和特定光泽度的呈现效果。
在一种实施方式中,步骤S20中,依据机器学习网络,根据设施点云数据学习样例和生成效果信息学习样例,确定初始体素描述张量,具体可以包括:
步骤S21:依据机器学习网络,根据设施点云数据学习样例,确定多个三维坐标的点云语义表征向量。
具体地,首先,设施点云数据学习样例是包含三维模型形状和结构信息的点云数据样本。这些点云数据由大量的点组成,每个点都有其在三维空间中的坐标。机器学习网络的任务是根据这些点云数据来确定每个点的语义表征,即点云语义表征向量。点云语义表征向量是一个描述点云数据中每个点语义信息的向量。它包含了点的位置、形状、结构等特征信息,是后续处理和理解点云数据的基础。通过机器学习网络,可以将原始的点云数据转换为更具表达能力的点云语义表征向量。
在步骤S21中,计算机系统根据设施点云数据学习样例,使用机器学习网络来确定多个三维坐标的点云语义表征向量。这个过程可以看作是对点云数据的编码或特征提取。机器学习网络会接收点云数据作为输入,并通过一系列的计算和处理,输出每个点的语义表征向量。
具体来说,机器学习网络可以采用深度学习方法,如卷积神经网络(CNN)或点云处理网络(如PointNet)等。这些网络能够学习点云数据的空间结构和特征,将每个点映射到一个高维向量空间中,从而得到点云语义表征向量。这些向量不仅包含了点的位置信息,还包含了形状、结构等更高级的语义信息。
例如,假设要对一个交通标志进行建模,其设施点云数据学习样例包含了标志牌的形状和文字信息。机器学习网络会根据这些点云数据来确定每个点的语义表征向量。这些向量可能描述了标志牌的边缘轮廓、文字的位置和形状等特征信息。通过这些点云语义表征向量,可以更准确地理解和描述交通标志的三维形状和结构。需要注意的是,步骤S21只是确定了多个三维坐标的点云语义表征向量,这些向量还需要与生成效果信息学习样例结合使用,才能进一步生成三维模型的图像表征要素和体素描述张量。在后续的步骤中,利用这些点云语义表征向量和其他信息,逐步构建出完整的三维模型描述。
作为一种实施方式,上述步骤S21,依据机器学习网络,根据设施点云数据学习样例,确定多个三维坐标的点云语义表征向量,具体可以包括:
步骤S211:依据机器学习网络,对设施点云数据学习样例进行嵌入映射,得到点云数据表征向量样例,点云数据表征向量样例包括多个三维坐标的点云语义表征向量和多个色度的点云语义表征向量。
具体来说,计算机系统接收设施点云数据学习样例作为输入。这些学习样例通常包含大量的点云数据,每个点都有其三维坐标和可能的其他属性(如颜色、强度等)。机器学习网络的任务是对这些点云数据进行嵌入映射,也就是将它们从原始空间映射到一个新的向量空间中。嵌入映射的目标是将每个点云数据点转换为一个向量表示,这个向量包含了该点的语义信息,即其位置、形状、结构等特征的抽象描述。这个过程可以通过各种机器学习算法来实现,如深度学习中的神经网络模型。
在步骤S211中,机器学习网络会对设施点云数据学习样例中的每个点进行嵌入映射,生成对应的点云语义表征向量。这些向量不仅包含了点的三维坐标信息,还可能包含其他与点的语义相关的特征信息,如颜色、纹理等。此外,根据实施方式的不同,点云语义表征向量可能还包括了多个色度的信息,用于描述点云数据中不同颜色或材质的属性。例如,色度可以为对比度、亮度等表示颜色属性的描述变量。
举个例子来说明,假设设施点云数据学习样例中包含了一个交通标志牌的点云数据。在步骤S211中,机器学习网络会对这些点云数据进行嵌入映射,生成一个包含多个三维坐标的点云语义表征向量集。这些向量不仅描述了标志牌的形状和结构信息(如边缘轮廓、文字形状等),还可能包含了其颜色信息(如红色和白色)。通过这些点云语义表征向量,可以更准确地理解和描述交通标志牌的三维形状和属性。
需要注意的是,步骤S211中使用的机器学习网络的具体实现方式可能会因应用场景和技术要求而有所不同。例如,可以使用卷积神经网络(CNN)或图神经网络(GraphNeural Network)等深度学习模型来处理点云数据。这些模型可以经过训练来学习如何有效地从原始点云数据中提取有用的语义信息,并将其转换为向量表示。
作为一种实施方式,步骤S211,依据机器学习网络,对设施点云数据学习样例进行嵌入映射,得到点云数据表征向量样例,具体可以包括:
步骤S2111:依据机器学习网络,对设施点云数据学习样例进行特征聚焦,得到多个模型元素的第一表征向量,多个模型元素包括多个三维坐标和多个色度。
步骤S2111中,对点云数据中的每个模型元素(在这里,一个坐标点或一个色度被视作一个模型元素)进行注意力处理,以便突出重要的特征信息并抑制不相关的信息。具体来说,计算机系统利用机器学习网络(如深度神经网络)对设施点云数据学习样例进行特征提取和聚焦。这个网络可以是预先训练好的,也可以是针对特定任务进行定制的。网络的结构和参数会根据具体的应用场景和技术要求进行选择和调整。
在特征聚焦的过程中,机器学习网络会对每个模型元素的特征进行加权处理,以强调对后续处理步骤有重要影响的特征。这种加权处理可以基于注意力机制来实现,例如使用自注意力(self-attention)或跨注意力(cross-attention)等方法来计算不同特征之间的相关性,并根据相关性得分来分配注意力权重。通过特征聚焦处理,计算机系统可以得到多个模型元素的第一表征向量。这些第一表征向量是原始特征经过加权处理后的结果,它们包含了原始特征中的重要信息,并且以向量的形式进行表示,便于后续的计算和处理。
以交通标志牌为例,假设设施点云数据学习样例中包含了一个交通标志牌的点云数据。在步骤S2111中,机器学习网络会对这些点云数据进行特征聚焦处理。处理过程中,网络会关注到标志牌的形状、结构、颜色等关键特征,并计算这些特征之间的相关性。根据相关性得分,网络会为每个特征分配不同的注意力权重,从而得到多个模型元素(如坐标点、色度等)的第一表征向量。这些第一表征向量将作为后续步骤的输入,用于进一步提取和利用标志牌的关键信息。
需要注意的是,步骤S2111中提到的机器学习网络的具体实现方式可能会因应用场景和技术要求而有所不同。例如,可以使用卷积神经网络(CNN)来处理图像数据中的特征聚焦问题;对于点云数据,可以使用PointNet、PointNet++等专门针对点云数据设计的深度学习模型来进行特征提取和聚焦。此外,为了提高特征聚焦的效果和准确性,还可以引入其他辅助技术或策略,如数据增强、正则化等。通过利用机器学习网络对设施点云数据学习样例进行特征聚焦处理,可以突出重要的特征信息并抑制不相关的信息,从而得到多个模型元素的第一表征向量。这些第一表征向量将作为后续步骤的输入,为后续的三维建模流程提供关键的特征信息支持。
步骤S2112:针对任意一模型元素,对任意一模型元素的关联特征向量和第一表征向量进行非线性变换和仿射变换,得到任意一模型元素的第二表征向量,任意一模型元素为第一个模型元素时,任意一模型元素的关联特征向量为预设特征向量,任意一模型元素不是第一个模型元素时,任意一模型元素的关联特征向量根据预设特征向量和位于任意一模型元素之前的各个模型元素的第一表征向量得到。
首先,对于非线性变换和仿射变换。非线性变换,也被称为激活函数,用于引入非线性因素,使得模型能够学习并表示更复杂的函数关系。常见的非线性激活函数有softmax、swish等。仿射变换则是一种线性变换,它保持了向量空间的基本性质,例如向量的加法和数量乘法。在神经网络中,仿射变换通常通过权重矩阵和偏置向量来实现。
在步骤S2112中,计算机系统针对每个模型元素进行如下操作:首先,根据模型元素的位置,确定其关联特征向量。如果模型元素是第一个,那么它的关联特征向量就是预设特征向量;如果不是第一个,那么它的关联特征向量将根据预设特征向量和位于该模型元素之前的各个模型元素的第一表征向量得到。这种处理方式可以使得模型在处理当前元素时能够考虑到之前的上下文信息,从而更好地捕捉数据中的依赖关系。
接下来,将关联特征向量和第一表征向量作为输入,进行非线性变换和仿射变换。这个过程可以包括多个阶段的变换和激活操作,例如先进行一次仿射变换,然后对变换结果进行非线性激活,再进行第二次仿射变换,以及对第二次仿射变换结果进行激活等。这样的变换过程可以使得模型能够学习到更复杂的特征表示。例如第一次激活例如为softmax或swish激活,第二次例如为ReLU或softmax激活
通过步骤S2112的处理,每个模型元素都会得到一个第二表征向量。这个向量是模型元素在经过非线性变换和仿射变换后的结果,它包含了模型元素的重要特征信息,并且以向量的形式进行表示,便于后续的计算和处理。
以交通标志牌为例,假设在步骤S2111中已经得到了标志牌的多个模型元素(如坐标点、色度等)的第一表征向量。在步骤S2112中,对这些第一表征向量进行进一步的变换和处理。例如,可以使用一个深度神经网络来实现非线性变换和仿射变换的过程。网络可以包括多个全连接层、激活函数层等组件,用于对输入的第一表征向量进行逐层变换和激活操作。通过这样的处理方式,可以得到每个模型元素的第二表征向量,这些向量将作为后续步骤的输入,用于进一步提取和利用标志牌的关键信息。
需要注意的是,步骤S2112中提到的非线性变换和仿射变换的具体实现方式可能会因应用场景和技术要求而有所不同。例如,可以选择不同的激活函数、调整网络的结构和参数等来满足特定的任务需求。此外,为了提高模型的性能和泛化能力,还可以引入其他辅助技术或策略,如正则化、批归一化等。
通过对模型元素的关联特征向量和第一表征向量进行非线性变换和仿射变换的处理方式,可以得到每个模型元素的第二表征向量。这些向量包含了模型元素的重要特征信息,并且以向量的形式进行表示,便于后续的计算和处理。同时,通过引入非线性因素和考虑上下文信息的方式,可以使得模型能够学习到更复杂的函数关系和依赖关系,从而更好地适应各种应用场景的需求。
步骤S2113:根据多个模型元素的第一表征向量和第二表征向量,确定点云数据表征向量样例。
具体来说,步骤S2113涉及到对之前步骤中计算得到的多个模型元素的第一表征向量和第二表征向量进行整合和处理。这些向量包含了设施点云数据中不同模型元素的关键特征信息,是后续三维建模流程中的重要输入。
在步骤S2113中,计算机系统可以采用不同的方法来根据第一表征向量和第二表征向量确定点云数据的表征向量样例。一种常见的方法是将这些向量进行拼接或融合,以形成一个更全面的表征向量。这个过程可以通过简单的向量拼接操作来实现,也可以通过更复杂的融合方法,如加权平均、注意力机制等来实现。
另一种方法是使用机器学习模型(如神经网络)来进一步处理这些向量。例如,可以设计一个多层感知机(MLP)或卷积神经网络(CNN)等模型,将第一表征向量和第二表征向量作为输入,通过模型的训练和学习,输出一个更紧凑、更有代表性的表征向量样例。这样的模型可以根据具体的应用场景和技术要求进行设计和调整。
需要注意的是,在确定点云数据表征向量样例时,还需要考虑向量的维度和数值范围等因素。为了确保表征向量的有效性和可计算性,可能需要进行一些额外的处理,如向量归一化、降维等。
以交通标志牌为例,假设在步骤S2111和S2112中已经得到了标志牌的多个模型元素(如坐标点、色度等)的第一表征向量和第二表征向量。在步骤S2113中,计算机系统可以将这些向量进行拼接或融合,形成一个更全面的表征向量样例。例如,可以将每个模型元素的第一表征向量和第二表征向量进行对应位置的拼接,形成一个更长的向量;或者可以使用加权平均等方法,将不同模型元素的向量进行融合,得到一个更紧凑的表征向量样例。这个表征向量样例将作为后续步骤的输入,用于进一步提取和利用标志牌的关键信息。
通过整合和处理多个模型元素的第一表征向量和第二表征向量,确定了设施点云数据的表征向量样例。这个过程是前述步骤的综合应用,旨在提取和利用点云数据中的关键特征信息,为后续的三维建模流程提供重要的输入支持。
步骤S212:从点云数据表征向量样例中获取多个三维坐标的点云语义表征向量。
步骤S212从点云数据表征向量样例中获取多个三维坐标的点云语义表征向量。这些点云语义表征向量是机器学习网络对设施点云数据学习样例进行嵌入映射后得到的结果,它们包含了原始点云数据中每个点的语义信息,即关于点的位置、形状、结构等特征的抽象描述。
具体来说,计算机系统在执行步骤S212时,会对步骤S211中生成的点云数据表征向量样例进行处理。这个样例中包含了多个三维坐标的点云语义表征向量,每个向量都对应于点云数据中的一个点,并且携带了该点的语义信息。从这些向量中提取出感兴趣的部分,即多个三维坐标的点云语义表征向量,以供后续步骤使用。提取过程可能涉及对点云数据表征向量样例进行索引、筛选或解码等操作,以确保获取到正确的点云语义表征向量。这些操作的具体实现方式可能因应用场景和技术要求而有所不同。例如,可以使用数组索引或条件筛选等方法来从样例中提取出特定的点云语义表征向量。
基于步骤S211和S212,本申请实施例提供的方法还包括:对点云数据表征向量样例包括的各个色度的点云语义表征向量进行丢弃。
具体来说,计算机系统对步骤S211中生成的点云数据表征向量样例进行进一步处理。它会识别出样例中与色度相关的点云语义表征向量,并将这些向量从后续的处理流程中排除或隐藏起来。这样做的目的是减少计算复杂度、提高处理效率,或者是因为在某些应用场景中色度信息并不是关键因素。
丢弃色度的点云语义表征向量可以通过多种方式实现。一种简单的方法是在生成点云数据表征向量样例时,就不包含色度信息。另一种方法是在后续处理流程中,通过设置筛选条件或掩码来忽略与色度相关的向量部分。这些实现方式的具体选择取决于应用场景和技术要求。
需要注意的是,丢弃色度的点云语义表征向量并不意味着完全忽略色度信息。在某些情况下,可能仍然需要利用色度信息来进行辅助分析或渲染等操作。因此,在实际应用中,需要根据具体需求来决定是否丢弃色度的点云语义表征向量,以及何时和如何进行丢弃。
以交通标志牌为例,假设在步骤S211中生成的点云数据表征向量样例包含了标志牌的形状、结构和颜色等信息。但是,在后续的三维建模流程中,主要关注标志牌的形状和结构特征,而颜色信息对于建模结果并不是关键因素。因此,可以选择丢弃与颜色相关的点云语义表征向量,以减少计算复杂度和提高处理效率。这样做不会影响到标志牌的基本形状和结构的建模准确性。
通过丢弃不必要的色度信息,可以优化处理流程、提高计算效率,并更好地关注对建模结果至关重要的特征信息。
步骤S22:根据多个三维坐标的点云语义表征向量和生成效果信息学习样例,确定多个三维坐标的图像表征要素。
需要明确的是,点云语义表征向量是在步骤S21中通过机器学习网络处理设施点云数据学习样例后得到的。这些向量编码了点云数据中每个点的语义信息,如位置、形状和结构等。它们是对原始点云数据的高层次抽象,有助于更深入地理解和分析三维模型的特性。
而生成效果信息学习样例,则是用来指示三维模型最终呈现效果的信息,包括颜色、纹理、光照效果等视觉特性。在步骤S22中,这些样例提供了关于如何在三维空间中渲染模型的关键信息。计算机系统在执行步骤S22时,会将点云语义表征向量和生成效果信息学习样例作为输入,通过特定的算法或神经网络进行处理。这个处理过程可能包括特征的提取、融合和转换等操作,目的是将语义信息和生成效果信息结合起来,形成能够完整描述三维模型在每个坐标点上的图像特征。具体来说,图像表征要素(图像特征)可能包括颜色值、纹理坐标、法线方向、材质属性等。这些要素共同定义了模型在渲染时的外观和视觉效果。例如,颜色值决定了模型各部分的色彩,纹理坐标用于将二维纹理图像映射到三维模型表面,法线方向则影响了光照计算的结果,从而决定了模型的明暗变化。
以交通标志为例,假设在步骤S21中已经得到了标志牌的边缘轮廓和文字的点云语义表征向量。在步骤S22中,结合生成效果信息学习样例,如标志牌的红色和特定光泽度,来确定这些轮廓和文字在三维空间中的图像表征要素。这可能包括为每个轮廓和文字点分配相应的颜色值、纹理坐标和法线方向等信息。这样,在后续的渲染过程中,就能够根据这些图像特征来正确地绘制出具有真实感和立体感的交通标志模型。
需要注意的是,步骤S22中使用的算法或神经网络的具体实现方式可能因应用场景和技术要求而有所不同。常见的神经网络结构包括卷积神经网络(CNN)、生成对抗网络(GAN)等,它们在处理图像和视觉信息方面具有良好的性能。然而,在具体应用中,可能需要根据点云数据的特性和生成效果信息的要求来定制或调整网络结构,以达到最佳的处理效果。
步骤S23:根据多个三维坐标的图像表征要素、多个三维坐标的点云语义表征向量和生成效果信息学习样例,确定多个对象区域的体素描述张量。
步骤S23中,根据多个三维坐标的图像表征要素、点云语义表征向量以及生成效果信息学习样例,来确定多个对象区域的体素描述张量。
图像表征要素(即图像特征)包含了模型表面各点的颜色、纹理等视觉信息,这些信息对于生成具有真实感的渲染结果至关重要。点云语义表征向量则提供了模型内部结构的深层次理解,它包含了关于点云数据中每个点的位置、形状和结构等的抽象描述。生成效果信息学习样例则进一步补充了关于模型最终呈现效果(如光照、阴影等)的指示。在步骤S23中,计算机系统将这些不同类型的信息进行融合。这可能涉及到对图像特征和点云语义表征向量的对应关系进行匹配,以确保它们能够在三维空间中正确地对齐。接着,通过特定的算法或神经网络模型,分析这些信息,以识别出模型中的不同对象区域。对象区域是指模型中具有相对独立意义和完整性的部分,例如一个交通标志牌、一个路灯等。每个对象区域都可能包含多个像素点,并且这些点之间通过其图像特征和点云语义表征向量相互关联。
一旦识别出对象区域,计算机系统就会为每个区域生成一个体素描述张量。体素描述张量是一个数据结构,它用于描述三维空间中一个体积元素(即体素)的属性。可以理解,点云数据的一个个点云数据点对应的特征结构是表征向量,多个点云数据点的表征向量进行聚合后即构成一个多维数据结构,即张量(在深度学习和多维数据处理中,张量是一个核心概念,它可以被看作是一个多维数组。对于点云数据,每个点可以有一个与之相关的特征向量,这个特征向量可以是由PointNet++或其他特征提取方法得到的。当你有多个点,每个点都有一个特征向量时,这些特征向量可以组合成一个更高维的数据结构,即张量)。在这个上下文中,体素描述张量可能包含了关于对象区域内部各点的位置、形状、颜色、纹理等信息。这些信息以张量的形式进行编码,便于后续的计算和处理。
以交通标志为例,假设在前面的步骤中已经识别出了一个标志牌作为一个对象区域。在步骤S23中,根据这个区域的图像特征(如颜色和纹理)和点云语义表征向量(如形状和结构),以及生成效果信息学习样例(如光照条件),来生成一个体素描述张量。这个张量将包含足够的信息来在三维空间中精确地表示这个交通标志牌的外观和属性。
需要注意的是,步骤S23中使用的算法或神经网络模型的具体实现方式可能会因应用场景和技术要求而有所不同。例如,可以使用深度学习中的卷积神经网络(CNN)来提取和分析图像特征,同时使用图神经网络(Graph Neural Network)来处理点云数据中的结构信息。这些网络模型可以经过训练来学习如何根据输入信息生成准确的体素描述张量。
此外,为了提高建模的准确性和效率,还可以在这一步骤中引入其他辅助技术,如注意力机制、多尺度分析等。这些技术可以帮助模型更好地关注重要的信息,并忽略不相关的细节,从而生成更加精确和紧凑的体素描述张量。
作为一种实施方式,任意一三维坐标的图像表征要素包括任意一三维坐标占对象区域的数量;基于此,步骤S23,根据多个三维坐标的图像表征要素、多个三维坐标的点云语义表征向量和生成效果信息学习样例,确定多个对象区域的体素描述张量,具体可以包括:
步骤S231:根据多个三维坐标占对象区域的数量和多个三维坐标的点云语义表征向量,确定多个对象区域的基础表征向量。
本申请实施例中,任意一三维坐标的图像表征要素包括三维坐标的坐标覆盖像素数量(即对象区域),机器学习网络可以包括特征延展组件,针对任意一三维坐标,依据特征延展组件根据三维坐标占对象区域的像素数量,将三维坐标的点云语义表征向量进行延展,得到三维坐标占据的各个对象区域的基础表征向量。例如,三维坐标占3个像素点,则可以依据特征延展组件将三维坐标的点云语义表征向量复制为3个,一个三维坐标的点云语义表征向量为三维坐标占据的一个对象区域的基础表征向量。如此,三维坐标占对象区域的基础表征向量用以指示三维坐标的语义。本申请实施例不对特征延展组件的组成架构和参变量进行约束,特征延展组件可以根据三维坐标占对象区域的数量,依据复制把三维坐标序列特征延展成为对齐到对象区域时各像素的基础表征向量,即一个初始特征向量。
步骤S232:根据生成效果信息学习样例和多个对象区域的基础表征向量,确定多个对象区域的体素描述张量。
本申请实施例中,机器学习网络还可以包括效果嵌入组件(或称为效果编码组件),针对任意一对象区域,依据效果嵌入组件将生成效果信息学习样例和该对象区域的基础表征向量进行整合以获得该对象区域的体素描述张量,依据对象区域的体素描述张量描述在生成效果信息学习样例描述的三维模型建模效果的情况下对象区域的语义。其中,若生成效果信息学习样例为文本或标签,那么可以依据效果嵌入组件先把文本或标签进行量化,得到对应的向量表征,然后将效果表征向量和对象区域的基础表征向量进行整合(如拼接、相加)。如果生成效果信息学习样例本身就是一个效果表征向量,那么可以依据效果嵌入组件直接将效果表征向量和对象区域的基础表征向量进行整合。
效果嵌入组件的架构以及参变量不进行限定,例如,效果嵌入组件包括conv(卷积模块)、pooling(池化模块)、attention(注意力模块)、MHA(多头注意力模块)、BN或LN(归一化模块)中的一个或多个,对于不同类别的效果嵌入组件,可以设置不同的嵌入机制。在一个示例中,效果嵌入组件包括attention(注意力模块)和conv(卷积模块),则依据效果嵌入组件依次对生成效果信息学习样例和任意一对象区域的基础表征向量进行特征聚焦和卷积,得到对象区域的体素描述张量。
作为一种实施方式,步骤S232,根据生成效果信息学习样例和多个对象区域的基础表征向量,确定多个对象区域的体素描述张量,具体可以包括:
步骤S2321:对生成效果信息学习样例和多个对象区域的基础表征向量进行特征聚焦,得到多个对象区域在一个或多个色彩分量的第一表征向量。
在三维建模和计算机视觉任务中,色彩信息对于准确描述对象区域的特性至关重要。步骤S2321对生成效果信息学习样例和对象区域的基础表征向量进行特征聚焦,以提取与色彩相关的关键信息。特征聚焦是一种数据处理技术,旨在从原始数据中提炼出与目标任务最相关的特征。例如,效果嵌入组件包括根据特征聚焦机制(例如注意力机制)的网络模块,针对任意一对象区域,可以根据特征聚焦机制和生成效果信息学习样例,对对象区域的基础表征向量进行特征聚焦,得到对象区域的第一表征向量。
任意一对象区域的第一表征向量包括对象区域在一个或多个色彩分量的第一表征向量。图像对应三个颜色通道,一个颜色通道即一个色彩分量在本步骤中,对生成效果信息学习样例和多个对象区域的基础表征向量进行分析,识别并提取出与色彩分量(如红色、绿色、蓝色通道)相关的特征。具体来说,计算机系统利用一系列滤波器或卷积核对基础表征向量进行卷积操作,以捕捉不同色彩分量的信息。例如,对于每个对象区域的基础表征向量,计算机系统可以分别应用针对红色、绿色和蓝色通道的滤波器,从而得到每个色彩分量的特征图或表征向量。这些特征图或表征向量(即第一表征向量)编码了对象区域在不同色彩分量上的分布和强度信息。通过特征聚焦技术提取了生成效果信息学习样例和对象区域基础表征向量中与色彩分量相关的关键信息,为后续的体素描述张量生成提供了丰富的色彩特征基础。
步骤S2322:针对任意一色彩分量,根据多个对象区域在任意一色彩分量的第一表征向量,确定任意一色彩分量的第一采集结果。
基于步骤S2322确定各个对象区域在一个或多个色彩分量的第一表征向量。针对任意一色彩分量,可以对各个对象区域在该色彩分量的第一表征向量进行采集,也即统计得到色彩分量的第一采集结果。色彩分量的第一采集结果例如包括均值、方差、中位数的一个或多个,依据色彩分量的均值可以体现第一表征向量在该色彩分量的平均值,依据色彩分量的方差可以体现第一表征向量在该色彩分量的波动。
步骤S2323:针对任意一对象区域,根据生成效果信息学习样例确定第一仿射变换参变量,根据第一仿射变换参变量和任意一色彩分量的第一采集结果,对任意一对象区域在任意一色彩分量的第一表征向量进行仿射变换,得到任意一对象区域在任意一色彩分量的第二表征向量。
为了使不同对象区域在不同色彩分量上的表征更具区分性和适用性,计算机系统需要对初始的第一表征向量进行变换处理。步骤S2323通过对第一表征向量进行仿射变换,得到更具表达能力的第二表征向量。
仿射变换是一种线性变换方法,能够保持图形中的“直线性”和“平行性”。在计算机视觉和机器学习中,仿射变换常被用来对数据进行规范化、对齐或增强等操作。在本步骤中,根据生成效果信息学习样例来确定仿射变换所需的参变量,这些参变量定义了变换的具体形式和程度。
具体来说,计算机系统分析生成效果信息学习样例,这些样例中包含了理想情况下对象区域在不同色彩分量上的表征。通过对比这些样例与实际的第一表征向量,计算机系统可以估计出一个仿射变换模型,该模型能够将实际的第一表征向量映射到更接近理想表征的空间中。这个仿射变换模型便是由第一仿射变换参变量所定义的。一旦确定了第一仿射变换参变量,计算机系统便可以对任意一对象区域在任意一色彩分量的第一表征向量进行仿射变换操作了。这个变换过程会依据参变量所定义的规则,对第一表征向量进行线性变换和平移操作,从而得到一个新的向量——第二表征向量。这个新的向量不仅保留了原始数据中的关键信息,还通过仿射变换引入了更多的灵活性和区分度,有助于提升后续建模和分析的准确性。
具体地,第一仿射变换参变量可以包括权重和/或偏置,权重可以决定任一对象区域在任一色彩分量的第一表征向量的重要性,偏置可以控制任一对象区域在任意一色彩分量的第二表征向量更能反映三维模型建模效果,令任一对象区域在任意一色彩分量的第二表征向量的表示效果更佳。根据任意一色彩分量的均值和/或方差对任意一对象区域在该色彩分量的第一表征向量进行调整,获得对象区域在该色彩分量的调整特征。之后基于权重和/或偏置对对象区域在该色彩分量的调整特征进行仿射变换,得到该对象区域在该色彩分量的第二表征向量。
步骤S2324:根据多个对象区域在一个或多个色彩分量的第二表征向量,确定多个对象区域的体素描述张量。
在步骤S2324中,计算机系统利用前面步骤中得到的第二表征向量来构建体素描述张量。第二表征向量是在步骤S2323中通过仿射变换得到的,它们捕捉了对象区域在不同色彩分量上的关键信息,并且已经过调整以更好地反映实际场景中的色彩特性。这些向量包含了丰富的视觉信息,对于准确描述对象区域的外观和属性至关重要。
为了将这些信息整合到体素描述张量中,计算机系统将每个对象区域的第二表征向量按照其对应的色彩分量进行组织。例如,如果一个对象区域在红色、绿色和蓝色三个色彩分量上都有相应的第二表征向量,那么这些向量会被组合在一起,形成一个更长的向量或者一个矩阵。接下来,计算机系统考虑如何将这些组合后的向量或矩阵进一步整合成体素描述张量。这通常涉及到对向量或矩阵进行额外的变换或编码操作,以便提取出更高级别的特征或模式。这些操作可能包括但不限于卷积、池化、全连接层等,具体取决于所使用的机器学习模型或算法。
例如,如果采用卷积神经网络(CNN)来处理这些组合后的向量或矩阵,那么卷积层将会学习并提取出与色彩相关的局部特征,而池化层则会对这些特征进行降维和抽象,最终全连接层会输出一个固定长度的向量作为体素描述张量。这个向量编码了对象区域在所有色彩分量上的综合信息,可以用于后续的三维建模、分类、识别等任务。需要注意的是,体素描述张量的具体形式和维度取决于所使用的技术方案和模型设计。不同的模型可能会产生不同长度和结构的体素描述张量,以适应不同的应用场景和需求。但无论如何,这些张量都旨在提供一个全面且紧凑的描述,以捕捉对象区域在三维空间中的关键特性。
步骤S24:根据多个对象区域的体素描述张量和生成效果信息学习样例,确定初始体素描述张量。
多个对象区域的体素描述张量是通过之前的步骤计算得到,分别编码了每个对象区域在色彩、形状、纹理等方面的信息。这些张量通常具有高维度和复杂的结构,以捕捉对象区域的详细特性。其次,生成效果信息学习样例是预先定义好的一组数据,它们描述了期望的三维场景生成效果。这些样例可以是文本描述、标签或其他形式的数据,具体取决于应用场景和需求。在本步骤中,如果生成效果信息学习样例是文本或标签形式,计算机系统可以先使用自然语言处理或标签编码技术将它们转换为向量形式。这个转换过程旨在将离散的文本或标签数据映射到一个连续的向量空间中,以便与体素描述张量进行融合。接下来,计算机系统结合多个对象区域的体素描述张量和转换后的生成效果信息学习样例向量,来确定初始的体素描述张量。这个融合过程可以通过多种方法实现,如加权平均、拼接、卷积等。具体方法的选择取决于技术方案和实际需求。
步骤S30:依据机器学习网络,对初始体素描述张量进行噪声抑制,得到噪声抑制体素描述张量。
在三维建模和数据处理的过程中,噪声是一个普遍存在的问题。它可能来源于数据采集、传输、处理等多个环节,对后续的分析和建模造成干扰。为了提升三维模型的准确性和质量,计算机系统需要采取有效的措施来抑制这些噪声。
步骤S30中,计算机系统利用预先训练好的机器学习模型,对初始体素描述张量中的噪声进行识别和抑制。这个机器学习模型可以是深度学习中的去噪自编码器、卷积神经网络(CNN)、生成对抗网络(GAN)等。以去噪自编码器为例,它通常包含一个编码器和一个解码器。编码器负责将输入的初始体素描述张量编码成一个低维的隐层表示,而解码器则负责从这个隐层表示中重构出原始的、无噪声的体素描述张量。在训练过程中,去噪自编码器会学习到如何从含噪声的数据中恢复出干净的数据。
当计算机系统应用这个训练好的去噪自编码器来处理初始体素描述张量时,它会首先将张量输入到编码器中,得到低维的隐层表示。然后,解码器会从这个隐层表示中重构出一个新的体素描述张量,这个新的张量就是经过噪声抑制后的体素描述张量。由于去噪自编码器的训练目标是最小化重构误差,因此它可以有效地去除初始体素描述张量中的噪声成分。
需要注意的是,不同的机器学习模型可能具有不同的去噪机制和性能表现。在实际应用中,计算机系统需要根据具体的噪声类型、数据规模和处理需求来选择合适的机器学习模型和参数设置。此外,为了进一步提升去噪效果,还可以考虑结合多种模型或方法进行集成学习或联合优化。
在一种实施方式中,步骤S30,依据机器学习网络,对初始体素描述张量进行噪声抑制,得到噪声抑制体素描述张量,具体可以包括:
步骤S31:依据机器学习网络,根据生成效果信息学习样例和多个对象区域的体素描述张量,对初始体素描述张量进行第一次噪声抑制,得到第一次噪声抑制后的体素描述张量;
步骤S32:根据生成效果信息学习样例和多个对象区域的体素描述张量,对前一次噪声抑制后的体素描述张量进行噪声抑制,得到噪声抑制后的体素描述张量,将对照次噪声抑制后的体素描述张量作为噪声抑制体素描述张量。
步骤S30在三维建模过程中通过机器学习网络对初始体素描述张量进行噪声抑制,从而提升了后续三维模型的准确性和质量。这一步骤具体可以分为两个子步骤:步骤S31和步骤S32。
在步骤S31中,根据机器学习网络,结合生成效果信息学习样例和多个对象区域的体素描述张量,对初始体素描述张量进行第一次噪声抑制。这个过程中,机器学习网络起到了核心的作用。具体来说,这个网络可能是一个深度神经网络,如卷积神经网络(CNN)或循环神经网络(RNN),它已经被训练成能够识别并抑制体素描述张量中的噪声。
例如,如果机器学习网络是一个CNN,那么它可能会包含多个卷积层、池化层和全连接层。当初始体素描述张量输入到这个网络中时,它会经过一系列的卷积和池化操作,这些操作有助于提取出张量中的关键特征并去除噪声。然后,全连接层会对这些特征进行进一步的整合和处理,最终输出一个经过噪声抑制后的体素描述张量。
需要注意的是,这个过程中还结合了生成效果信息学习样例和多个对象区域的体素描述张量。这些信息为机器学习网络提供了额外的上下文和指导,帮助它更准确地识别和抑制噪声。例如,生成效果信息学习样例可能包含了一些关于期望生成效果的信息,这些信息可以被用来指导网络在噪声抑制过程中保留更多的有用信息。
在步骤S32中,进一步对前一次噪声抑制后的体素描述张量进行迭代噪声抑制。这个过程与步骤S31类似,但不同的是它会多次重复进行,直到达到预定的迭代次数或满足某种停止条件。每次迭代都会进一步抑制张量中的噪声,从而逐渐提升体素描述张量的质量。
例如,如果经过第一次噪声抑制后的体素描述张量仍然存在一些残余的噪声,那么通过进一步的迭代噪声抑制,这些噪声可以被进一步减少或消除。这个过程可以持续进行多次,直到达到一个满意的噪声抑制效果为止。最终,经过对照次(如最后一次)噪声抑制后的体素描述张量将被作为噪声抑制体素描述张量输出。这个张量不仅去除了大部分的噪声干扰,还保留了原始数据中的关键信息和特征,为后续的三维模型生成和优化提供了有力的支持。
在一种实施方式中,任意一对象区域的体素描述张量包括任意一对象区域在一个或多个色彩分量的第三表征向量;那么,基于此,步骤S31,依据机器学习网络,根据生成效果信息学习样例和多个对象区域的体素描述张量,对初始体素描述张量进行第一次噪声抑制,得到第一次噪声抑制后的体素描述张量,具体可以包括:
步骤S311:针对任意一色彩分量,依据机器学习网络,根据多个对象区域在任意一色彩分量的第三表征向量,确定任意一色彩分量的第二采集结果;
步骤S312:针对任意一对象区域,根据生成效果信息学习样例确定第二仿射变换参变量,根据第二仿射变换参变量和任意一色彩分量的第二采集结果,对任意一对象区域在任意一色彩分量的第三表征向量进行仿射变换,得到任意一对象区域在任意一色彩分量的第四表征向量;
步骤S313:根据多个对象区域在一个或多个色彩分量的第四表征向量,对初始体素描述张量进行第一次噪声抑制,得到第一次噪声抑制后的体素描述张量。
在三维建模和数据处理中,色彩分量是体素描述张量中的重要组成部分,它对于准确捕捉对象区域的视觉特性至关重要。然而,色彩分量往往也是噪声的主要来源之一。因此,针对色彩分量进行专门的噪声抑制处理。
在步骤S311中,计算机系统针对任意一色彩分量,利用机器学习网络来处理多个对象区域在该色彩分量上的第三表征向量。这些第三表征向量是对象区域在色彩分量上的具体描述,可能包含了噪声和其他干扰信息。机器学习网络的任务是从这些向量中提取出有用的信息,并计算出该色彩分量的第二采集结果。这个第二采集结果实际上是一个统计结果,例如均值或方差。反映了多个对象区域在该色彩分量上的整体分布情况。通过计算这个统计结果,计算机系统可以获得一个对该色彩分量的全局认识,为后续的噪声抑制处理提供基础。
接下来,在步骤S312中,计算机系统根据生成效果信息学习样例来确定第二仿射变换参变量。仿射变换是一种线性变换,它可以通过对原始数据进行旋转、缩放和平移等操作来改变其形状和位置。在这个步骤中,利用生成效果信息学习样例来指导仿射变换的参数设置,以确保变换后的数据能够符合期望的生成效果。一旦确定了第二仿射变换参变量,计算机系统针对任意一对象区域,在该色彩分量上对其第三表征向量进行仿射变换。这个变换过程会根据第二仿射变换参变量和第二采集结果来调整每个对象区域的第三表征向量,从而得到一个新的、经过变换后的第四表征向量。这个第四表征向量是对象区域在色彩分量上的新描述,它已经经过了噪声抑制和形状调整,更加符合期望的生成效果。
最后,在步骤S313中,根据多个对象区域在一个或多个色彩分量的第四表征向量来构建一个新的体素描述张量。这个新的张量已经经过了第一次噪声抑制处理,其中的噪声成分已经被大大减少或消除。与初始体素描述张量相比,这个新的张量更加准确和可靠,可以用于后续的三维模型生成和优化过程。
步骤S40:根据噪声抑制体素描述张量和参考体素描述张量,对机器学习网络进行调试,得到三维模型特征构建网络,三维模型特征构建网络用于生成与目标设施点云数据呈现的模型内容一致同时包含目标生成效果信息描述的三维模型建模效果的体素描述张量。
具体地,噪声抑制体素描述张量是在经过步骤S30的噪声抑制处理后得到的,它已经去除了大部分的噪声干扰,更加准确地描述了对象区域的空间结构和色彩信息。而参考体素描述张量则是一个已知的标准或目标,它代表了期望的三维模型建模效果。接下来,计算机系统利用这两种输入数据对机器学习网络进行调试。调试的过程可能包括调整网络的结构、优化算法的参数、更新权重和偏置等。这个过程的目标是使得机器学习网络能够更好地学习和理解输入数据中的特征和模式,从而能够生成与目标设施点云数据呈现的模型内容一致的三维模型。
在调试过程中,计算机系统可以利用一些辅助技术来提升机器学习网络的性能。例如,它可能采用数据增强技术来扩充训练数据集,通过旋转、缩放、平移等操作来增加数据的多样性和泛化能力。或者,它可能使用正则化技术来防止过拟合现象的发生,通过限制模型的复杂度来提高其在未见过的数据上的泛化性能。
最终,经过调试和优化后的机器学习网络将即三维模型特征构建网络。这个网络将具备生成与目标设施点云数据呈现的模型内容一致的三维模型的能力,并且这些三维模型还将包含目标生成效果信息描述。这意味着它们不仅能够准确地反映目标设施的空间结构和外观特征,还能够根据用户的需求和期望来呈现出特定的生成效果。例如,用户可以通过调整生成效果信息来描述来控制三维模型的材质、光照、阴影等视觉效果,从而得到更加逼真和生动的建模结果。
在一种实施方式中,步骤S40,根据噪声抑制体素描述张量和参考体素描述张量,对机器学习网络进行调试,得到三维模型特征构建网络,具体可以包括:
步骤S41:根据噪声抑制体素描述张量和参考体素描述张量,确定第一误差;
步骤S42:根据第一误差确定机器学习网络的误差;
步骤S43:根据机器学习网络的误差,对机器学习网络进行调试,得到三维模型特征构建网络。
在步骤S41中,计算机系统根据噪声抑制体素描述张量和参考体素描述张量来确定第一误差。这里的噪声抑制体素描述张量是经过处理、去除了噪声干扰的数据,而参考体素描述张量则是理想的、期望达到的标准。
为了量化这两者之间的差异,计算机会采用特定的损失函数来计算误差。例如,交叉熵损失函数常用于分类问题,它能够衡量预测概率分布与真实概率分布之间的差异;而均方误差损失则常用于回归问题,衡量预测值与真实值之间的平均平方误差。
在这个步骤中,将噪声抑制体素描述张量输入到机器学习网络中,得到一组预测输出。然后,将这组预测输出与参考体素描述张量进行比较,通过损失函数计算出它们之间的误差,即第一误差。
接下来,在步骤S42中,根据第一误差来确定机器学习网络的整体误差。最后,在步骤S43中,根据机器学习网络的误差对其进行调试。调试的过程可能包括调整网络结构、增加或减少隐藏层、改变激活函数等。这些调整旨在使网络能够更好地学习和理解输入数据的特征,从而生成更准确的三维模型。
经过反复调试和优化后,计算机系统最终将得到一个性能优良的三维模型特征构建网络。这个网络能够根据输入的噪声抑制体素描述张量生成与目标设施点云数据呈现的模型内容一致的三维模型,并且这些模型还将包含目标生成效果信息描述。这意味着它们不仅能够准确地反映目标设施的空间结构和外观特征,还能够根据用户的需求和期望呈现出特定的生成效果。需要注意的是,在实际应用中,机器学习网络的具体类型和结构可能会根据问题的复杂性和数据的特性而有所不同。例如,对于复杂的三维建模任务,可能需要采用深度神经网络或卷积神经网络等高级结构来提取和处理输入数据的特征。同时,为了提高网络的性能和效率,还可能采用一些优化技术如批量归一化、残差连接等。这些技术的应用将有助于提升三维模型特征构建网络的准确性和稳定性。
在一种实施方式中,步骤S42,根据第一误差确定机器学习网络的误差,具体可以包括:
步骤S421:获取第二误差、第三误差、第四误差中的一个或多个。
步骤S422:根据第二误差、第三误差、第四误差中的一个或多个和第一误差,确定机器学习网络的误差。
其中,第二误差根据初始体素描述张量和参考体素描述张量计算得到,第三误差根据各次噪声抑制对应的噪声计算得到,第四误差根据各个三维坐标的图像表征要素计算得到。
本申请实施例中,第二误差根据初始体素描述张量和参考体素描述张量确定。可以按照第二误差函数,根据初始体素描述张量和参考体素描述张量,计算第二误差。本申请实施例不对第二误差函数做限定,示例性地,第二误差函数为交叉熵误差函数或者相对熵误差函数等。第三误差根据各次噪声抑制对应的噪声计算得到。任一次噪声抑制对应的噪声包括该次噪声抑制对应的预测噪声和该次噪声抑制对应的标注噪声。可以根据任一次噪声抑制对应的预测噪声和标注噪声,计算该次噪声抑制对应的噪声误差,该计算方式包括但不限于根据交叉熵误差函数或者相对熵误差函数的公式进行计算。之后,对各次噪声抑制对应的噪声信息误差进行相加或者求平均值等,得到的结果作为第三误差。
步骤S421中,第二误差是根据初始体素描述张量和参考体素描述张量计算得到的。初始体素描述张量是未经处理的原始数据,而参考体素描述张量则是理想的、期望达到的标准。通过比较这两者之间的差异,可以衡量网络在初始阶段对数据的处理能力。例如,可以使用交叉熵误差函数或相对熵误差函数来计算第二误差,这些函数能够量化预测概率分布与真实概率分布之间的差异。
第三误差是根据各次噪声抑制对应的噪声计算得到的。在噪声抑制过程中,网络会生成预测噪声,并与实际的标注噪声进行比较。通过计算预测噪声与标注噪声之间的误差,可以评估网络在噪声抑制方面的性能。例如,可以对每次噪声抑制对应的预测噪声和标注噪声使用交叉熵误差函数或相对熵误差函数进行计算,并将结果相加或求平均值得到第三误差。第四误差是根据各个三维坐标的图像表征要素计算得到的。图像表征要素是描述三维模型外观和结构的关键特征,通过计算这些特征与理想标准之间的差异,可以评估网络在生成三维模型时的准确性。具体的计算方法可能涉及对图像表征要素进行逐点比较或使用特定的误差度量函数。
计算机系统根据步骤S421中获取的一个或多个误差(第二误差、第三误差、第四误差)以及第一误差来确定机器学习网络的总体误差。这个过程可以对各个误差进行加权求和或使用其他复杂的误差融合策略。根据每个误差对最终性能的重要性分配不同的权重,并将它们相加得到总体误差。例如,如果认为噪声抑制性能对最终的三维模型质量至关重要,那么可以给第三误差分配较高的权重。
通过综合考虑多种误差来源,计算机系统能够更全面地评估机器学习网络的性能,并为后续的调试和优化提供有力的指导。这种多误差融合的策略有助于提高三维建模的准确性和效果,使生成的三维模型更加符合用户的期望和需求。
通过上述步骤S10~S40,得到训练完成的三维模型特征构建网络,下面介绍基于该三维模型特征构建网络的一种基于点云数据的高速公路附属设施建模方法,具体的,该方法包括:
步骤S110:获取目标设施点云数据和目标生成效果信息,目标设施点云数据用以呈现三维模型的模型内容,目标生成效果信息用以指示三维模型建模效果。
步骤S120:依据三维模型特征构建网络,根据目标设施点云数据和目标生成效果信息,确定第一体素描述张量,第一体素描述张量对应的三维模型的模型内容与目标设施点云数据呈现的模型内容一致,同时包含目标生成效果信息描述的三维模型建模效果。
步骤S130:依据三维模型特征构建网络,对第一体素描述张量进行噪声抑制,得到目标体素描述张量。
步骤S140:根据目标体素描述张量,构建目标设施三维模型。
步骤S110中,计算机系统获取目标设施的点云数据。点云数据是由大量的三维点组成,这些点共同描述了目标设施的空间结构和表面特征。这些数据可以通过激光雷达扫描、立体摄影测量等技术获取。同时,为了使得最终构建的三维模型具有期望的视觉效果,计算机系统还需要获取目标生成效果信息。这些信息可以包括色度、透明度、特效等,用于指导三维模型的渲染和显示。
接下来,计算机系统利用之前训练完成的三维模型特征构建网络,根据目标设施点云数据和目标生成效果信息,确定一个称为第一体素描述张量的数据结构。这个张量不仅包含了目标设施的三维模型内容,还与目标生成效果信息相对应,确保最终构建的三维模型在视觉效果上与期望一致。
在确定了第一体素描述张量后,计算机系统进一步对其进行噪声抑制处理。这是因为在实际的点云数据采集过程中,可能会受到各种因素的干扰,导致数据中存在噪声。噪声抑制的目的是去除这些干扰因素,使得体素描述张量更加准确和稳定。经过噪声抑制处理后,计算机系统得到了目标体素描述张量。
最后,计算机系统根据目标体素描述张量来构建目标设施的三维模型。这个过程例如包括对体素描述张量的解码(通过预设的解码器实现,解码方式不做限定)和渲染等操作,最终生成一个可以在计算机中显示和交互的三维模型。这个模型不仅准确地反映了目标设施的空间结构和表面特征,还具有期望的视觉效果,为高速公路附属设施的规划、设计和管理提供了有力的支持。
通过结合点云数据和机器学习技术,可以高效地构建出高速公路附属设施的三维模型,为相关领域的应用提供了新的可能性。
在一种实施方式中,步骤S120,依据三维模型特征构建网络,根据目标设施点云数据和目标生成效果信息,确定第一体素描述张量,具体可以包括:
步骤S121:依据三维模型特征构建网络,根据目标设施点云数据,确定多个三维坐标的点云语义表征向量;
步骤S122:根据多个三维坐标的点云语义表征向量和目标生成效果信息,确定多个三维坐标的图像表征要素;
步骤S123:根据多个三维坐标的图像表征要素、多个三维坐标的点云语义表征向量和目标生成效果信息,确定多个对象区域的体素描述张量;
步骤S124:根据多个对象区域的体素描述张量和生成效果信息,确定第一体素描述张量。
在高速公路附属设施的建模流程中,步骤S120涉及到根据目标设施的点云数据和期望的生成效果信息来确定一个关键的数据结构——第一体素描述张量。这个张量将为后续的三维模型构建提供基础。步骤S121中,计算机系统利用三维模型特征构建网络来处理目标设施的点云数据。点云数据由大量的点组成,每个点都包含其在三维空间中的坐标信息。网络会根据这些点的坐标信息,提取出多个三维坐标的点云语义表征向量。每个点云语义表征向量都是对相应三维坐标处点云数据特征的抽象描述,可能包括形状、大小、方向等信息。例如,在一个具体的实施中,点云语义表征向量可以是一个高维数组,其中每个元素都对应于点云数据中某个特定特征的量化值。接下来,计算机系统结合目标生成效果信息和之前得到的第一表征向量,来确定多个三维坐标的图像表征要素。目标生成效果信息包含了用户期望的模型视觉效果,如颜色、纹理、透明度等。图像表征要素是对第一表征向量的补充和扩展,它融入了生成效果信息,使得每个三维坐标不仅包含了形状结构信息,还包含了视觉效果信息。例如,在一个颜色渲染的场景中,图像表征要素可能包括每个三维坐标处的颜色值或颜色索引。在确定了每个三维坐标的点云语义表征向量和图像表征要素后,进一步将这些向量聚合起来,形成多个对象区域的体素描述张量。对象区域是指点云数据中属于同一物体或同一部分的点的集合。体素描述张量是对这些对象区域整体特征的描述,它综合了区域内所有点的点云语义表征向量和图像表征要素。例如,在一个包含多个对象的复杂场景中,每个对象区域都可能有一个与之对应的体素描述张量,用于描述该对象的整体形状、大小和视觉效果等特征。
最后,根据所有对象区域的体素描述张量和生成效果信息来确定第一体素描述张量。体素是三维空间中的最小单位,类似于二维图像中的像素。第一体素描述张量是对整个三维模型空间内所有体素特征的统一描述,它综合了所有对象区域的信息,并以一种紧凑且高效的方式表示出来。这个张量将作为后续三维模型构建和渲染的基础数据结构。例如,在一个具体的实施中,第一体素描述张量可以是一个多维数组或张量数据结构,其中每个元素都对应于三维空间中一个特定体素的特征值或属性索引。
可以理解,以上步骤S121~S124的实现过程可以参照以上三维模型特征构建网络的调试过程中的步骤S21~S24的描述,其原理一致,此处不做赘述。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的基于点云数据的高速公路附属设施建模方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件、软件或固件,或者硬件、软件、固件三者之间的任意结合。
本申请实施例提供一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。所述计算机可读存储介质可以是瞬时性的,也可以是非瞬时性的。
本申请实施例提供一种计算机程序,包括计算机可读代码,在所述计算机可读代码在计算机设备中运行的情况下,所述计算机设备中的处理器执行用于实现上述方法中的部分或全部步骤。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序被计算机读取并执行时,实现上述方法中的部分或全部步骤。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一些实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一些实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
这里需要指出的是:上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考。以上设备、存储介质、计算机程序及计算机程序产品实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请设备、存储介质、计算机程序及计算机程序产品实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
图2为本申请实施例提供的一种计算机系统的硬件实体示意图,如图2所示,该计算机系统1000的硬件实体包括:处理器1001和存储器1002,其中,存储器1002存储有可在处理器1001上运行的计算机程序,处理器1001执行程序时实现上述任一实施例的方法中的步骤。
存储器1002存储有可在处理器上运行的计算机程序,存储器1002配置为存储由处理器1001可执行的指令和应用,还可以缓存待处理器1001以及计算机系统1000中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random Access Memory,RAM)实现。
处理器1001执行程序时实现上述任一项的基于点云数据的高速公路附属设施建模方法的步骤。处理器1001通常控制计算机系统1000的总体操作。
本申请实施例提供一种计算机存储介质,计算机存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如上任一实施例的基于点云数据的高速公路附属设施建模方法的步骤。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。上述处理器可以为目标用途集成电路(Application Specific Integrated Circuit,ASIC)、数字信号处理器(DigitalSignal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
上述计算机存储介质/存储器可以是只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各步骤/过程的序号的大小并不意味着执行顺序的先后,各步骤/过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (12)
1.一种基于点云数据的高速公路附属设施建模方法,其特征在于,所述方法包括:
获取目标设施点云数据和目标生成效果信息,所述目标设施点云数据用以呈现三维模型的模型内容,所述目标生成效果信息用以指示三维模型建模效果,所述目标设施点云数据为高速公路附属设施的点云数据;
依据三维模型特征构建网络,根据所述目标设施点云数据和所述目标生成效果信息,确定第一体素描述张量,所述第一体素描述张量对应的三维模型的模型内容与所述目标设施点云数据呈现的模型内容一致,同时包含所述目标生成效果信息描述的三维模型建模效果;
依据所述三维模型特征构建网络,对所述第一体素描述张量进行噪声抑制,得到目标体素描述张量;
根据所述目标体素描述张量,构建目标设施三维模型;
其中,所述三维模型特征构建网络通过以下步骤调试得到:
获取设施点云数据学习样例、生成效果信息学习样例和参考体素描述张量,所述设施点云数据学习样例用以呈现三维模型的模型内容,所述生成效果信息学习样例用以指示三维模型建模效果,所述参考体素描述张量是依据注释获得的体素描述张量;
依据机器学习网络,根据所述设施点云数据学习样例和所述生成效果信息学习样例,确定初始体素描述张量,所述初始体素描述张量和所述参考体素描述张量对应的三维模型的模型内容与所述设施点云数据学习样例呈现的模型内容一致,同时包含所述生成效果信息学习样例描述的三维模型建模效果;
依据所述机器学习网络,对所述初始体素描述张量进行噪声抑制,得到噪声抑制体素描述张量;
根据所述噪声抑制体素描述张量和所述参考体素描述张量,对所述机器学习网络进行调试,得到三维模型特征构建网络,所述三维模型特征构建网络用于生成与目标设施点云数据呈现的模型内容一致同时包含目标生成效果信息描述的三维模型建模效果的体素描述张量。
2.根据权利要求1所述的方法,其特征在于,所述依据机器学习网络,根据所述设施点云数据学习样例和所述生成效果信息学习样例,确定初始体素描述张量,包括:
依据机器学习网络,根据所述设施点云数据学习样例,确定多个三维坐标的点云语义表征向量;
根据所述多个三维坐标的点云语义表征向量和所述生成效果信息学习样例,确定所述多个三维坐标的图像表征要素;
根据所述多个三维坐标的图像表征要素、所述多个三维坐标的点云语义表征向量和所述生成效果信息学习样例,确定多个对象区域的体素描述张量;
根据所述多个对象区域的体素描述张量和所述生成效果信息学习样例,确定所述初始体素描述张量。
3.根据权利要求2所述的方法,其特征在于,所述依据机器学习网络,根据所述设施点云数据学习样例,确定多个三维坐标的点云语义表征向量,包括:
依据机器学习网络,对所述设施点云数据学习样例进行嵌入映射,得到点云数据表征向量样例,所述点云数据表征向量样例包括多个三维坐标的点云语义表征向量和多个色度的点云语义表征向量;
从所述点云数据表征向量样例中获取所述多个三维坐标的点云语义表征向量;
所述方法还包括:
对所述点云数据表征向量样例包括的各个色度的点云语义表征向量进行丢弃。
4.根据权利要求3所述的方法,其特征在于,所述依据机器学习网络,对所述设施点云数据学习样例进行嵌入映射,得到点云数据表征向量样例,包括:
依据机器学习网络,对所述设施点云数据学习样例进行特征聚焦,得到多个模型元素的第一表征向量,所述多个模型元素包括所述多个三维坐标和所述多个色度;
针对任意一模型元素,对所述任意一模型元素的关联特征向量和第一表征向量进行非线性变换和仿射变换,得到所述任意一模型元素的第二表征向量,所述任意一模型元素为第一个模型元素时,所述任意一模型元素的关联特征向量为预设特征向量,所述任意一模型元素不是第一个模型元素时,所述任意一模型元素的关联特征向量根据所述预设特征向量和位于所述任意一模型元素之前的各个模型元素的第一表征向量得到;
根据所述多个模型元素的第一表征向量和第二表征向量,确定所述点云数据表征向量样例。
5.根据权利要求2所述的方法,其特征在于,任意一三维坐标的图像表征要素包括所述任意一三维坐标占对象区域的数量;所述根据所述多个三维坐标的图像表征要素、所述多个三维坐标的点云语义表征向量和所述生成效果信息学习样例,确定多个对象区域的体素描述张量,包括:
根据所述多个三维坐标占对象区域的数量和所述多个三维坐标的点云语义表征向量,确定多个对象区域的基础表征向量;
根据所述生成效果信息学习样例和所述多个对象区域的基础表征向量,确定所述多个对象区域的体素描述张量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述生成效果信息学习样例和所述多个对象区域的基础表征向量,确定所述多个对象区域的体素描述张量,包括:
对所述生成效果信息学习样例和所述多个对象区域的基础表征向量进行特征聚焦,得到所述多个对象区域在一个或多个色彩分量的第一表征向量;
针对任意一色彩分量,根据所述多个对象区域在所述任意一色彩分量的第一表征向量,确定所述任意一色彩分量的第一采集结果;
针对任意一对象区域,根据所述生成效果信息学习样例确定第一仿射变换参变量,根据所述第一仿射变换参变量和所述任意一色彩分量的第一采集结果,对所述任意一对象区域在所述任意一色彩分量的第一表征向量进行仿射变换,得到所述任意一对象区域在所述任意一色彩分量的第二表征向量;
根据所述多个对象区域在一个或多个色彩分量的第二表征向量,确定所述多个对象区域的体素描述张量。
7.根据权利要求1所述的方法,其特征在于,所述依据所述机器学习网络,对所述初始体素描述张量进行噪声抑制,得到噪声抑制体素描述张量,包括:
依据所述机器学习网络,根据所述生成效果信息学习样例和多个对象区域的体素描述张量,对所述初始体素描述张量进行第一次噪声抑制,得到所述第一次噪声抑制后的体素描述张量;
根据所述生成效果信息学习样例和所述多个对象区域的体素描述张量,对前一次噪声抑制后的体素描述张量进行噪声抑制,得到噪声抑制后的体素描述张量,将对照次噪声抑制后的体素描述张量作为所述噪声抑制体素描述张量。
8.根据权利要求7所述的方法,其特征在于,任意一对象区域的体素描述张量包括所述任意一对象区域在一个或多个色彩分量的第三表征向量;
所述依据所述机器学习网络,根据所述生成效果信息学习样例和多个对象区域的体素描述张量,对所述初始体素描述张量进行第一次噪声抑制,得到所述第一次噪声抑制后的体素描述张量,包括:
针对任意一色彩分量,依据所述机器学习网络,根据所述多个对象区域在所述任意一色彩分量的第三表征向量,确定所述任意一色彩分量的第二采集结果;
针对任意一对象区域,根据所述生成效果信息学习样例确定第二仿射变换参变量,根据所述第二仿射变换参变量和所述任意一色彩分量的第二采集结果,对所述任意一对象区域在所述任意一色彩分量的第三表征向量进行仿射变换,得到所述任意一对象区域在所述任意一色彩分量的第四表征向量;
根据所述多个对象区域在一个或多个色彩分量的第四表征向量,对所述初始体素描述张量进行第一次噪声抑制,得到所述第一次噪声抑制后的体素描述张量。
9.根据权利要求1所述的方法,其特征在于,所述根据所述噪声抑制体素描述张量和所述参考体素描述张量,对所述机器学习网络进行调试,得到三维模型特征构建网络,包括:
根据所述噪声抑制体素描述张量和所述参考体素描述张量,确定第一误差;
根据所述第一误差确定机器学习网络的误差;
根据所述机器学习网络的误差,对所述机器学习网络进行调试,得到三维模型特征构建网络。
10.根据权利要求9所述的方法,其特征在于,所述根据所述第一误差确定机器学习网络的误差,包括:
获取第二误差、第三误差、第四误差中的一个或多个;
根据所述第二误差、所述第三误差、所述第四误差中的一个或多个和所述第一误差,确定所述机器学习网络的误差;
其中,所述第二误差根据所述初始体素描述张量和所述参考体素描述张量计算得到,所述第三误差根据各次噪声抑制对应的噪声计算得到,所述第四误差根据各个三维坐标的图像表征要素计算得到。
11.根据权利要求2~10任一项所述的方法,其特征在于,所述依据三维模型特征构建网络,根据所述目标设施点云数据和所述目标生成效果信息,确定第一体素描述张量,包括:
依据三维模型特征构建网络,根据所述目标设施点云数据,确定多个三维坐标的点云语义表征向量;
根据所述多个三维坐标的点云语义表征向量和所述目标生成效果信息,确定所述多个三维坐标的图像表征要素;
根据所述多个三维坐标的图像表征要素、所述多个三维坐标的点云语义表征向量和所述目标生成效果信息,确定多个对象区域的体素描述张量;
根据所述多个对象区域的体素描述张量和所述生成效果信息,确定所述第一体素描述张量。
12.一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至11任一项所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410353984.5A CN117953167B (zh) | 2024-03-27 | 2024-03-27 | 基于点云数据的高速公路附属设施建模方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410353984.5A CN117953167B (zh) | 2024-03-27 | 2024-03-27 | 基于点云数据的高速公路附属设施建模方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117953167A true CN117953167A (zh) | 2024-04-30 |
CN117953167B CN117953167B (zh) | 2024-05-28 |
Family
ID=90805551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410353984.5A Active CN117953167B (zh) | 2024-03-27 | 2024-03-27 | 基于点云数据的高速公路附属设施建模方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117953167B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110202538A1 (en) * | 2010-02-17 | 2011-08-18 | Lockheed Martin Corporation | Voxel approach to terrain repositories for modeling and simulation |
US20170116781A1 (en) * | 2015-10-21 | 2017-04-27 | Nokia Technologies Oy | 3d scene rendering |
CN112435193A (zh) * | 2020-11-30 | 2021-03-02 | 中国科学院深圳先进技术研究院 | 一种点云数据去噪的方法、装置、存储介质和电子设备 |
CN113487739A (zh) * | 2021-05-19 | 2021-10-08 | 清华大学 | 一种三维重建方法、装置、电子设备及存储介质 |
CN115526851A (zh) * | 2022-09-21 | 2022-12-27 | 宜兴子嘉智能科技有限公司 | 一种基于4d时空卷积模型的焊缝检测方法 |
CN116258835A (zh) * | 2023-05-04 | 2023-06-13 | 武汉大学 | 基于深度学习的点云数据三维重建方法和系统 |
WO2023124676A1 (zh) * | 2021-12-30 | 2023-07-06 | 华为技术有限公司 | 3d模型构建方法、装置和电子设备 |
CN116844004A (zh) * | 2023-06-01 | 2023-10-03 | 浙江点创信息科技有限公司 | 一种面向数字孪生场景的点云自动语义化建模方法 |
WO2023241097A1 (zh) * | 2022-06-16 | 2023-12-21 | 山东海量信息技术研究院 | 一种语义实例重建方法、装置、设备及介质 |
-
2024
- 2024-03-27 CN CN202410353984.5A patent/CN117953167B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110202538A1 (en) * | 2010-02-17 | 2011-08-18 | Lockheed Martin Corporation | Voxel approach to terrain repositories for modeling and simulation |
US20170116781A1 (en) * | 2015-10-21 | 2017-04-27 | Nokia Technologies Oy | 3d scene rendering |
CN112435193A (zh) * | 2020-11-30 | 2021-03-02 | 中国科学院深圳先进技术研究院 | 一种点云数据去噪的方法、装置、存储介质和电子设备 |
CN113487739A (zh) * | 2021-05-19 | 2021-10-08 | 清华大学 | 一种三维重建方法、装置、电子设备及存储介质 |
WO2023124676A1 (zh) * | 2021-12-30 | 2023-07-06 | 华为技术有限公司 | 3d模型构建方法、装置和电子设备 |
WO2023241097A1 (zh) * | 2022-06-16 | 2023-12-21 | 山东海量信息技术研究院 | 一种语义实例重建方法、装置、设备及介质 |
CN115526851A (zh) * | 2022-09-21 | 2022-12-27 | 宜兴子嘉智能科技有限公司 | 一种基于4d时空卷积模型的焊缝检测方法 |
CN116258835A (zh) * | 2023-05-04 | 2023-06-13 | 武汉大学 | 基于深度学习的点云数据三维重建方法和系统 |
CN116844004A (zh) * | 2023-06-01 | 2023-10-03 | 浙江点创信息科技有限公司 | 一种面向数字孪生场景的点云自动语义化建模方法 |
Non-Patent Citations (3)
Title |
---|
RUISHENG WANG 等: "LiDAR Point Clouds to 3-D Urban Models: A Review", 《 IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING 》, vol. 11, no. 2, 10 January 2018 (2018-01-10), pages 606 - 627, XP011677265, DOI: 10.1109/JSTARS.2017.2781132 * |
冯东明 等: "倾斜摄影航线规划在桥梁建模中的应用研究", 《公路》, vol. 68, no. 6, 8 June 2023 (2023-06-08), pages 227 - 232 * |
王亚东 等: "基于卷积神经网络的三维目标检测研究综述", 《模式识别与人工智能》, vol. 34, no. 12, 15 December 2021 (2021-12-15), pages 1103 - 1119 * |
Also Published As
Publication number | Publication date |
---|---|
CN117953167B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | An underwater image enhancement benchmark dataset and beyond | |
Hosu et al. | KonIQ-10k: An ecologically valid database for deep learning of blind image quality assessment | |
Wang et al. | Salient object detection based on multi-scale contrast | |
CN114038006A (zh) | 一种抠图网络训练方法及抠图方法 | |
Zhu et al. | Learning deep patch representation for probabilistic graphical model-based face sketch synthesis | |
CN117635418B (zh) | 生成对抗网络的训练方法、双向图像风格转换方法和装置 | |
CN112446322A (zh) | 眼球特征检测方法、装置、设备及计算机可读存储介质 | |
CN116580156A (zh) | 基于大数据深度学习的文本生成3d打印模型方法 | |
Yang et al. | Blind image quality assessment of natural distorted image based on generative adversarial networks | |
Wen et al. | SVBRDF Recovery from a Single Image with Highlights Using a Pre‐trained Generative Adversarial Network | |
CN117315070A (zh) | 图像生成方法、装置、电子设备、存储介质和程序产品 | |
Wang | Robust segmentation of the colour image by fusing the SDD clustering results from different colour spaces | |
CN117315473B (zh) | 一种基于改进YOLOv8的草莓成熟度检测方法及系统 | |
Sial et al. | Deep intrinsic decomposition trained on surreal scenes yet with realistic light effects | |
Xu et al. | RelightGAN: Instance-level generative adversarial network for face illumination transfer | |
CN117456068A (zh) | 基于生成对抗网络的视频生成方法及系统 | |
CN117953167B (zh) | 基于点云数据的高速公路附属设施建模方法及系统 | |
Zhang et al. | Towards learning low-light indoor semantic segmentation with illumination-invariant features | |
Li et al. | A review of advances in image inpainting research | |
CN115272527A (zh) | 基于色盘对抗网络的图像上色方法 | |
Zhuge et al. | Automatic colorization using fully convolutional networks | |
Zeng et al. | Archaeology drawing generation algorithm based on multi-branch feature cross fusion | |
Wang et al. | Multi illumination color constancy based on multi-scale supervision and single-scale estimation cascade convolution neural network | |
Arroyo et al. | ParGAN: Learning Real Parametrizable Transformations | |
Weiher | Domain adaptation of HDR training data for semantic road scene segmentation by deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |