CN116503508B - 一种个性化模型构建方法、系统、计算机及可读存储介质 - Google Patents

一种个性化模型构建方法、系统、计算机及可读存储介质 Download PDF

Info

Publication number
CN116503508B
CN116503508B CN202310754213.2A CN202310754213A CN116503508B CN 116503508 B CN116503508 B CN 116503508B CN 202310754213 A CN202310754213 A CN 202310754213A CN 116503508 B CN116503508 B CN 116503508B
Authority
CN
China
Prior art keywords
image
personalized
texture
vector set
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310754213.2A
Other languages
English (en)
Other versions
CN116503508A (zh
Inventor
黄靛
朱小宝
王亚超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN202310754213.2A priority Critical patent/CN116503508B/zh
Publication of CN116503508A publication Critical patent/CN116503508A/zh
Application granted granted Critical
Publication of CN116503508B publication Critical patent/CN116503508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Image Generation (AREA)

Abstract

本发明提供了一种个性化模型构建方法、系统、计算机及可读存储介质,涉及云制造和逆向工程的技术领域,所述方法包括获取初始图像,对初始图像进行目标识别与裁切,以得到目标图像;获取目标图像的图像参数,对目标图像进行图像填充处理,以得到处理图像;对用户个性化数据进行编码处理,以得到个性化向量集,对处理图像进行编码处理,以得到图像向量集;建立纹理形状模型,定义光度重建损失并基于光度重建损失优化纹理形状模型,将个性化向量集与图像向量集输入优化后的纹理形状模型,输出纹理场与颜色预测值,基于纹理场与颜色预测值构建个性化模型,本发明可将用户的个性化元素融入个性化模型中,个性化模型输出耗时短、效率高、精确度高。

Description

一种个性化模型构建方法、系统、计算机及可读存储介质
技术领域
本发明属于云制造和逆向工程的技术领域,具体地涉及一种个性化模型构建方法、系统、计算机及可读存储介质。
背景技术
随着当前制造智能化和生产力的提高,计算机辅助设计与制造(CAD/CAM)和快速成型(RP)已成为制造领域的热词,目前要实现产品的逆向生产方式主要有两种,第一种是根据物体形状手动创建3D模型,该方式既耗时又成本高,并且效率低、模型可扩展性差、难以融入个性化元素;第二种是通过结构光、激光扫描仪、激光测距图、医学MRI等方法对原始物理形状进行3D扫描和数据采集,这些重建过程都是高预算项目,融入个性化特征也是难以实现的。
发明内容
为了解决上述技术问题,本发明提供了一种个性化模型构建方法、系统、计算机及可读存储介质,用于解决现有技术中存在的技术问题。
第一方面,该发明提供以下技术方案,一种个性化模型构建方法,所述方法包括:
获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;
获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;
获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;
建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型。
相比现有技术,本申请的有益效果为:本申请首先获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;之后获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;而后获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;最后建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型,本发明可将用户的个性化元素融入最终生成的个性化模型中,同时本发明只需要一张图片即可完成个性化模型的输出,无需繁杂且昂贵的3D扫描等操作,且个性化模型输出耗时短、效率高,同时通过对纹理形状模型进行优化,可进一步提高个性化模型输出的精确度。
较佳的,所述获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像的步骤包括:
将所述初始图像输入YOLOv4模型中进行目标识别,输出第一目标坐标,所述第一目标坐标包括第一上坐标、第一左坐标、第一下坐标、第一右坐标;
基于所述第一上坐标、所述第一左坐标/>、所述第一下坐标/>、所述第一右坐标/>对所述初始图像进行裁切,以得到第二上坐标/>、第二左坐标、第二下坐标/>、第二右坐标/>
式中,、/>、/>、/>为裁切坐标值。
较佳的,所述获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像的步骤包括:
获取所述目标图像的宽度与长度/>,定义所述目标图像四周的填充变量,并将填充变量初始化为预设值;
计算所述目标图像四周对应的实际填充变量
式中,表示四舍五入的取整函数,/>表示绝对值;
判断所述目标图像的宽度与长度/>的大小,若/>,则在所述目标图像的上、下方位分别填充/>,若/>,则在所述目标图像的左、右方位分别填充/>
较佳的,所述获取用户个性化数据,使用注意力机制编码器对所述个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集的步骤包括:
获取用户个性化数据,使用注意力机制编码器/>对所述用户个性化数据/>进行编码处理,以得到个性化向量集/>
式中,表示数据编号,/>表示数据维度;
使用ResNet18网络对所述处理图像/>进行编码处理,以得到图像向量集/>
较佳的,所述纹理形状模型为:
其中,表示模型形状,/>表示模型纹理场,/>表示三维空间点/>的占用概率,/>表示个性化向量集/>中的子向量,/>表示图像向量集/>中的子向量,/>表示网络参数,/>表示颜色值。
较佳的,所述定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型的步骤包括:
定义光度重建损失并采用多元链式求导计算光度重建损失/>对网络参数/>的梯度/>
;(1)
;(2)
式中,为纹理形状模型渲染后的图像,/>为真实图像,/>为纹理形状模型预测的像素点/>处的RGB值,/>表示像素点/>处的RGB值;
根据所述纹理形状模型可知,计算/>对网络参数/>的梯度/>
;(3)
;(4)
其中,为相机位置/>至像素点/>的射线/>与等值面的交点,/>为微分算子,/>为连接/>与/>的向量;
存在表面深度使得/>,并根据/>将公式(4)中的微分算子/>转换为:
;(5)
对所述纹理形状模型中的进行微分处理,输出微分结果,根据所述微分结果计算表面深度/>对网络参数/>的梯度:
;(6)
根据公式(6)将公式(1)转换为公式(7):
基于公式(7)并采用梯度下降优化算法迭代更新网络参数直至收敛,以得到优化参数/>,基于所述优化参数/>优化所述纹理形状模型。
较佳的,所述将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型的步骤包括:
将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,并通过像素点投射出一条方向为/>的射线,确定该射线与等值面/>的交点/>的位置,计算交点/>处的纹理场与颜色预测值,并基于所述纹理场与所述颜色预测值构建个性化模型。
第二方面,该发明提供以下技术方案,一种个性化模型构建系统,所述系统包括:
裁切模块,用于获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;
处理模块,用于获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;
编码模块,用于获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;
构建模块,用于建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型。
第三方面,该发明提供以下技术方案,一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的个性化模型构建方法。
第四方面,该发明提供以下技术方案,一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的个性化模型构建方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一实施例提供的个性化模型构建方法的流程图;
图2为本发明第一实施例提供的个性化模型构建方法中步骤S1的详细流程图;
图3为本发明第一实施例提供的个性化模型构建方法中步骤S2的详细流程图;
图4为本发明第一实施例提供的个性化模型构建方法中步骤S3的详细流程图;
图5为本发明第一实施例提供的表面深度与交点/>的示意图;
图6为本发明第二实施例提供的个性化模型构建系统的结构框图;
图7为本发明另一实施例提供的计算机的硬件结构框图。
以下将结合附图对本发明实施例作进一步说明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
如图1所示,在本发明的第一个实施例中,该发明提供以下技术方案,一种个性化模型构建方法,所述方法包括:
S1、获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;
具体的,初始图像可为相机或者网页捕获的图片,而在一张图片中可能存在多个物体以及环境的干扰,因此需要对初始图像进行目标识别,识别处在初始图像中需要建模的目标,并基于识别出的目标对初始图像进行裁切,得到目标图像。
如图2所示,其中,所述步骤S1包括:
S11、将所述初始图像输入YOLOv4模型中进行目标识别,输出第一目标坐标,所述第一目标坐标包括第一上坐标、第一左坐标、第一下坐标、第一右坐标;
其中,YOLOv4模型可用于识别图片中的目标,且经过YOLOv4模型检测与识别之后,会输出第一上坐标、第一左坐标、第一下坐标、第一右坐标,而第一上坐标、第一左坐标、第一下坐标、第一右坐标分别对应检测目标的四个方位的坐标。
S12、基于所述第一上坐标、所述第一左坐标/>、所述第一下坐标、所述第一右坐标/>对所述初始图像进行裁切,以得到第二上坐标/>、第二左坐标/>、第二下坐标/>、第二右坐标/>
式中,、/>、/>、/>为裁切坐标值;
具体的,从初始图像的原点开始,并基于YOLOv4模型输出的四个坐标进行裁切,以输出得到目标的坐标,即第二上坐标、第二左坐标/>、第二下坐标/>、第二右坐标/>,上述四个坐标为经过裁切后的目标的新坐标,同时,其中的/>、/>、/>可根据目标图像的具体大小而设定不同的值。
S2、获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;
具体的,目标图像的图像参数具体为目标图像的长度与宽度,其可根据目标图像的四个方位坐标得到,同时为了便于在神经网络中计算,因此需要对目标图像进行填充,以使最终输出的处理图像为正方形图片。
如图3所示,其中,所述步骤S2包括:
S21、获取所述目标图像的宽度与长度/>,定义所述目标图像四周的填充变量,并将填充变量初始化为预设值;
其中,预设值为0。
S22、计算所述目标图像四周对应的实际填充变量
其中,表示四舍五入的取整函数,/>表示绝对值。
S23、判断所述目标图像的宽度与长度/>的大小,若/>,则在所述目标图像的上、下方位分别填充/>,若/>,则在所述目标图像的左、右方位分别填充/>
其中,若,则表示目标图像已经为正方形,则无需对其进行填充处理,可直接将目标图像作为处理图像。
S3、获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;
具体的,在实际的建模过程中,可开放用户的上传权限,用于可自由选择上传喜好的颜色、物件的大小比例、用户身高、体重等数据,即组成了用户个性化数据,且经过注意力机制编码器输出的个性化向量集,同样的,经过ResNet18网络输出的图像向量集,其中/>为实数域空间下的256维向量。
如图4所示,其中,所述步骤S3包括:
S31、获取用户个性化数据,使用注意力机制编码器/>对所述用户个性化数据/>进行编码处理,以得到个性化向量集/>
式中,表示数据编号,/>表示数据维度。
S32、使用ResNet18网络对所述处理图像/>进行编码处理,以得到图像向量集/>
S4、建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型;
具体的,在步骤S4中,纹理形状模型为神经网络模型,其用于根据输入的图片以及个性化数据进而输出所需构建的个性模型的形状、纹理等参数,而本申请最终输出的个性化模型为一个3D模型,其可根据纹理形状模型输出的参数进而构建得到个性化模型。
其中,所述纹理形状模型为:
其中,表示模型形状,/>表示模型纹理场,/>表示三维空间点/>的占用概率,/>表示个性化向量集/>中的子向量,/>表示图像向量集/>中的子向量,/>表示网络参数,/>表示颜色值;
具体的,首先,定义用于表示3D形状的纹理的隐式神经表示方法,形状表示方法与离散体素和点云不同,使用占用网络隐式表示物体的3D形状,物体的纹理是由物体表面的RGB值给出的,因此可定义得到纹理形状模型;
其中的表示三维空间点/>的占用概率,占用网络关键在于利用神经元给每个位置的点/>分配一个/>之间的占用概率,该网络相当于用于二分类的神经元,只不过此处更加关注物体表面的决策边界,神经网络表示的/>将一对/>作为输入,输出一个代表占用概率的实数;/>将/>作为输入,输出空间点/>对应的纹理表示,即实数域下的三维空间向量,其中/>为实数域。
所述步骤S4包括:S41、定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型以及步骤S42、将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型。
其中,步骤S41包括:
S411、定义光度重建损失并采用多元链式求导计算光度重建损失/>对网络参数/>的梯度/>
;(1)
;(2)
式中,为纹理形状模型渲染后的图像,/>为真实图像,/>为纹理形状模型预测的像素点/>处的RGB值,/>表示像素点/>处的RGB值。
S412、根据所述纹理形状模型可知,计算/>对网络参数/>的梯度/>
;(3)
;(4)
其中,为相机位置/>至像素点/>的射线/>与等值面的交点,/>为微分算子,/>为连接/>与/>的向量;
具体的,也为作为相机位置/>至像素点/>之间射线的方向,/>与/>均依赖于网络参数/>,而对于任意的像素点/>,均存在一条由相机位置/>至像素点/>的射线,且/>存在于射线/>上,因此会存在一个深度值/>使得/>,而该深度值/>称为表面深度。
S413、存在表面深度使得/>,并根据/>将公式(4)中的微分算子/>转换为:
。(5)
S414、对所述纹理形状模型中的进行微分处理,输出微分结果,根据所述微分结果计算表面深度/>对网络参数/>的梯度:
;(6)
具体的,首先对所述纹理形状模型中的进行等号两边微分处理并代入公式(4),可得:
;(6.1)
;(6.2)
而后,基于公式(6.1)与公式(6.2)计算表面深度对网络参数/>的梯度:
;(6)
具体的,通过公式(6)可以得出计算表面深度对网络参数/>的梯度仅需/>在/>处的梯度,因此与基于体素的方法相比,不需要存储中间结果(例如体积数据)来计算损失,有更高效地内存利用。
S415、根据公式(6)将公式(1)转换为公式(7):
S416、基于公式(7)并采用梯度下降优化算法迭代更新网络参数直至收敛,以得到优化参数/>,基于所述优化参数/>优化所述纹理形状模型;
其中梯度下降优化算法为:
;(8)
;(9)
式中,为迭代参数,/>为学习率;
具体的,对纹理形状模型优化的目的是为了得到网络参数的最优解使得光度重建损失/>最小,因此优化过程一直重复公式(8)与公式(9)直至光度重建损失/>不再下降,将此时的迭代参数/>作为优化参数/>,并通过优化参数/>优化所述纹理形状模型。
其中,所述步骤S42具体包括:
如图5所示,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,并通过像素点投射出一条方向为/>的射线,确定该射线与等值面/>的交点/>的位置,计算交点/>处的纹理场与颜色预测值,并基于所述纹理场与所述颜色预测值构建个性化模型。
本实施例一的好处在于:本申请首先获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;之后获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;而后获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;最后建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型,本发明可将用户的个性化元素融入最终生成的个性化模型中,同时本发明只需要一张图片即可完成个性化模型的输出,无需繁杂且昂贵的3D扫描等操作,且个性化模型输出耗时短、效率高,同时通过对纹理形状模型进行优化,可进一步提高个性化模型输出的精确度。
实施例二
如图6所示,在本发明的第二个实施例提供了一种个性化模型构建系统,所述系统包括:
裁切模块1,用于获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;
处理模块2,用于获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;
编码模块3,用于获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;
构建模块4,用于建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型。
其中,所述裁切模块1包括:
识别子模块,用于将所述初始图像输入YOLOv4模型中进行目标识别,输出第一目标坐标,所述第一目标坐标包括第一上坐标、第一左坐标、第一下坐标、第一右坐标;
裁切子模块,用于基于所述第一上坐标、所述第一左坐标/>、所述第一下坐标/>、所述第一右坐标/>对所述初始图像进行裁切,以得到第二上坐标、第二左坐标/>、第二下坐标/>、第二右坐标/>
式中,、/>、/>、/>为裁切坐标值。
所述处理模块2包括:
获取子模块,用于获取所述目标图像的宽度与长度/>,定义所述目标图像四周的填充变量,并将填充变量初始化为预设值;
填充变量计算子模块,用于计算所述目标图像四周对应的实际填充变量
判断子模块,用于判断所述目标图像的宽度与长度/>的大小,若/>,则在所述目标图像的上、下方位分别填充/>,若/>,则在所述目标图像的左、右方位分别填充/>
所述编码模块3包括:
第一编码子模块,用于获取用户个性化数据,使用注意力机制编码器/>对所述用户个性化数据/>进行编码处理,以得到个性化向量集/>
式中,表示数据编号,/>表示数据维度;
第二编码子模块,用于使用ResNet18网络对所述处理图像/>进行编码处理,以得到图像向量集/>
所述构建模块4包括:
第一计算子模块,用于定义光度重建损失并采用多元链式求导计算光度重建损失/>对网络参数/>的梯度/>
;(1)
;(2)
式中,为纹理形状模型渲染后的图像,/>为真实图像,/>为纹理形状模型预测的像素点/>处的RGB值,/>表示像素点/>处的RGB值;
第二计算子模块,用于根据所述纹理形状模型可知,计算/>对网络参数/>的梯度/>
;(3)
;(4)
其中,为相机位置/>至像素点/>的射线/>与等值面的交点,/>为微分算子,/>为连接/>与/>的向量;
第三计算子模块,用于存在表面深度使得/>,并根据/>将公式(4)中的微分算子/>转换为:
;(5)
第四计算子模块,用于对所述纹理形状模型中的进行微分处理,输出微分结果,根据所述微分结果计算表面深度/>对网络参数/>的梯度:/>
;(6)
第五计算子模块,用于根据公式(6)将公式(1)转换为公式(7):
第六计算子模块,用于基于公式(7)并采用梯度下降优化算法迭代更新网络参数直至收敛,以得到优化参数/>,基于所述优化参数/>优化所述纹理形状模型。
所述构建模块4还包括:
模型构建子模块,用于将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,并通过像素点投射处一条方向为/>的射线,确定该射线与等值面的交点/>的位置,计算交点/>处的纹理场与颜色预测值,并基于所述纹理场与所述颜色预测值构建个性化模型。
在本发明的另一些实施例中,本发明实施例提供以下技术方案,一种计算机,包括存储器102、处理器101以及存储在所述存储器102上并可在所述处理器101上运行的计算机程序,所述处理器101执行所述计算机程序时实现上所述的个性化模型构建方法。
具体的,上述处理器101可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器102可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器102可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(Solid State Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerial Bus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器102可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器102可在数据处理装置的内部或外部。在特定实施例中,存储器102是非易失性(Non-Volatile)存储器。在特定实施例中,存储器102包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(Random Access Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(ErasableProgrammable Read-Only Memory,简称为EPROM)、电可擦除PROM(Electrically ErasableProgrammable Read-Only Memory,简称为EEPROM)、电可改写ROM(ElectricallyAlterable Read-Only Memory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-AccessMemory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode DynamicRandom Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDate Out Dynamic Random Access Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器102可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器101所执行的可能的计算机程序指令。
处理器101通过读取并执行存储器102中存储的计算机程序指令,以实现上述个性化模型构建方法。
在其中一些实施例中,计算机还可包括通信接口103和总线100。其中,如图7所示,处理器101、存储器102、通信接口103通过总线100连接并完成相互间的通信。
通信接口103用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信接口103还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线100包括硬件、软件或两者,将计算机的部件彼此耦接在一起。总线100包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线100可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线100可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该计算机可以基于获取到个性化模型构建系统,执行本申请的个性化模型构建方法,从而实现个性化模型的构建。
在本发明的再一些实施例中,结合上述的个性化模型构建方法,本发明实施例提供以下技术方案,一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的个性化模型构建方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种个性化模型构建方法,其特征在于,所述方法包括:
获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;
获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;
获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;
其中,所述用户个性化数据至少包括用户喜好的颜色、物件的大小比例、用户身高、用户体重;
建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型;
所述将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型的步骤包括:
将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,并通过像素点投射出一条方向为/>的射线,确定该射线与等值面/>的交点/>的位置,计算交点/>处的纹理场与颜色预测值,并基于所述纹理场与所述颜色预测值构建个性化模型;
其中,所述纹理形状模型为:
其中,表示模型形状,/>表示模型纹理场,/>表示三维空间点/>的占用概率,/>表示个性化向量集/>中的子向量,/>表示图像向量集/>中的子向量,/>表示网络参数,/>表示颜色值。
2.根据权利要求1所述的个性化模型构建方法,其特征在于,所述获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像的步骤包括:
将所述初始图像输入YOLOv4模型中进行目标识别,输出第一目标坐标,所述第一目标坐标包括第一上坐标、第一左坐标、第一下坐标、第一右坐标;
基于所述第一上坐标、所述第一左坐标/>、所述第一下坐标/>、所述第一右坐标/>对所述初始图像进行裁切,以得到第二上坐标/>、第二左坐标/>、第二下坐标/>、第二右坐标/>
式中,、/>、/>、/>为裁切坐标值。
3.根据权利要求1所述的个性化模型构建方法,其特征在于,所述获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像的步骤包括:
获取所述目标图像的宽度与长度/>,定义所述目标图像四周的填充变量,并将填充变量初始化为预设值;
计算所述目标图像四周对应的实际填充变量
式中,表示四舍五入的取整函数,/>表示绝对值;
判断所述目标图像的宽度与长度/>的大小,若/>,则在所述目标图像的上、下方位分别填充/>,若/>,则在所述目标图像的左、右方位分别填充/>
4.根据权利要求1所述的个性化模型构建方法,其特征在于,所述获取用户个性化数据,使用注意力机制编码器对所述个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集的步骤包括:
获取用户个性化数据,使用注意力机制编码器/>对所述用户个性化数据/>进行编码处理,以得到个性化向量集/>
式中,表示数据编号,/>表示数据维度;
使用ResNet18网络对所述处理图像/>进行编码处理,以得到图像向量集/>
5.根据权利要求1所述的个性化模型构建方法,其特征在于,所述定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型的步骤包括:
定义光度重建损失并采用多元链式求导计算光度重建损失/>对网络参数/>的梯度/>
;(1)
;(2)
式中,为纹理形状模型渲染后的图像,/>为真实图像,/>为纹理形状模型预测的像素点处的RGB值,/>表示像素点/>处的RGB值;
根据所述纹理形状模型可知,计算/>对网络参数/>的梯度/>
;(3)
;(4)
其中,为相机位置/>至像素点/>的射线/>与等值面/>的交点,/>为微分算子,/>为深度值,/>为连接/>与/>的向量;
存在表面深度使得/>,并根据/>将公式(4)中的微分算子/>转换为:
;(5)
对所述纹理形状模型中的进行微分处理,输出微分结果,根据所述微分结果计算表面深度/>对网络参数/>的梯度:
;(6)
根据公式(6)将公式(1)转换为公式(7):
基于公式(7)并采用梯度下降优化算法迭代更新网络参数直至收敛,以得到优化参数,基于所述优化参数/>优化所述纹理形状模型。
6.一种个性化模型构建系统,其特征在于,所述系统包括:
裁切模块,用于获取初始图像,对所述初始图像进行目标识别与裁切,以得到目标图像;
处理模块,用于获取所述目标图像的图像参数,并基于所述图像参数对所述目标图像进行图像填充处理,以得到处理图像;
编码模块,用于获取用户个性化数据,使用注意力机制编码器对所述用户个性化数据进行编码处理,以得到个性化向量集,使用ResNet18网络对所述处理图像进行编码处理,以得到图像向量集;
其中,所述用户个性化数据至少包括用户喜好的颜色、物件的大小比例、用户身高、用户体重;
构建模块,用于建立纹理形状模型,定义光度重建损失并基于所述光度重建损失优化所述纹理形状模型,将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,输出纹理场与颜色预测值,基于所述纹理场与所述颜色预测值构建个性化模型;
所述构建模块包括:
模型构建子模块,用于将所述个性化向量集与所述图像向量集输入优化后的所述纹理形状模型,并通过像素点投射处一条方向为/>的射线,确定该射线与等值面的交点/>的位置,计算交点/>处的纹理场与颜色预测值,并基于所述纹理场与所述颜色预测值构建个性化模型;
其中,所述纹理形状模型为:
其中,表示模型形状,/>表示模型纹理场,/>表示三维空间点/>的占用概率,/>表示个性化向量集/>中的子向量,/>表示图像向量集/>中的子向量,/>表示网络参数,/>表示颜色值。
7.一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的个性化模型构建方法。
8.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的个性化模型构建方法。
CN202310754213.2A 2023-06-26 2023-06-26 一种个性化模型构建方法、系统、计算机及可读存储介质 Active CN116503508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310754213.2A CN116503508B (zh) 2023-06-26 2023-06-26 一种个性化模型构建方法、系统、计算机及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310754213.2A CN116503508B (zh) 2023-06-26 2023-06-26 一种个性化模型构建方法、系统、计算机及可读存储介质

Publications (2)

Publication Number Publication Date
CN116503508A CN116503508A (zh) 2023-07-28
CN116503508B true CN116503508B (zh) 2023-09-08

Family

ID=87323453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310754213.2A Active CN116503508B (zh) 2023-06-26 2023-06-26 一种个性化模型构建方法、系统、计算机及可读存储介质

Country Status (1)

Country Link
CN (1) CN116503508B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116794519B (zh) * 2023-08-28 2023-11-21 南昌航空大学 基于离线和在线估算融合算法的soh数据预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396703A (zh) * 2020-11-18 2021-02-23 北京工商大学 一种单图像三维点云模型重建方法
CN112785712A (zh) * 2021-01-25 2021-05-11 新东方教育科技集团有限公司 三维模型的生成方法、装置和电子设备
CN115345980A (zh) * 2022-10-18 2022-11-15 北京百度网讯科技有限公司 个性化纹理贴图的生成方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101997500B1 (ko) * 2014-11-25 2019-07-08 삼성전자주식회사 개인화된 3d 얼굴 모델 생성 방법 및 장치
CN109951628A (zh) * 2017-12-21 2019-06-28 广东欧珀移动通信有限公司 模型构建方法、拍照方法、装置、存储介质及终端
KR20200048032A (ko) * 2018-10-29 2020-05-08 삼성전자주식회사 이미지 생성 장치 및 방법과 생성 모델을 트레이닝시키는 장치 및 방법
CN111199579B (zh) * 2020-01-02 2023-01-24 腾讯科技(深圳)有限公司 一种目标物的三维模型构建方法、装置、设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396703A (zh) * 2020-11-18 2021-02-23 北京工商大学 一种单图像三维点云模型重建方法
CN112785712A (zh) * 2021-01-25 2021-05-11 新东方教育科技集团有限公司 三维模型的生成方法、装置和电子设备
CN115345980A (zh) * 2022-10-18 2022-11-15 北京百度网讯科技有限公司 个性化纹理贴图的生成方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Gerricka Dizon ; Ajllyana Bianca Moreno ; Reinah Kryzel Onella.Personalization of Prosthetics for Amputated People Using 3D Modeling.《2022 2nd International Conference in Information and Computing Research (iCORE)》.2023,全文. *

Also Published As

Publication number Publication date
CN116503508A (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
KR102612808B1 (ko) 조명 추정
CN109584357B (zh) 基于多轮廓线的三维建模方法、装置、系统及存储介质
CN110717953B (zh) 基于cnn-lstm组合模型的黑白图片的着色方法和系统
CN112215050A (zh) 非线性3dmm人脸重建和姿态归一化方法、装置、介质及设备
CN116503508B (zh) 一种个性化模型构建方法、系统、计算机及可读存储介质
CN113610172B (zh) 神经网络模型训练方法和装置、传感数据融合方法和装置
CN112233124A (zh) 基于对抗式学习与多模态学习的点云语义分割方法及系统
US20220138977A1 (en) Two-stage depth estimation machine learning algorithm and spherical warping layer for equi-rectangular projection stereo matching
JP7129529B2 (ja) 人工知能の使用による3dオブジェクトへのuvマッピング
CA3137297C (en) Adaptive convolutions in neural networks
CN110838122A (zh) 点云的分割方法、装置及计算机存储介质
CN115797571A (zh) 3d风格化场景的新视角合成方法
CN115019273A (zh) 一种目标检测方法、装置、汽车及存储介质
CN112669431B (zh) 图像处理方法、装置、设备、存储介质以及程序产品
CN114445479A (zh) 等矩形投影立体匹配的两阶段深度估计机器学习算法和球面扭曲层
US20230145498A1 (en) Image reprojection and multi-image inpainting based on geometric depth parameters
CN114615505A (zh) 基于深度熵编码的点云属性压缩方法、装置和存储介质
CN113901247A (zh) 一种光学图像目标检测的方法及计算设备
CN112837420A (zh) 基于多尺度和折叠结构的兵马俑点云的形状补全方法及系统
Gálvez et al. Applying clonal selection theory to data fitting with rational Bézier curves
CN113393568B (zh) 颈缘线形变预测模型的训练方法、装置、设备及介质
CN117576791B (zh) 基于生机线索和垂直领域大模型范式的活体检测方法
US11562504B1 (en) System, apparatus and method for predicting lens attribute
EP4372693A1 (en) Method for 3d reconstruction, method for training 3d reconstruction neural network system and computing system
CN114331827B (zh) 风格迁移方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant