CN116843877A - 一种远程人体三维图像重构方法 - Google Patents
一种远程人体三维图像重构方法 Download PDFInfo
- Publication number
- CN116843877A CN116843877A CN202310815284.9A CN202310815284A CN116843877A CN 116843877 A CN116843877 A CN 116843877A CN 202310815284 A CN202310815284 A CN 202310815284A CN 116843877 A CN116843877 A CN 116843877A
- Authority
- CN
- China
- Prior art keywords
- dimensional image
- human body
- dimensional
- image
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000005540 biological transmission Effects 0.000 claims abstract description 14
- 238000012216 screening Methods 0.000 claims abstract description 4
- 210000003414 extremity Anatomy 0.000 claims description 9
- 210000003423 ankle Anatomy 0.000 claims description 6
- 210000003127 knee Anatomy 0.000 claims description 6
- 210000000707 wrist Anatomy 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000003702 image correction Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/20—Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2004—Aligning objects, relative positioning of parts
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Library & Information Science (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Architecture (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及信息技术和通信技术领域,具体为一种远程人体三维图像重构方法,获取人体二维图像,通过传输端将二维图像远程传输,接收端接收人体二维图像信息,重构成三维图像;传输端包括以下步骤:S1、从数据库内获取高分辨的二维图像,查找相关图像,对二维图像进行筛选,选择人体二维图像与二维的图像背景;S2、对筛选的高分辨人体二维图像进行特征提取,得到人体二维图像中的有效特征信息;S3、将特征信息通过进行压缩,将压缩后的人体二维图像特征信息发送至接收端;接收端包括以下步骤:S4、接收端通过蓝牙或网络的方式与传输端进行配对与连接;S5、输入配对时的密码、秘钥等加密信息,完成配对,实现人体二维图像特征传输。
Description
技术领域
本发明涉及信息技术和通信技术领域,具体为一种远程人体三维图像重构方法。
背景技术
体姿态三维重构是近年来计算机视觉领域中备受关注的前沿方向,它从包含人体在人体图像序列中检测、运动分析、三维人体跟踪以及行为进行理解与描述,属于图像分析和理解的范畴。从技术角度而言,人的运动分析的研究内容相当丰富,主要涉及到模式识别、图像处理、计算机视觉、人工智能等学科知识;同时,动态场景中运动的快速分割、人体的姿态变化、人体自遮挡等也为人体姿态三维重建带来了很大的挑战。由于人体三维姿态重构与人体三维运动分析在高级人机交互、安全监控、视频会议、医疗诊断及基于内容的图像存储与检索等方面具有广泛的应用前景和潜在的经济价值,从而激发了国内外广大科研工作者及相关商家的浓厚兴趣,尤其在美国、英国等国家已经开展了大量相关项目的研究。人体姿态三维重构目前主要应用于智能视频监控、智能人机接口、虚拟现实以及游戏制作、体育运动分析以及康复评价。
随着计算机技术的发展,通过信息技术领域AI(人工智能)的图像识别和机器学习,可实现将本地获取的图像数据进行数字编码和还原,从而实现远程的三维影像同步投射,这一技术使用于远程视频通讯中时,可以使得通讯具有裸眼三维效果功能,有望实现全息网络视频通话。但该技术需要依赖良好的通信环境以及优异的三维重构模型,在通信环境不好的情况下,本地获取的高清图像数据无法实时的进行传输,影响接收端的三维重构速度,而三维重构模型直接关乎裸眼三维效果的优劣。
公开号:CN103942829A的中国专利,公开了一种单幅图像的人体三维姿态重构方法,其特征在于,所述单幅图像的人体三维姿态重构方法包括以下步骤:步骤一,建立人体的标准三维骨架模型;步骤二,在人体图像中生成人体关节点及肢体端点的位置;步骤三,估计弱透视投影的比例参数,比例参数是图像中的人体相邻关节点间的距离与标准三维骨架模型中对应的肢体长度比例的最大值,按照所估计出的弱透视投影比例参数将标准三维骨架放大;步骤四,保持骨架的肢体长度不变,从根节点开始,依次调节标准三维骨架中的人体节点的位置,实现标准三维骨架中的所有节点皆与图像中相应的标记点基本的初步对齐;步骤五,采用优化算法进行人体姿态优化,使标准三维骨架的所有节点在人体图像上的弱透视投影与相应的图像标记点位置之差的总合为最小。
上述专利存在以下问题:
方法实现单幅图像的三维姿态重构,但是在视频通话中,接收的是源源不断的数据流,该方法无法应用于实时视频通讯中,人体三维姿态重构中,通常所采用的图像特征包括二维人体轮廓特征、人体图像边缘特征、纹理特征等,但是重构的效率较低。鉴于此,我们提出一种远程人体三维图像重构方法。
发明内容
本发明的目的在于提供一种远程人体三维图像重构方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种远程人体三维图像重构方法,包括:获取人体二维图像,通过传输端将二维图像远程传输,接收端接收人体二维图像信息,重构成三维图像;
传输端包括以下步骤:
S1、从数据库内获取高分辨的二维图像,查找相关图像,对二维图像进行筛选,选择人体二维图像与二维的图像背景;
S2、对筛选的高分辨人体二维图像进行特征提取,得到人体二维图像中的有效特征信息;
S3、将特征信息通过进行压缩,将压缩后的人体二维图像特征信息发送至接收端;
接收端包括以下步骤:
S4、接收端通过蓝牙或网络的方式与传输端进行配对与连接;
S5、输入配对时的密码、秘钥等加密信息,完成配对,实现人体二维图像特征传输;
S6、接收端在接收到人体二维图像特征后会通过计算机会人体二维图像特征进行扫描,分析出图像特征信息中的关键点,通过人体关键点检测神经网络检测人体关键点;
S7、通过所得到的图像特征信息进行重构人体三维图像;
S8、计算机通过扫描的特征信息,在计算机软件中,生成人体三维图像,对接收到的每个图像进行重构得到的三维人体轮廓,从各三维人体轮廓中抽取出人体骨架模型;
S9、在人体三维图像生成时,计算机会不断的扫描图片中的特征信息,不断的对比与矫正,从而完成人体三维图像的构造。
优选的,所述步骤S6中,主要扫描二维骨架模型,在人体图像中生成人体关节点及肢体端点的位置,按照所得到的体关节点及肢体端点的位置形成特征信息。
优选的,所述步骤S9中,会将扫描的人物特征与图片背景分别进行分析,分别对人物特征信息与图片背景特征信息进行分类。
优选的,所述图像特征信息包括二维人体轮廓特征、人体图关键点特征、纹理特征等。
优选的,所述二维人体轮廓特征包括人体的骨架高度,人体的姿态、以及各个关节部位特征。
优选的,所述人体关键点特征包括嘴巴、下巴、左肩、左手肘、左手腕、右肩、右手肘、右手腕、左臂、左膝、左脚踝、右臂、右膝、右脚踝、左眼、右眼、左耳和右耳。
优选的,所述在接收端预存储有人体三维模型,通过人体关键点位置重构人体三维图像。
优选的,所述步骤S2中对获取的高分辨率二维图像进行两次压缩处理,得到中分辨率的二维图像和低分辨率的二维图像,其中,中分辨率的二维图像用于进行特征提取,低分辨率的二维图像为压缩后的二维图像,对获取的高分辨率二维图像进行压缩处理,得到压缩后的二维图像,具体为:设高分辨率二维图像的图像分辨率为,压缩后的二维图像的图像分辨率为,n小于N,m小于M,压缩后的二维图像的坐标为(i,j)的像素点,其在高分辨率二维图像的对应坐标为,通过距离高分辨率二维图像中坐标最近的四个像素点的像素值,使用双线性插值法计算压缩后的二维图像的坐标为(i,j)的像素点的像素值:令四个最近的像素点坐标为:左下角,左上角,右下角,右上角,则压缩编码后的二维图像的坐标为(i,j)的像素点的像素值f(i,j)为:
式中,w1、w2、w3、w4为权重,p1、p2、p3、p4分别为像素点p1、p2、p3、p4的像素值。
优选的,所述S9中,图像矫正为:
dstx=R*R2-ρ2x02+y02*(x0*x-y0*y)(x2+y2)*(R2-ρ2)+(R2-ρ*x)2,dsty=R*R2-ρ2x02+y02*(x0*y+y0*x)(x2+y2)*(R2-ρ2)+(R2-ρ*x)2其中,(x0,y0)为光栅投影图像上待矫正区域的还原点坐标,(x,y)为光栅投影图像上待矫正区域上任意点的坐标,(dstx,dsty)为对(x,y)矫正后的坐标,R为所述待矫正区域所在扇形的半径
与现有技术相比,本发明的有益效果是:
1.该远程人体三维图像重构方法采用图像人体二维标记与人体三维骨架的节点位置配准实现人体骨架的三维姿态重建,属于计算机视觉领域。提高了重构中对人体三维初始姿态误差的容忍,同时,简化了运算过程,提高了计算速度,大大地提高了三维姿态重构的效率。
2.该远程人体三维图像重构方法,具有裸眼三维效果功能,有望实现全息网络视频通话,让远方亲友仿佛近在眼前。使用本发明,本发明通过在发送端进行数据压缩和特征提取,将图像数据进行压缩得到高压缩比的数据,从而减少网络带宽和时延,可以大幅降低对网络传输质量的依赖,降低通讯成本。本发明在接收端使用神经网络重构人体三维图像,实现良好的裸眼三维效果,提升视频通话的用户体验。
附图说明
图1为本发明的方法流程示意图之一;
图2为本发明中人体三维骨架模型示意图;
图3为本发明中人体关键点特征示意图;
图4为本发明的方法流程示意图之二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本专利的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“设置”应做广义理解,例如,可以是固定相连、设置,也可以是可拆卸连接、设置,或一体地连接、设置。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利中的具体含义。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
请参阅图1-图4所示,本发明提供的一种技术方案:
一种远程人体三维图像重构方法,获取人体二维图像,通过传输端将二维图像远程传输,接收端接收人体二维图像信息,重构成三维图像;
传输端包括以下步骤:
S1、从数据库内获取高分辨的二维图像,查找相关图像,对二维图像进行筛选,选择人体二维图像与二维的图像背景;
S2、对筛选的高分辨人体二维图像进行特征提取,得到人体二维图像中的有效特征信息;
S3、将特征信息通过进行压缩,将压缩后的人体二维图像特征信息发送至接收端;
接收端包括以下步骤:
S4、接收端通过蓝牙或网络的方式与传输端进行配对与连接;
S5、输入配对时的密码、秘钥等加密信息,完成配对,实现人体二维图像特征传输;
S6、接收端在接收到人体二维图像特征后会通过计算机会人体二维图像特征进行扫描,分析出图像特征信息中的关键点,通过人体关键点检测神经网络检测人体关键点;
S7、通过所得到的图像特征信息进行重构人体三维图像;
S8、计算机通过扫描的特征信息,在计算机软件中,生成人体三维图像,对接收到的每个图像进行重构得到的三维人体轮廓,从各三维人体轮廓中抽取出人体骨架模型;
S9、在人体三维图像生成时,计算机会不断的扫描图片中的特征信息,不断的对比与矫正,从而完成人体三维图像的构造。
本实施例中,步骤S6中,主要扫描二维骨架模型,在人体图像中生成人体关节点及肢体端点的位置,按照所得到的体关节点及肢体端点的位置形成特征信息。
本实施例中,步骤S9中,会将扫描的人物特征与图片背景分别进行分析,分别对人物特征信息与图片背景特征信息进行分类。
本实施例中,图像特征信息包括二维人体轮廓特征、人体图关键点特征、纹理特征等。
本实施例中,二维人体轮廓特征包括人体的骨架高度,人体的姿态、以及各个关节部位特征。
本实施例中,人体关键点特征包括嘴巴、下巴、左肩、左手肘、左手腕、右肩、右手肘、右手腕、左臂、左膝、左脚踝、右臂、右膝、右脚踝、左眼、右眼、左耳和右耳。
本实施例中,在接收端预存储有人体三维模型,通过人体关键点位置重构人体三维图像。
本实施例中,步骤S2中对获取的高分辨率二维图像进行两次压缩处理,得到中分辨率的二维图像和低分辨率的二维图像,其中,中分辨率的二维图像用于进行特征提取,低分辨率的二维图像为压缩后的二维图像,对获取的高分辨率二维图像进行压缩处理,得到压缩后的二维图像,具体为:设高分辨率二维图像的图像分辨率为,压缩后的二维图像的图像分辨率为,n小于N,m小于M,压缩后的二维图像的坐标为(i,j)的像素点,其在高分辨率二维图像的对应坐标为,通过距离高分辨率二维图像中坐标最近的四个像素点的像素值,使用双线性插值法计算压缩后的二维图像的坐标为(i,j)的像素点的像素值:令四个最近的像素点坐标为:左下角,左上角,右下角,右上角,则压缩编码后的二维图像的坐标为(i,j)的像素点的像素值f(i,j)为:
式中,w1、w2、w3、w4为权重,p1、p2、p3、p4分别为像素点p1、p2、p3、p4的像素值。
本实施例中,S9中,图像矫正为:
dstx=R*R2-ρ2x02+y02*(x0*x-y0*y)(x2+y2)*(R2-ρ2)+(R2-ρ*x)2,dsty=R*R2-ρ2x02+y02*(x0*y+y0*x)(x2+y2)*(R2-ρ2)+(R2-ρ*x)2其中,(x0,y0)为光栅投影图像上待矫正区域的还原点坐标,(x,y)为光栅投影图像上待矫正区域上任意点的坐标,(dstx,dsty)为对(x,y)矫正后的坐标,R为所述待矫正区域所在扇形的半径。
本实施例的远程人体三维图像重构方法在使用时,采用图像人体二维标记与人体三维骨架的节点位置配准实现人体骨架的三维姿态重建,属于计算机视觉领域。提高了重构中对人体三维初始姿态误差的容忍,同时,简化了运算过程,提高了计算速度,大大地提高了三维姿态重构的效率。具有裸眼三维效果功能,有望实现全息网络视频通话,让远方亲友仿佛近在眼前。使用本发明,本发明通过在发送端进行数据压缩和特征提取,将图像数据进行压缩得到高压缩比的数据,从而减少网络带宽和时延,可以大幅降低对网络传输质量的依赖,降低通讯成本。本发明在接收端使用神经网络重构人体三维图像,实现良好的裸眼三维效果,提升视频通话的用户体验。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (9)
1.一种远程人体三维图像重构方法,其特征在于,包括:获取人体二维图像,通过传输端将二维图像远程传输,接收端接收人体二维图像信息,重构成三维图像;
传输端包括以下步骤:
S1、从数据库内获取高分辨的二维图像,查找相关图像,对二维图像进行筛选,选择人体二维图像与二维的图像背景;
S2、对筛选的高分辨人体二维图像进行特征提取,得到人体二维图像中的有效特征信息;
S3、将特征信息通过进行压缩,将压缩后的人体二维图像特征信息发送至接收端;
接收端包括以下步骤:
S4、接收端通过蓝牙或网络的方式与传输端进行配对与连接;
S5、输入配对时的密码、秘钥等加密信息,完成配对,实现人体二维图像特征传输;
S6、接收端在接收到人体二维图像特征后会通过计算机会人体二维图像特征进行扫描,分析出图像特征信息中的关键点,通过人体关键点检测神经网络检测人体关键点;
S7、通过所得到的图像特征信息进行重构人体三维图像;
S8、计算机通过扫描的特征信息,在计算机软件中,生成人体三维图像,对接收到的每个图像进行重构得到的三维人体轮廓,从各三维人体轮廓中抽取出人体骨架模型;
S9、在人体三维图像生成时,计算机会不断的扫描图片中的特征信息,不断的对比与矫正,从而完成人体三维图像的构造。
2.根据权利要求1所述的远程人体三维图像重构方法,其特征在于:所述步骤S6中,主要扫描二维骨架模型,在人体图像中生成人体关节点及肢体端点的位置,按照所得到的体关节点及肢体端点的位置形成特征信息。
3.根据权利要求1所述的远程人体三维图像重构方法,其特征在于:所述步骤S9中,会将扫描的人物特征与图片背景分别进行分析,分别对人物特征信息与图片背景特征信息进行分类。
4.根据权利要求1所述的远程人体三维图像重构方法,其特征在于:所述图像特征信息包括二维人体轮廓特征、人体图关键点特征、纹理特征等。
5.根据权利要求4所述的远程人体三维图像重构方法,其特征在于:所述二维人体轮廓特征包括人体的骨架高度,人体的姿态、以及各个关节部位特征。
6.根据权利要求4所述的远程人体三维图像重构方法,其特征在于:所述人体关键点特征包括嘴巴、下巴、左肩、左手肘、左手腕、右肩、右手肘、右手腕、左臂、左膝、左脚踝、右臂、右膝、右脚踝、左眼、右眼、左耳和右耳。
7.根据权利要求1所述的远程人体三维图像重构方法,其特征在于:所述在接收端预存储有人体三维模型,通过人体关键点位置重构人体三维图像。
8.根据权利要求1所述的远程人体三维图像重构方法,其特征在于:所述步骤S2中对获取的高分辨率二维图像进行两次压缩处理,得到中分辨率的二维图像和低分辨率的二维图像,其中,中分辨率的二维图像用于进行特征提取,低分辨率的二维图像为压缩后的二维图像,对获取的高分辨率二维图像进行压缩处理,得到压缩后的二维图像,具体为:设高分辨率二维图像的图像分辨率为,压缩后的二维图像的图像分辨率为,n小于N,m小于M,压缩后的二维图像的坐标为(i,j)的像素点,其在高分辨率二维图像的对应坐标为,通过距离高分辨率二维图像中坐标最近的四个像素点的像素值,使用双线性插值法计算压缩后的二维图像的坐标为(i,j)的像素点的像素值:令四个最近的像素点坐标为:左下角,左上角,右下角,右上角,则压缩编码后的二维图像的坐标为(i,j)的像素点的像素值f(i,j)为:
式中,w1、w2、w3、w4为权重,p1、p2、p3、p4分别为像素点p1、p2、p3、p4的像素值。
9.根据权利要求1所述的远程人体三维图像重构方法,其特征在于:所述S9中,图像矫正为:
dstx=R*R2-ρ2x02+y02*(x0*x-y0*y)(x2+y2)*(R2-ρ2)+(R2-ρ*x)2,dsty=R*R2-ρ2x02+y02*(x0*y+y0*x)(x2+y2)*(R2-ρ2)+(R2-ρ*x)2其中,(x0,y0)为光栅投影图像上待矫正区域的还原点坐标,(x,y)为光栅投影图像上待矫正区域上任意点的坐标,(dstx,dsty)为对(x,y)矫正后的坐标,R为所述待矫正区域所在扇形的半径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815284.9A CN116843877A (zh) | 2023-07-04 | 2023-07-04 | 一种远程人体三维图像重构方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815284.9A CN116843877A (zh) | 2023-07-04 | 2023-07-04 | 一种远程人体三维图像重构方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116843877A true CN116843877A (zh) | 2023-10-03 |
Family
ID=88158465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310815284.9A Pending CN116843877A (zh) | 2023-07-04 | 2023-07-04 | 一种远程人体三维图像重构方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116843877A (zh) |
-
2023
- 2023-07-04 CN CN202310815284.9A patent/CN116843877A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111553968B (zh) | 一种三维人体重构动画的方法 | |
Pearson | Developments in model-based video coding | |
US6222560B1 (en) | Transmitter-receiver of three-dimensional skeleton structure motions and method thereof | |
CN108288072A (zh) | 一种基于生成对抗网络的面部表情合成方法 | |
CN107958444A (zh) | 一种基于深度学习的人脸超分辨率重建方法 | |
US6031539A (en) | Facial image method and apparatus for semi-automatically mapping a face on to a wireframe topology | |
CN110473266A (zh) | 一种基于姿态指导的保留源场景人物动作视频生成方法 | |
CN113393550B (zh) | 一种姿态和纹理引导的时尚服装设计合成方法 | |
US20230230305A1 (en) | Online streamer avatar generation method and apparatus | |
Valente et al. | Face tracking and realistic animations for telecommunicant clones | |
CN112819951A (zh) | 一种基于深度图修复的带遮挡三维人体重建方法 | |
JP2022512262A (ja) | 画像処理方法及び装置、画像処理機器並びに記憶媒体 | |
CN112927348B (zh) | 一种基于多视点rgbd相机高分辨率人体三维重建方法 | |
CN117711066A (zh) | 一种三维人体姿态估计方法、装置、设备及介质 | |
CN111476899A (zh) | 基于单视点rgb相机的人手稠密纹理坐标三维重建方法 | |
CN116843877A (zh) | 一种远程人体三维图像重构方法 | |
KR100902995B1 (ko) | 최적화 비율의 얼굴영상 형성 방법 및 이에 적용되는 장치 | |
CN115908712A (zh) | 基于图像的三维重建及模型训练方法、设备及存储介质 | |
JP2001231037A (ja) | 画像処理システム、画像処理装置、及び記憶媒体 | |
CN115880766A (zh) | 姿态迁移、姿态迁移模型训练方法、装置和存储介质 | |
WO2001029767A2 (en) | System and method for three-dimensional modeling | |
Ebihara et al. | Real-time facial expression detection based on frequency domain transform | |
CN116091704B (zh) | 一种远程人体三维图像重构方法 | |
CN116385663B (zh) | 动作数据生成方法、装置、电子设备及存储介质 | |
Jiang et al. | Learning 3D human body embedding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |