CN114359522A - Ar模型放置方法及装置 - Google Patents

Ar模型放置方法及装置 Download PDF

Info

Publication number
CN114359522A
CN114359522A CN202111609183.3A CN202111609183A CN114359522A CN 114359522 A CN114359522 A CN 114359522A CN 202111609183 A CN202111609183 A CN 202111609183A CN 114359522 A CN114359522 A CN 114359522A
Authority
CN
China
Prior art keywords
dimensional
target object
model
initial model
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111609183.3A
Other languages
English (en)
Inventor
肖东晋
张立群
刘顺宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alva Systems
Original Assignee
Alva Systems
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alva Systems filed Critical Alva Systems
Priority to CN202111609183.3A priority Critical patent/CN114359522A/zh
Publication of CN114359522A publication Critical patent/CN114359522A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Architecture (AREA)
  • Image Analysis (AREA)

Abstract

本公开的实施例提供了一种AR模型放置方法及装置。所述方法包括分析目标对象的三维AR初始模型和现场图像的特征信息,得到对应关系;根据所述对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型;根据所述三维AR修正模型,生成放置目标对象的三维AR修正模型的位置与姿态信息,作为二维放置信息;根据所述二维放置信息,在现场图像中对所述三维AR修正模型进行放置。以此方式,可以克服三维AR模型与实际目标对象的差异,提升三维AR模型放置的准确率与稳定性。

Description

AR模型放置方法及装置
技术领域
本公开涉及人工智能与计算机视觉技术领域,尤其涉及AR模型放置技术领域。
背景技术
现代工业AR的典型应用包括将给定目标对象的三维AR模型(比如车辆、机械等)放置到视频中拍摄的目标对象上,使得两者可以严丝合缝地贴合在一起,并且当镜头移动时,视频图像中的三维AR模型和目标对象同步移动,不会分离。
但将三维AR模型和目标对象两者严丝合缝地贴合在一起并不容易实现,且现有的AR模型放置难度和复杂度较高,包括:给定目标对象的三维AR模型与实际的目标对象间,并不是完全一致。从色彩到纹理到表面状况都有可能存在差异。而且,视频图像中的目标对象的摆放位置与姿态比较随意,因此需要事先获取其位置与姿态信息,才能够完成三维AR模型的放置,提高了AR模型放置的难度和复杂度。
发明内容
本公开提供了一种AR模型放置的方法、装置、设备以及存储介质。
根据本公开的第一方面,提供了一种AR模型放置方法。该方法包括分析目标对象的三维AR初始模型和现场图像的特征信息,生成对应关系;根据所述特征信息和生成的对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型;根据所述三维AR修正模型,生成放置目标对象的三维AR修正模型的位置与姿态信息,作为二维放置信息。
根据本公开的第二方面,提供了一种AR模型放置装置,该装置包括分析模块,用于分析目标对象的三维AR初始模型和现场图像的特征信息,生成对应关系;修正模块,用于根据所述特征信息和生成的对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型;生成模块,用于根据所述三维AR修正模型,生成放置目标对象的三维AR修正模型的位置与姿态信息,作为二维放置信息。
根据本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面和/或第二发面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。附图用于更好地理解本方案,不构成对本公开的限定在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了根据本公开的实施例的AR模型放置方法的流程图;
图2示出了根据本公开的实施例的AR模型放置方法中将目标对象的三维AR模型和目标对象现场图像进行特征提取与对应的流程图;
图3示出了根据本公开的实施例的AR模型装置的框图;
图4示出了能够实施本公开的实施例的示例性电子设备的方框图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1示出了根据本公开实施例的二维-三维混合式AR模型放置方法100的流程图。
在框102,将目标对象的三维AR初始模型和目标对象现场图像进行特征提取与对应。
在一些实施例中,以目标对象的三维AR初始模型和若干目标对象的现场拍摄图像或第一现场图像为输入,将目标对象与现场背景分离,分析三维AR初始模型与现场目标对象的特征,并在特征间寻找对应关系。
将目标对象的三维AR初始模型作为输入,对目标对象的三维AR初始模型进行分析,提取其形状、部件、颜色、纹理、突出部、连接处等特征。
将目标对象现场图像(一帧或者几帧,帧数可以根据现场情况确定;一般帧数越多,计算量越大,特征对应越全面)作为输入,使用常规的方法(例如深度检测网络)对目标对象现场图像中的目标对象进行检测,确定其在现场图像中的位置。将目标对象现场图像中的目标对象与背景图像分离,得到独立的目标对象实采二维图像。对所得到的目标对象实采二维图像进行分析,提取其关键点、颜色、纹理等特征。
将目标对象的三维AR初始模型的二维投影特征与目标对象实采二维图像的二维特征进行对应,得到它们之间的对应关系。
其中,目标对象的三维AR初始模型由特定的数据格式描述,包括传统的CAD软件输入数据格式,如3DS、ACIS、CATIA、PRO/E等,也包括较新的3D设计软件的输入数据格式,如PDF、XML、CSV、JSON等。
目标对象现场图像为现场拍摄,可以是一帧图像,也可以是多帧图像。图像中需要有目标对象(位置和姿态不限),可以有各种背景。图像的格式可以是图片(例如JPG、BMP、PNG等),也可以是视频(MP4等)。
在一些实施例中,将目标对象的三维AR初始模型的特征与目标对象实采二维图像的特征进行对应,得到它们之间的对应关系的对应关系包括:
关键点对应:首先在目标对象实采二维图像中进行角点检测,这里可以使用FAST或者Shi-Tomasi等计算机视觉领域常用的角点检测方法,获取图像中的角点集合。随后提取角点的特征描述字,这里可以使用SIFT或者Surf等计算机视觉领域常用的特征描述字。将三维AR初始模型中的关键点(包括突出顶点、刚体连接点等)所在的局部,按照不同角度进行投影,得到其二维图像块(Patch),对这些图像块提取特征描述字(方法与前述二维图像中的处理相同),随后将三维AR初始模型中关键点所在局部的二维投影的特征描述字,与二维图像中各角点的特征描述字进行比对,找到二维图像中与三维AR初始模型中关键点的二维投影特征描述字最为接近的角点,并将其作为三维AR模型中关键点的对应点。
颜色对应:利用前述二维图像角点,利用计算机视觉中区域构建的常用方法形成二维区域,并提取该区域的颜色。如果该区域包含多种颜色,则利用颜色梯度来搜索颜色变化的点,并利用这些点进一步形成单色区域。另一方面,在三维AR初始模型中提取各个零部件的颜色。首先根据三维初始AR模型中零部件的顶点或者连接点(这些都是关键点)在二维图像上的对应点,获取与该零部件对应的二维区域。随后将三维AR初始模型零部件的颜色与二维图像上区域的颜色形成对应。
纹理对应:在前述二维区域内提取纹理特征,例如灰度共生矩阵(GLCM)等计算机视觉领域常用的纹理描述信息。同时将三维AR初始模型的零部件做二维投影,并使用相同的方法提取其纹理描述信息。随后将三维AR模型零部件的纹理与二维图像上区域的纹理形成对应。
这里所说的两个对象“形成对应”,并不要求两者间完全相同或者类似。事实上,正因为很多情况下三维AR初始模型与其二维实采图像之间因光照、角度、环境等方面的影响而存在差异,才寻求这种对应。基于这种对应关系,可以对三维AR初始模型进行有目的的改变,使之与实采图像更加贴合。
在一些实施例中,将目标对象的三维AR初始模型和目标对象现场图像进行特征提取与对应,如图2所示,包括以下子步骤:
在框202中,进行模型三维旋转,将三维AR初始模型按照通常的三维空间几何理论给出的三个自由度(或者说欧拉角)进行旋转,并记录姿态(旋转角度)信息。
在框204中,进行二维投影,将旋转到特定角度的三维AR初始模型投影成二维图像,用于下一步特征分析与提取。
在框206中,进行模型特征提取,将框204中输出的二维图像与三维AR初始模型数据相结合,提取目标对象的三维AR初始模型的特征,包括形状、部件、颜色、纹理、突出部、连接处等。需要指出的是,由于我们有三维AR初始模型,对目标对象的认识更加全面。因此特征提取时可以将二维和三维信息结合,弥补单纯二维图像处理的能力不足。利用三维模型启发所得到的二维投影特征,应都属于本发明所涉及的特征提取范畴。
在框208中,进行目标检测分离,利用成熟的目标检测技术(例如深度检测网络),从输入的带有目标对象的现场采集图像中把目标对象检测出来并进行标记。将标记后的目标对象同图像中的背景分离,得到目标对象自身的二维图像。
在框210中,进行目标二维特征提取,输出目标对象自身二维图像中的二维特征,包括形状、部件、颜色、纹理、突出部、连接处等,使用适当的特征描述字进行记录。
在框212中,进行模型目标特征对应,将框205输出的目标对象的三维AR初始模型的二维投影特征和框210输出的目标对象自身二维图像中的二维特征进行对应,找到其中的局部相似点,包括(但不限于)颜色、部件形状、连接线走向、纹理等。对于相似的地方,形成包括三维AR初始模型和目标对象二维图像上的位置坐标、相似度等信息的对应记录。
在一些实施例中,将三维AR初始模型的空间特征信息和目标对象的空间特征信息结合在一起,形成特征之间的多维对应。这类对应关系既包括点对点对应,也包括点对多点以及多点对多点的对应。分析模块的输出包括三维AR初始模型和现场图像中的目标对象的空间特征信息,以及特征之间的对应信息。
在框214中,将三维AR初始模型和现场图像中的目标对象的空间特征信息,以及特征之间的对应信息使用统一的格式打包输出。
在框104,根据三维AR初始模型和现场图像中的目标对象的空间特征信息,以及特征之间的对应信息,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型;
根据三维AR初始模型的特征与目标对象实采二维图像特征,以及它们之间的对应关系,对三维AR初始模型进行必要的修正,使之更加适合于和现场图像中的目标对象紧密贴合。根据在框102中得到的目标对象的三维AR初始模型和目标对象实采二维图像间特征的对应,对目标对象的三维AR初始模型进行必要的局部修正和改变,更换局部的颜色、纹理、形状以及其他特征。
在一些实施例中,对目标对象的三维AR初始模型进行必要的局部修正和改变包括:
颜色修正:根据在框102中形成的三维AR初始模型零部件与实采二维图像区域之间的颜色对应,以实采二维图像区域的颜色为准,调整三维AR初始模型对应零部件的颜色,使之尽量接近实测二维图像的对应区域。
纹理更换:根据在框102中形成的三维AR初始模型零部件与实采二维图像区域之间的纹理对应,以实采二维图像区域的纹理为准,更换三维AR初始模型对应零部件的纹理,使之尽量接近实测二维图像的对应区域。
这种修正并不限于只针对三维AR初始模型的特征与目标对象实采二维图像特征,以及它们之间的对应关系中所提到的特征所对应的局部位置。由三维AR初始模型的特征与目标对象实采二维图像特征,以及它们之间的对应关系中的特征及其对应关系所启发的目标对象三维AR初始模型的任何部分的改动,都属于本发明所涉及的修正范畴。这里需要说明,三维AR初始模型进行修正之前,应保存其原始形式作为备份。修正后的三维AR模型和其原始形式间存在差异是正常的。修正后的AR模型仅仅用于获取最佳的放置位置和姿态角度,实际放置的三维AR模型应为其原始形式,这样才符合AR基本要求。
在框106,根据所述三维AR修正模型与新的目标对象现场图像,生成放置目标对象的三维AR修正模型的位置与姿态信息,作为二维放置信息;
在一些实施例中,使用修正过的三维AR模型和新的目标对象现场图像或者目标对象的第二现场图像作为输入,通过计算生成三维AR模型放置的方位和角度。通过改变修正过的三维AR模型的投影方向,将其二维投影与新的目标对象现场图像或者目标对象的第二现场图像进行匹配,找到最佳的匹配位置以及三维AR模型的姿态角度。输出修正过的三维AR模型的位置和姿态角度信息。
如果所输入的新的目标对象现场图像中不存在目标对象,则生成模块将输出错误信息,告知用户目标对象不存在。
在框108,根据所述二维放置信息,在现场图像中对所述三维AR修正模型进行放置。
根据本公开的实施例,实现了以下技术效果:
通过对三维AR初始模型和实采二维图像分别提取特征并在特征之间建立起对应关系,实现目标对象的三维AR初始模型与实采二维图像的紧密耦合。
通过对应关系修正三维AR初始模型,对目标对象的三维AR初始模型进行修正,修补和更换其局部的颜色、形状、纹理等,使之与目标对象的实采二维图像有更好的贴合,从而克服三维AR初始模型与实际目标对象的差异。
显著提升了三维AR模型放置的准确率与稳定性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。
以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。
图3示出了根据本公开的实施例的AR模型放置装置300的方框图。AR模型放置装置300包括:
分析模块302,用于分析目标对象的三维AR初始模型和现场图像的特征信息,生成对应关系;
修正模块304,用于根据所述特征信息和生成的对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型;
生成模块306,用于根据所述三维AR修正模型,生成放置目标对象的三维AR修正模型的位置与姿态信息,作为二维放置信息;
执行模块308,用于根据所述二维放置信息,在现场图像中对所述三维AR修正模型进行放置。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图4示出了可以用来实施本公开的实施例的电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
设备400包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM 403中,还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
设备400中的多个部件连接至I/O接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,例如方法100、200。例如,在一些实施例中,方法100、200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到RAM 403并由计算单元401执行时,可以执行上文描述的方法100、200的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法100、200的一个或多个步骤。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (10)

1.一种AR模型放置方法,其特征在于,包括:
分析目标对象的三维AR初始模型和现场图像的特征信息,生成对应关系;
根据所述特征信息和生成的对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型;
根据所述三维AR修正模型,生成放置目标对象的三维AR修正模型的位置与姿态信息,作为二维放置信息。
2.根据权利要求1所述的方法,其中,所述分析目标对象的三维AR初始模型和现场图像的特征信息,得到对应关系包括:
以目标对象的三维AR初始模型和目标对象的第一现场图像为输入,将目标对象与现场背景分离;
分析所述三维AR初始模型与所述第一现场图像中的目标对象的特征信息,并在特征信息间寻找所述对应关系。
3.根据权利要求2所述的方法,其中,所述分析所述三维AR初始模型与所述第一现场图像中的目标对象的特征信息,并在特征信息间寻找所述对应关系包括:
处理三维AR初始模型,以提取三维AR初始模型的三维空间特征信息;所述三维空间特征信息包括形状、颜色、部件、基本构型、突出部、连接处以及纹理;
处理第一现场图像,从第一现场图像中分离出目标对象,以使得特征提取子模块能够分析目标对象的二维空间特征信息;
将三维AR初始模型的三维空间特征信息和目标对象的二维空间特征信息结合在一起,形成特征信息之间的多维的对应关系。
4.根据权利要求2所述的方法,其中,
所述第一现场图像为多帧,对每一帧第一现场图像,分析所述三维AR初始模型与所述第一现场图像中的目标对象的特征信息,并在特征信息间寻找所述对应关系。
5.根据权利要求2所述的方法,其中,所述根据所述特征信息和生成的对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型包括:
将三维AR初始模型进行旋转,并记录姿态信息;
将旋转到特定角度的三维AR初始模型投影成二维图像,用于下一步特征分析与提取。
将二维图像与三维AR初始模型数据相结合,提取目标对象的三维AR初始模型的二维投影特征;
从第一现场图像中把目标对象检测出来并进行标记,将标记后的目标对象同第一现场图像中的背景分离,得到目标对象自身的二维图像;
进行目标二维特征提取,输出目标对象自身二维图像中的二维特征;
将目标对象的三维AR初始模型的二维投影特征和目标对象自身二维图像中的二维特征进行对应,将三维AR初始模型和现场图像中的目标对象的空间特征信息,以及特征之间的对应信息使用统一的格式打包输出。
6.根据权利要求2所述的方法,其中,所述根据所述特征信息和生成的对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型包括:
根据所述特征信息和生成的对应关系,改变三维AR初始模型的颜色、纹理以及局部特征,得到更加贴近第一现场图像中的目标对象的三维AR修正模型。
7.根据权利要求6所述的方法,其中,所述根据所述三维AR修正模型,生成放置目标对象的三维AR修正模型的位置与姿态信息包括:
以所述三维AR修正模型及目标对象的第二现场图像为输入,通过改变三维AR修正模型的投影方向,将其二维投影与目标对象的第二现场图像进行匹配,生成所述三维AR修正模型放置的方位和角度。
8.一种AR模型放置装置,其特征在于,包括:
分析模块,用于分析目标对象的三维AR初始模型和现场图像的特征信息,生成对应关系;
修正模块,用于根据所述特征信息和生成的对应关系,对目标对象的三维AR初始模型进行修正,得到三维AR修正模型;
生成模块,用于根据所述三维AR修正模型,生成放置目标对象的三维AR修正模型的位置与姿态信息,作为二维放置信息。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
CN202111609183.3A 2021-12-23 2021-12-23 Ar模型放置方法及装置 Pending CN114359522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111609183.3A CN114359522A (zh) 2021-12-23 2021-12-23 Ar模型放置方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111609183.3A CN114359522A (zh) 2021-12-23 2021-12-23 Ar模型放置方法及装置

Publications (1)

Publication Number Publication Date
CN114359522A true CN114359522A (zh) 2022-04-15

Family

ID=81102157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111609183.3A Pending CN114359522A (zh) 2021-12-23 2021-12-23 Ar模型放置方法及装置

Country Status (1)

Country Link
CN (1) CN114359522A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794459A (zh) * 2010-02-09 2010-08-04 北京邮电大学 一种立体视觉影像与三维虚拟物体的无缝融合方法
CN105844696A (zh) * 2015-12-31 2016-08-10 清华大学 基于射线模型三维重构的图像定位方法以及装置
CN108122256A (zh) * 2017-12-25 2018-06-05 北京航空航天大学 一种逼近状态下旋转目标位姿测量的方法
CN108470328A (zh) * 2018-03-28 2018-08-31 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置
CN111597465A (zh) * 2020-04-28 2020-08-28 北京字节跳动网络技术有限公司 展示方法、装置和电子设备
CN112669198A (zh) * 2020-10-29 2021-04-16 北京达佳互联信息技术有限公司 图像特效的处理方法、装置、电子设备和存储介质
CN113409468A (zh) * 2021-05-10 2021-09-17 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794459A (zh) * 2010-02-09 2010-08-04 北京邮电大学 一种立体视觉影像与三维虚拟物体的无缝融合方法
CN105844696A (zh) * 2015-12-31 2016-08-10 清华大学 基于射线模型三维重构的图像定位方法以及装置
CN108122256A (zh) * 2017-12-25 2018-06-05 北京航空航天大学 一种逼近状态下旋转目标位姿测量的方法
CN108470328A (zh) * 2018-03-28 2018-08-31 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置
CN111597465A (zh) * 2020-04-28 2020-08-28 北京字节跳动网络技术有限公司 展示方法、装置和电子设备
CN112669198A (zh) * 2020-10-29 2021-04-16 北京达佳互联信息技术有限公司 图像特效的处理方法、装置、电子设备和存储介质
CN113409468A (zh) * 2021-05-10 2021-09-17 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110135455B (zh) 影像匹配方法、装置及计算机可读存储介质
EP3695384B1 (en) Point cloud meshing method, apparatus, device and computer storage media
US10964025B2 (en) Assembly monitoring method and device based on deep learning, and readable storage medium
US8953847B2 (en) Method and apparatus for solving position and orientation from correlated point features in images
US11222471B2 (en) Implementing three-dimensional augmented reality in smart glasses based on two-dimensional data
EP3401815B1 (en) Determining an architectural layout
Wang et al. A fast object registration method for augmented reality assembly with simultaneous determination of multiple 2D-3D correspondences
CN109241844B (zh) 三维物体的姿态估计方法、装置、设备及存储介质
CN111598946B (zh) 一种物体位姿测量方法、装置及存储介质
CN112015275A (zh) 基于数字孪生ar交互方法和系统
CN111739167B (zh) 3d人头重建方法、装置、设备和介质
TW201616451A (zh) 點雲套索選取系統及方法
CN112651881B (zh) 图像合成方法、装置、设备、存储介质以及程序产品
CN110910433A (zh) 一种基于深度学习的点云匹配方法
CN114022542A (zh) 一种基于三维重建的3d数据库制作方法
CN114998433A (zh) 位姿计算方法、装置、存储介质以及电子设备
JP2019109747A (ja) 位置姿勢推定装置、位置姿勢推定方法及びプログラム
WO2017003424A1 (en) Metric 3d stitching of rgb-d data
CN114359522A (zh) Ar模型放置方法及装置
JP7265143B2 (ja) 表示制御方法、表示制御プログラムおよび情報処理装置
CN112967329A (zh) 图像数据优化方法、装置、电子设备及存储介质
CN113781653A (zh) 对象模型生成方法、装置、电子设备及存储介质
CN113793349A (zh) 目标检测方法及装置、计算机可读存储介质、电子设备
JP2007249591A (ja) 3次元形状モデル生成システム
US11508083B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination