CN106997613A - 根据2d图像的3d模型生成 - Google Patents

根据2d图像的3d模型生成 Download PDF

Info

Publication number
CN106997613A
CN106997613A CN201611031347.8A CN201611031347A CN106997613A CN 106997613 A CN106997613 A CN 106997613A CN 201611031347 A CN201611031347 A CN 201611031347A CN 106997613 A CN106997613 A CN 106997613A
Authority
CN
China
Prior art keywords
image
point
user
estimation
computing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611031347.8A
Other languages
English (en)
Other versions
CN106997613B (zh
Inventor
伊藤大地
R·米克
N·A·卡尔
福里司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adobe Inc
Original Assignee
Adobe Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adobe Systems Inc filed Critical Adobe Systems Inc
Publication of CN106997613A publication Critical patent/CN106997613A/zh
Application granted granted Critical
Publication of CN106997613B publication Critical patent/CN106997613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04815Interaction with a metaphor-based environment or interaction object displayed as three-dimensional, e.g. changing the user viewpoint with respect to the environment or object
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Architecture (AREA)
  • Computer Hardware Design (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请涉及根据2D图像的3D模型生成。描述了用于根据二维图像生成三维模型的技术和系统。接收通过与用户界面的用户交互形成的多个输入。多个输入中的每个输入定义多个图像中的相应的一个图像中的对象上的相应的由用户指定点。自动地和无用户干预地生成对象上的多个估计点。多个估计点中的每个估计点对应于用于多个图像中的其它图像的相应的由用户指定点。由计算设备为用户界面中的多个图像中的其它图像显示多个估计点。由计算设备通过将由用户指定点中的相应的由用户指定点映射到多个图像中的估计点中的相应的估计点来生成对象的三维模型的网格。

Description

根据2D图像的3D模型生成
技术领域
本申请涉及根据2D图像的3D模型生成。
背景技术
在数字媒体环境中,三维模型可以用来支持多种功能。这一功能的示例包括在游戏中使用、支持在相继图像中对对象的不同视图进行建模以生成视频、由三维打印机用来打印模型的物理表示、等等。
然而,用来生成三维模型的常规技术在用户这一部分经常需要专门化的知识以与复杂的用户界面交互。因此,这些常规技术经常让用户难以应付、耗费时间并且也可能需要大量空间以支持用户界面,由此使这些技术限于使用特征丰富的计算设备。在一个常规示例中,用户与用户界面交互以生成简单的形状,比如立方体、球体等等。用户然后与形状交互以移动、旋转、重设尺寸、提取、连接和/或拆分简单形状以制作对象。虽然这一方式是灵活的,但是它涉及大量时间通过使用复杂化的用户界面来执行。
在另一常规示例中,执行如下造型,在该造型中,用户以与对物理黏土进行成形相似的方式与用户界面中的网格交互。尽管这有所直观,但是在实际实践中,这一技术要求用户具有高级造型技能和对复杂工具的掌握。在再一常规示例中,由3D扫描机器执行三维扫描。因此,在这一示例中,要求用户已经具有被建模的对象的示例、需要昂贵机器或者以别的方式形成有噪声和误差的低质量模型。因此,常规3D模型生成技术不直观、昂贵并且需要大量知识,并且因此限于在有限数目的实例中使用。
发明内容
描述了用于根据二维图像生成三维模型的技术和系统。在一个示例中,数字媒体环境被配置为根据具有对象的不同二维视图的多个图像来生成对象的三维模型。接收通过与用户界面的用户交互形成的多个输入。多个输入中的每个输入定义多个图像中的相应的图像中的对象上的相应的由用户指定点。由计算设备生成对象上的多个估计点。多个估计点中的每个估计点对应于相应的由用户指定点并且被定义用于多个图像中的与定义相应的由用户指定点的相应的图像不同的图像。由计算设备在用户界面中显示多个估计点。由计算设备通过将由用户指定点中的相应的由用户指定点映射到多个图像中的估计点中的相应的估计点来生成对象的三维模型的网格。
这一发明内容以简化的形式介绍了以下在具体实施方式中被进一步描述的概念选集。这样,这一发明内容未旨在于标识要求保护的主题内容的实质特征,也未旨在于在确定要求保护的主题内容的范围时用作辅助。
附图说明
参照附图描述了具体实施方式。在各图中,标号的最左数位标识该标号在其中首次出现的图。在描述和各图中在不同实例中使用相同标号可以指示相似或者相同项目。在各图中代表的实体可以指示一个或者多个实体,并且因此可以在讨论中可互换地指代实体的单数或者复数形式。
图1是在示例实现方式中的可操作以运用这里描述的模型生成技术的环境的图示。
图2描绘了如下系统,该系统更具体地示出了图1的三维模型生成系统的操作。
图3是描绘了在示例实现方式中的过程的流程图,在该过程中,根据二维图像来生成三维模型。
图4描绘了可用来指定在将被建模的图像内的对象的位置和大小的用户界面。
图5描绘了在示例实现方式中的系统,在该系统中,作为根据二维图像来生成三维模型的部分,在一个图像中的由用户指定点用来估计在另一图像中的估计点。
图6描绘了二维图像的同时显示、点和根据二维图像上的点生成的三维模型的实时显示的示例。
图7、图8和图9描绘了二维图像的同时显示和用于多种不同类型的对象的三维模型的实时显示的其它示例。
图10描绘了可用来启动用于对点进行镜像以使得生成模型的功能的用户界面,该模型包括对象的在用来创建模型的图像中不可查看的部分。
图11图示了包括示例设备的各种部件的示例系统,该设备可以被实施为如描述的任何类型的计算设备和/或参照图1至图+10用来实施这里描述的技术的实施例。
具体实施方式
概述
用来生成三维模型的常规技术经常涉及与复杂的用户界面的交互,并且在用户这一部分需要高级技能以便生成模型。因而,这些技术通常没有被缺乏这些技能的用户运用,即使这些用户可能在其它图像生成领域中具有高级技能。
描述了用于根据二维图像来生成三维模型的技术和系统。以这一方式,能够创建对象的二维图像的用户可以使用这些图像以用直观和高效的方式生成三维模型而没有专门化的工具的高级知识。例如,用户首先提供对象的多个图像。用户然后指定对象的哪些视图由图像中的相应的图像捕获,例如,前视、后视、侧视、俯视、仰视等等。
然后在用户界面中显示图像,从而使得用户可以指示在将作为基础用来通过由相应的图像捕获的不同视图的地标和知识来生成三维模型的图像之间的地标的对应性。例如,用户可以首先指示在图像中的第一图像(例如,前视图)中捕获的脸部的鼻子的末端处的点,该点被称为由用户指定点。计算设备然后估计在图像中的第二图像(例如,侧视图)中的估计点。可以响应于接收由用户指定点、在接收用于启动估计的用户输入时等等自动地和无用户干预地执行这一估计。估计点被配置为由用户移动以例如纠正估计中的误差,从而使得用户的鼻子的末端由点准确地反映。然后通过与不同图像交互来重复这一过程以指示由初始估计辅助的在点之间的对应性,由此提高效率和准确性。
点的对应性和图像中的不同视图的知识然后用来生成在三维空间中将点映射到彼此的网格。然后从图像取得并且在网格之上叠放纹理以形成图像中的对象的三维模型。以这一方式,可以用高效、直观和准确的方式根据通常地作为内容创建的部分从用户容易地可用的二维图像来生成三维模型。在以下章节中包括对这些和其它示例的进一步讨论。
在以下讨论中,首先描述可以运用这里描述的技术的示例环境。然后描述可以在示例环境以及其它环境中执行的示例过程。因而,对示例过程的执行不限于示例环境,并且示例环境不限于对示例过程的执行。
示例环境
图1是在示例实现方式中可操作以运用这里描述的模型生成技术的环境100的图示。所示环境100包括可以用多种方式被配置的计算设备102。
计算设备102例如可以被配置为台式计算机、膝上型计算机、移动设备(例如,假设手持配置(比如如图所示的平板计算机或者移动电话))等等。因此,计算设备102可以范围从具有大量存储器和处理器资源的全资源设备(例如,个人计算机、游戏控制台)到具有有限存储器和/或处理资源的低资源设备(例如,移动设备)。附加地,虽然示出了单个计算设备102,但是计算设备102可以代表多个不同设备,比如由企业用来如关于图11进一步描述的那样“在云之上”执行操作的多个服务器。
计算设备102被图示为包括图像处理模块104。图像处理模块104代表用于将图像106、108变换以创建图像106、108的新的或者修改的版本的功能,这些版本的示例被图示为被维护在计算设备102的存储装置110中。
图像处理的示例包括从图像去除噪声、对象去除、孔填充、应用滤波器(例如,高斯模糊)、对象识别、语义加标签和更改在图像106、108中包括的像素、关联数据与图像106、108以支持其它功能(例如,图像搜索)的其它技术等等。虽然图像处理模块104的功能被图示为仅被实施在计算设备102上,但是也可以进一步划分(比如全部或者部分地如关于图11进一步描述的那样“在云中”提供)这一功能。
图像处理功能的示例被图示为三维(3D)模型生成系统112。3D模型生成系统112代表可用来根据图像106、108来生成3D模型114的功能。图像106、108例如可以是对象的捕获对象的不同视图的二维图像,在3D模型生成系统112的用户界面116中输出这些二维图像的示例。
例如,如在系统的用户界面116中所示,第一图像118捕获人的头部的右侧视图,第二图像120捕获人的头部的前视图,第三图像122捕获用户的头部的左侧视图,而第四图像124捕获用户的头部的后视图。从这些图像118-124,用户可以选择图像之一中的点以用于图像118-124之一中的地标,例如,鼻尖、用户的眼角、发际线等。
这些由用户指定点然后由3D模型生成系统112用来估计图像118-124中的其它图像中的对应的估计点,这些估计点可移动以纠正任何估计误差。以这一方式,3D模型生成系统112学习图像118-124中的哪些点相互对应,这用来根据点来生成网格和根据这一网格来生成在图像116中包括的对象(例如,用户的头部)的3D模型114。在一个或者多个实现方式中,3D模型114的渲染的输出126由3D模型生成系统112实时显示,从而使得用户可以查看这些对应性的指示的结果,并且因此可以决定何时已经用非模态方式实现了具有充分细节的3D模型114,例如,该方式将涉及从用户界面116导航离开。在下文中描述和在对应的图中示出了对3D模型114的生成的示例的进一步讨论。
图2描绘了系统200,系统200更具体地示出了图1的3D模型生成系统106的操作。图3描绘了在示例实现方式中的过程300,在过程300中根据二维图像生成三维模型。在下文中,该讨论参照系统200和过程300二者以及后图中的用户界面的示例。
可以在硬件、固件或者软件或者其组合中实施过程的各方面。过程被示出为指定由一个或者多个设备执行的操作的块的集合而未必限于所示的用于由相应的块执行操作的顺序。
3D模型生成系统106首先获得多个图像106、108以生成三维模型108。这里描述的技术可用来根据具有待建模的对象的不同视图的两个图像来生成3D模型114(例如,通过使用如以下进一步描述的镜像),但是也可以如图1中所示运用附加图像。
在这一示例中开始,接收一个或者多个图像标识输入,这些图像标识输入描述由多个图像中的相应的图像捕获的对象的相应的视图(块302)。用户例如可以与用户界面116交互以上传图像并且提供图像标识输入202以也通过指定对象的哪个视图由相应的图像捕获来指定图像关于彼此具有的关系。
如图1中所示,第一图像118捕获人的头部的右侧视图,第二图像120捕获人的头部的前视图,第三图像122捕获用户的头部的左侧视图,并且第四图像124捕获用户的头部的后视图。以这一方式,图像标识模块204可以确定第一、第二、第三和第四图像118-124以九十度增量沿着单个平面捕获对象(例如,用户的头部)的不同视图,例如,使用硬件(比如处理器、存储器、固定或者可编程的集成电路等等)来实施用于标识图像的逻辑的模块。从这一点,图像标识模块204可以构造三维空间以及第一、第二、第三和第四图像118-124到该空间的关系。可以经由图像标识输入202(比如在视图之间的特定角度、对在三维空间中的矢量的指定(例如,通过在三维空间中绘制箭头,其中每个箭头对应于由图像捕获的接收的视图)、使用预先配置的视图(例如,俯视、仰视、前视、后视、四分之三视图)等等)来表达多种不同视图和在待建模的对象的视图之间的关系。
为了获得准确点数据,图像标识输入202也可以指定多个图像中的相应的图像中的对象的位置和大小(块304)。例如,如图4的示例实现方式400中所示,用户界面116包括具有对象(例如,用户的头部)的前视图的图像400。用户界面402被配置为指定图像402内的对象404的位置和大小。在这一示例中,这包括指定对象404的顶端和底端、对象406的左端和右端406以及对象408的中心。以这一方式,图像标识模块204可以通过比较这些位置和根据指定的输出形成的定界框来利用图像中的在图像内具有不同大小的对象。因此,图像标识模块204可以动态地解决比需要图像内的对象的匹配大小以便生成3D模型的常规技术先前可能的图像范围更大范围的图像。
这一信息然后由图像标识模块204提供给点管理器模块206。点管理器模块206代表可用来指示用户界面116中的相应的图像106、108中的点的对应性的功能,例如,使用硬件(比如处理器、存储器、固定或者可编程的集成电路等等)来实施用于标识和指示点的对应的逻辑的模块。作为这一点的部分,接收通过与用户界面116的用户交互形成的多个输入。多个输入中的每个输入定义多个图像中的相应的图像中的对象上的相应的由用户指定点208(块306)。
图5例如描绘了在示例实现方式中的系统500,在系统500中,在一个图像中的由用户指定点用来作为根据二维图像来生成三维模型的部分生成另一图像中的估计点。使用经由用户界面116与第一图像508和第二图像510的交互的第一级502、第二级504和第三级506来图示这一系统500。
在第一级502处,接收指定第二图像510中的对象上的由用户指定点512的位置的输入,该输入通过与用户界面116交互被引起。例如,用户可以使用光标控制设备(例如,鼠标或者跟踪板)、显示设备的触屏功能等等以将用户的下颚的地标备注为由用户指定点512。
作为响应,点管理器模块206运用至少部分地在硬件中实施的用于生成对象上的估计点514的点估计模块210,这可以被自动地和无用户干预地完成或者可以不这样被完成。例如,可以响应于接收由用户指定点来自动地和无用户干预地执行这一估计、响应于由用户启动功能来执行这一估计等等。点估计模块210代表用于基于根据图像标识模块204学习的三维空间来形成估计点212、例如通过知道由用户指定点208位于第二图像510上何处以估计第一图像508上的对应位置的功能。这可以用多种方式被执行。
在一个示例中,点估计模块210使用一个或者多个模板214以执行估计。例如,模板214可以充当用来估计点的粗略模型。可以自动地和无用户干预210地选择模板214,例如,通过使用对象检测功能以估计被建模的对象的类型,并且然后从多个预先配置的模板214选择以选择模板中的哪些模板最佳地对应于对象。在另一示例中,模板214由用户通过与用户界面116交互来选择,例如,以选择“脸部”、“小汽车”、“小雕像”或者其它对象。在另一示例中,模板214可以由当前的由用户定义的点生成或者改进。在另一示例中,模板214可以由地标检测算法根据输入图像来生成或者改进。
无论如何选择模板或者甚至如何估计所估计点,然后如在图5的第二级504处所示在第一图像508上在用户界面116中显示估计点514。因此,在这一示例中,用户已经指定了第二图像510上的由用户指定点512,这引起在第一图像508上自动显示估计点514,二者被同时显示,从而使得用户无需在用户界面之间“来回”翻转,但是也可以利用该示例。由于估计了第二点512,所以可能在指示待建模的对象(例如,用户的下颚)中的对应的地标时缺乏一些准确性。因而,用户可以利用光标控制设备、触屏或者其它输入以将估计点514移动到对象上的希望的位置,在图5的第三级506处示出了该位置的示例。由用户指定点512也可以由用户如希望的那样移动和再次移动。
这一过程可以继续自动地和无用户干预地估计对象上的多个估计点,其中估计点中的每个估计点对应于用于多个图像中的与定义相应的由用户指定点的相应图像不同的图像的相应的由用户指定点(块308),这些估计点然后被显示在用户界面中(块310)。色编码或者其它标记可以用来示出响应于在图像中的另一图像上添加由用户指定点来“新添加”哪个估计点,并且因此指示在图像中的点之间的对应性。另外,可以可互换地向第一图像508或者第二图像510添加208由用户指定点,其中自动地为第一图像508或者第二图像510中的另一图像生成估计点212。以这一方式,用户可以用动态、高效(任一图像可以接收输入)和直观方式与图像交互以指定多个点。
然后对象的三维模型的网格被生成为由用户指定点中的相应的由用户指定点到多个图像中的估计点中的相应的估计点的映射(块312)。如图2中所示,向网格生成模块216(例如,使用硬件(比如处理器、存储器、固定或者可编程的集成电路等等)来实施用于生成网格的逻辑的模块)提供由用户指定点208和估计点212(无论是否在用户界面116中进一步移动)。网格生成模块216代表用于在三维中计算网格218的功能,网格218通过知道图像106、108到被建模的对象的视图的关系(即,形成三维空间和图像到该空间的关系)来将成对的由用户指定点和估计点212链接到三维空间中的其它对。以这一方式,网格218形成待建模的模型的框架。在一个或者多个实现方式中,网格生成模块216被配置为作为生成网格的部分将成对的由用户指定点和估计点的位置正规化,并且因此限制点中的任一点的潜在误差。
纹理模块220然后由3D模型生成系统106用来在网格218之上叠加根据图像106、108形成的纹理以形成然后在用户界面116中输出的3D模型114。如在另一示例中那样,可以使用硬件(比如处理器、存储器、固定或者可编程的集成电路等等)来将纹理模块220实施为模块。在图6的示例实现方式中示出了这一过程的示例600。在这一示例中,用户界面116包括如以上指示的四个二维图像602、604、606、608和对应的点。用户界面116也包括在接收用户输入时形成的用于估计所估计的输入的、并且基于输入中的任何输入的后续移动而被进一步更新的三维模型114的实时显示610。以这一方式,通过使用网格和叠加的纹理,用户可以在提供输入时查看模型的显示以便如希望的那样修改输入以及确定何时实现希望的细节水平。
可以在三维中根据二维图像对多种不同对象进行建模。图8描绘了根据在四个图像中捕获的不同视图取得的用户的头部的示例800。图9描绘了根据图像建模的干酪汉堡的三维模型的示例1100。
也可以组合使用这里描述的技术形成的三维模型以形成更大模型。例如,卡通人物的头部的铅笔绘图可以用来形成头部的三维模型。这一头部然后可以与其它三维模型组合,这些三维模型也由这一系统做出以形成卡通人物的整个身体。
3D模型生成系统106也可以包括用于自动地生成用于模型的在图像中不可查看的点的点的功能。例如,如图10的示例1000中所示的来自对象(例如,脸部)的一侧的两个不同视图可以由3D模型生成系统106“镜像”以便完成模型。所示示例包括镜像功能,该镜像功能包括从左到右、从右到左和从前到后,这可以由用户选择以如希望的那样自动地“填入”3D模型114的其它部分,即使那些部分在图像106、108中不可查看。
示例系统和设备
图11大体地在1100处图示了示例系统,该示例系统包括代表实施这里描述的各种技术的一个或者多个计算系统和/或设备的示例计算设备1102。通过包括3D模型生成系统106来图示这一点。计算设备1102可以例如是服务器提供商的服务器、与客户端关联的设备(例如,客户端设备)、片上系统和/或任何其它适当计算设备或者计算系统。
示例计算设备1102包括相互通信地耦合的处理系统1104、一个或者多个计算机可读介质1106和一个或者多个I/O接口1108。虽然未被示出,但是计算设备1102还可以包括相互耦合各种部件的系统总线或者其它数据和命令传送系统。系统总线可以包括不同总线结构(比如存储器总线或者存储器控制器、外围总线、通用串行总线和/或利用多种总线架构中的任何总线架构的处理器或者本地总线)中的任何总线结构或者组合。也设想了多种其它示例,比如控制和数据线。
处理系统1104代表用于使用硬件来执行一个或者多个操作的功能。因而,处理系统1104被图示为包括可以被配置为处理器、功能块等等的硬件单元1110。这可以包括在硬件中实施为专用集成电路或者使用一个或者多个半导体形成的其它逻辑器件。硬件单元1110不受形成它们的材料或者其中运用的处理机制限制。例如,处理器可以由半导体和/或晶体管(例如,电子集成电路(IC))组成。在这样的上下文中,处理器可执行指令可以是电子地可执行的指令。
计算机可读存储介质1106被图示为包括存储器/存储装置1112。存储器/存储装置1112代表与一个或者多个计算机可读介质关联的存储器/存储容量。存储器/存储装置1112可以包括易失性介质(比如随机存取存储器(RAM))和/或非易失性介质(比如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置1112可以包括固定介质(例如,RAM、ROM、固定硬驱动等)以及可拆卸介质(例如,闪存、可拆卸硬驱动、光盘等)。可以用如以下进一步描述的多种其它方式配置计算机可读介质1106。
输入/输出接口1108代表用于允许用户向计算设备1102录入命令和信息并且也允许向用户呈现信息的功能和/或使用各种输入/输出设备的其它部件或者设备。输入设备的示例包括键盘、光标控制设备(例如,鼠标)、麦克风、扫描仪、触摸功能(例如,被配置为检测物理触摸的电容或者其它传感器)、相机(例如,该相机可以运用可见光或者不可见光波长(比如红外线频率)以将移动识别为未涉及触摸的手势)等。输出设备的示例包括显示设备(例如,监视器或者投影仪)、扬声器、打印机、网卡、触觉响应设备等等。因此,可以用如以下进一步描述的多种方式配置计算设备1102以支持用户交互。
这里在软件、硬件单元或者程序模块的一般上下文中描述各种技术。一般而言,这样的模块包括执行特定任务或者实施特定抽象数据类型的例程、程序、对象、单元、部件、数据结构、等等。如这里所用的术语“模块”、“功能”和“部件”一般地代表软件、固件、硬件或者其组合。这里描述的技术的特征独立于平台,这意味着可以在具有多种处理器的多种商用计算平台上实施技术。
可以在某个形式的计算机可读介质上存储或者跨越该计算机可读介质传输描述的模块和技术的实现方式。计算机可读介质可以包括计算设备1102可以访问的多种介质。举例而言而非限制,计算机可读介质包括“计算机可读存储介质”和“计算机可读信号介质”。
“计算机可读存储介质”可以是指与仅信号传输、载波或者信号本身对照地实现持久和/或非瞬态信息存储的介质和/或设备。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括硬件(比如在适合用于存储信息(比如计算机可读指令、数据结构、程序模块、逻辑元件/电路或者其它数据)的方法或者技术中实施的易失性和非易失性、可拆卸和非可拆卸介质和/或存储设备。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或者其它存储器技术、CD-ROM、数字万用盘(DVD)或者其它光存储装置、硬盘、磁盒、磁带、磁盘存储装置或者其它磁存储设备或者适合用来存储希望的信息并且可以由计算机访问的其它存储设备、有形介质或者制造品。
“计算机可读信号介质”可以是指被配置为比如经由网络向计算设备1102的硬件传输指令的信号承载介质。信号介质通常地可以在调制的数据信号(比如载波、数据信号)或者其它传送机制中体现计算机可读指令、数据结构、程序模块或者其它数据。信号介质也包括任何信息递送介质。术语“调制的数据信号”意味着如下信号,该信号让它的特性中的一个或者多个特性以对信号中的信息进行编码这样的方式被设置或者改变。举例而言而非限制,通信介质包括有线介质(比如有线网络或者直接有线连接)和无线介质(比如声学、RF、红外线和其它无线介质)。
如先前描述的那样,硬件单元1110和计算机可读介质1106代表以如下硬件形式实施的模块、可编程逻辑器件和/或固定器件逻辑,可以在一些实现方式中运用该硬件形式以实施这里描述的技术的至少一些方面,比如执行一个或者多个指令。硬件可以包括集成电路或者片上系统的部件、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)和在硅或者其它硬件中的其它实现方式。在本文中,硬件可以作为处理设备操作,该处理设备执行由指令定义的程序任务和/或由硬件体现的逻辑以及用来存储用于执行的指令的硬件,例如,先前描述的计算机可读存储介质。
也可以运用前述各项的组合以实施这里描述的各种技术。因而,软件、硬件或者可执行模块可以被实施为在某个形式的计算机可读存储介质上和/或由一个或者多个硬件单元1110体现的一个或者多个指令和/或逻辑。计算设备1102可以被配置为实施与软件和/或硬件模块对应的特定指令和/或功能。因而,可以至少部分地在硬件中(例如,通过使用计算机可读存储介质和/或处理系统1104的硬件单元1110)来实现作为软件可由计算设备1102执行的模块的实现方式。指令和/或功能可以由一个或者多个制造品(例如,一个或者多个计算设备1102和/或处理系统1104)可执行/可操作以实施这里描述的技术、模块和示例。
这里描述的技术由计算设备1102的各种配置支持而不限于这里描述的技术的具体示例。也可以全部或者部分通过使用分布式系统(比如如以下描述的那样经由平台1116通过“云”1114)来实施这一功能。
云1114包括和/或代表用于资源1118的平台1116。平台1116将云1114的硬件(例如,服务器)和软件资源的下层功能抽象化。资源1118可以包括可以在从计算设备1102远离的服务器上执行计算机处理之时被利用的应用和/或数据。资源1118也可以包括通过因特网和/或通过订户网络(比如蜂窝或者Wi-Fi网络)提供的服务。
平台1116可以将用于连接计算设备1102与其它计算设备的资源和功能抽象化。平台1116也可以服务于将资源的伸缩抽象化以提供与对于经由平台1116被实施的资源1118的所遇需求对应的规模级别。因而,在一个互连设备实施例中,可以贯穿系统1100分布这里描述的功能的实现方式。例如,可以部分在计算设备1102上以及经由将云1114的功能抽象化的平台1116实施功能。
结论
虽然已经用结构特征和/或方法动作特有的言语描述了本发明,但是将理解,在所附权利要求中定义的本发明未必限于描述的具体特征或者动作。实际上,具体特征和动作被公开作为实施要求包含的本发明的示例形式。

Claims (20)

1.在用于根据具有对象的不同二维视图的多个图像来生成所述对象的三维模型的数字媒体环境中,一种由计算设备实施的方法,所述方法包括:
由所述计算设备接收多个输入,所述多个输入基于与用户界面的用户交互被形成,所述多个输入中的每个输入定义所述多个图像中的相应的图像中的所述对象上的相应的由用户指定点;
由所述计算设备生成所述对象上的多个估计点,所述多个估计点中的每个估计点对应于相应的所述由用户指定点并且被定义用于所述多个图像中的与定义所述相应的由用户指定点的所述相应的图像不同的图像;
由所述计算设备在所述用户界面中显示所述多个估计点;以及
由所述计算设备生成所述对象的所述三维模型的网格,所述生成包括将所述由用户指定点中的相应的由用户指定点映射到所述多个图像中的所述估计点中的相应的估计点。
2.根据权利要求1所述的方法,其中在由所述计算设备接收所述多个输入时实时执行所述多个点的所述生成和所述显示。
3.根据权利要求1所述的方法,其中多个估计点中的至少一个估计点通过与所述用户界面的用户交互相对于所述对象可移动。
4.根据权利要求1所述的方法,其中所述多个图像中的至少一个图像中的所述对象的大小不同于所述多个图像中的另一图像中的所述对象的大小。
5.根据权利要求1所述的方法,其中所述网格的所述生成包括将所述由用户指定点的位置和所述估计点的位置正规化。
6.根据权利要求1所述的方法,其中所述网格的所述生成包括对所述由用户指定点中的至少一个由用户指定点或者所述估计点中的至少一个估计点进行镜像以对在所述多个图像中不可查看的所述对象的部分进行建模。
7.根据权利要求1所述的方法,其中所述多个估计点的所述生成包括自动地和无用户干预地选择模板。
8.根据权利要求1所述的方法,还包括基于与所述用户界面的用户交互来接收至少一个输入,所述至少一个输入从多个模板选择将用来根据相应的所述由用户指定点来生成相应的所述估计点的模板。
9.根据权利要求1所述的方法,还包括由所述计算设备在所述用户界面中同时显示所述多个图像,所述多个图像中的每个图像包括所述对象的不同的相应的视图。
10.根据权利要求1所述的方法,还包括由所述计算设备接收一个或者多个图像标识输入,所述一个或者多个图像标识输入描述由所述多个图像中的相应的图像捕获的所述对象的相应的视图,并且其中所述网格的所述生成至少部分基于所述对象的所述相应的视图的关系。
11.根据权利要求1所述的方法,还包括接收指定所述多个图像中的相应的图像中的所述对象的位置的一个或者多个输入,所述接收用作所述多个估计点的所述生成的部分。
12.在用于根据具有对象的不同二维视图的多个图像来生成所述对象的三维模型的数字媒体环境中,一种系统包括:
至少部分地在硬件中实施的点管理器模块,用于:
接收基于与用户界面的用户交互形成的多个输入,所述多个输入中的每个输入定义所述多个图像中的相应的图像中的所述对象上的相应的由用户指定点;
生成所述对象上的多个估计点,所述多个估计点中的每个估计点对应于相应的所述由用户指定点并且被定义用于所述多个图像中的与定义所述相应的由用户指定点的所述相应的图像不同的图像;
在所述用户界面中显示所述多个估计点;以及
至少部分地在硬件中实施的网格生成模块,用于生成所述对象的所述三维模型的网格,所述网格被生成为所述由用户指定点中的相应的由用户指定点到所述到多个图像中的所述估计点中的相应的估计点的映射。
13.根据权利要求12所述的系统,其中多个估计点中的至少一个估计点被配置为基于与所述用户界面的用户交互相对于所述对象可移动。
14.根据权利要求12所述的系统,其中所述点管理器被配置为在接收所述多个输入时实时显示所述多个估计点。
15.根据权利要求12所述的系统,其中所述多个图像中的至少一个图像中的所述对象的大小不同于所述多个图像中的另一图像中的所述对象的大小。
16.根据权利要求12所述的系统,其中所述网格生成模块被配置为关于所述估计点的位置将所述由用户指定点的位置正规化。
17.根据权利要求12所述的系统,其中所述网格生成模块被配置为对所述由用户指定点或者所述估计点中的至少一个点进行镜像以对在所述多个图像中不可查看的所述对象的部分进行建模。
18.在用于根据具有对象的不同二维视图的多个图像来生成所述对象的三维模型的数字媒体环境中,一种由计算设备实施的方法,所述方法包括:
接收基于与所述计算设备的用户界面的用户交互形成的输入,所述输入定义所述多个图像中的第一图像中的所述对象上的由用户指定点;
由所述计算设备显示所述对象上的估计点,所述估计点对应于用于所述多个图像中的第二图像的所述由用户指定点;
由所述计算设备基于与所述用户界面的用户交互来接收至少一个输入,所述至少一个输入定义所述第二图像中的所述对象上的所述估计点的移动;以及
由所述计算设备生成所述对象的所述三维模型的网格,所述生成包括将多个所述由用户指定点中的相应的由用户指定点映射到多个所述估计点中的相应的估计点。
19.根据权利要求18所述的方法,其中在接收定义所述对象上的所述由用户指定点的所述输入时实时执行所述显示。
20.根据权利要求18所述的方法,其中所述多个图像中的至少一个图像中的所述对象的大小不同于所述多个图像中的另一图像中的所述对象的大小。
CN201611031347.8A 2016-01-25 2016-11-22 根据2d图像的3d模型生成 Active CN106997613B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/005,927 US10318102B2 (en) 2016-01-25 2016-01-25 3D model generation from 2D images
US15/005,927 2016-01-25

Publications (2)

Publication Number Publication Date
CN106997613A true CN106997613A (zh) 2017-08-01
CN106997613B CN106997613B (zh) 2023-09-29

Family

ID=58073112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611031347.8A Active CN106997613B (zh) 2016-01-25 2016-11-22 根据2d图像的3d模型生成

Country Status (5)

Country Link
US (1) US10318102B2 (zh)
CN (1) CN106997613B (zh)
AU (1) AU2016262789B2 (zh)
DE (1) DE102016014188A1 (zh)
GB (1) GB2546861B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298918A (zh) * 2019-08-02 2019-10-01 湖南海诚宇信信息技术有限公司 一种基于gpu实时三维建模显示装置及三维建模显示方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6886260B2 (ja) * 2016-09-07 2021-06-16 キヤノン株式会社 画像処理装置、その制御方法、およびプログラム
US10628481B2 (en) * 2016-11-17 2020-04-21 Ebay Inc. Projecting visual aspects into a vector space
US10586379B2 (en) * 2017-03-08 2020-03-10 Ebay Inc. Integration of 3D models
US20180357819A1 (en) * 2017-06-13 2018-12-13 Fotonation Limited Method for generating a set of annotated images
US10217029B1 (en) * 2018-02-26 2019-02-26 Ringcentral, Inc. Systems and methods for automatically generating headshots from a plurality of still images
CN110533761B (zh) * 2018-05-23 2024-01-12 华硕电脑股份有限公司 影像显示方法、电子装置及非瞬时电脑可读取记录媒体
US11727656B2 (en) 2018-06-12 2023-08-15 Ebay Inc. Reconstruction of 3D model with immersive experience
US20210358202A1 (en) * 2020-05-13 2021-11-18 Electronic Caregiver, Inc. Room Labeling Drawing Interface for Activity Tracking and Detection

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229400A (ja) * 2000-02-15 2001-08-24 Sharp Corp 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体
US20080170755A1 (en) * 2007-01-17 2008-07-17 Kamal Nasser Methods and apparatus for collecting media site data
CN101271591A (zh) * 2008-04-28 2008-09-24 清华大学 一种交互式多视点三维模型重建方法
US20080267443A1 (en) * 2006-05-05 2008-10-30 Parham Aarabi Method, System and Computer Program Product for Automatic and Semi-Automatic Modification of Digital Images of Faces
US7646909B2 (en) * 2005-04-29 2010-01-12 Microsoft Corporation Method and system for constructing a 3D representation of a face from a 2D representation
US20120133640A1 (en) * 2010-11-26 2012-05-31 Mao-Yuan Chin Method and system for combining 2d image and 3d model and computer program product thereof
CN103430218A (zh) * 2011-03-21 2013-12-04 英特尔公司 用3d脸部建模和地标对齐扩增造型的方法
CN104036546A (zh) * 2014-06-30 2014-09-10 清华大学 一种基于自适应形变模型的任意视角人脸三维重构方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU9663098A (en) * 1997-09-23 1999-04-12 Enroute, Inc. Generating three-dimensional models of objects defined by two-dimensional image data
JP2001118082A (ja) * 1999-10-15 2001-04-27 Toshiba Corp 描画演算処理装置
US6894686B2 (en) * 2000-05-16 2005-05-17 Nintendo Co., Ltd. System and method for automatically editing captured images for inclusion into 3D video game play
FR2929417B1 (fr) 2008-03-27 2010-05-21 Univ Paris 13 Procede de determination d'une representation tridimensionnelle d'un objet a partir de points, programme d'ordinateur et systeme d'imagerie correspondant

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229400A (ja) * 2000-02-15 2001-08-24 Sharp Corp 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体
US7646909B2 (en) * 2005-04-29 2010-01-12 Microsoft Corporation Method and system for constructing a 3D representation of a face from a 2D representation
US20080267443A1 (en) * 2006-05-05 2008-10-30 Parham Aarabi Method, System and Computer Program Product for Automatic and Semi-Automatic Modification of Digital Images of Faces
US20080170755A1 (en) * 2007-01-17 2008-07-17 Kamal Nasser Methods and apparatus for collecting media site data
CN101271591A (zh) * 2008-04-28 2008-09-24 清华大学 一种交互式多视点三维模型重建方法
US20120133640A1 (en) * 2010-11-26 2012-05-31 Mao-Yuan Chin Method and system for combining 2d image and 3d model and computer program product thereof
CN103430218A (zh) * 2011-03-21 2013-12-04 英特尔公司 用3d脸部建模和地标对齐扩增造型的方法
CN104036546A (zh) * 2014-06-30 2014-09-10 清华大学 一种基于自适应形变模型的任意视角人脸三维重构方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298918A (zh) * 2019-08-02 2019-10-01 湖南海诚宇信信息技术有限公司 一种基于gpu实时三维建模显示装置及三维建模显示方法

Also Published As

Publication number Publication date
DE102016014188A1 (de) 2017-07-27
GB201620080D0 (en) 2017-01-11
US20170212661A1 (en) 2017-07-27
US10318102B2 (en) 2019-06-11
GB2546861B (en) 2018-05-09
AU2016262789B2 (en) 2021-04-29
AU2016262789A1 (en) 2017-08-10
GB2546861A (en) 2017-08-02
CN106997613B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
CN106997613A (zh) 根据2d图像的3d模型生成
CN104581111B (zh) 利用变换的目标区域填充
US11842438B2 (en) Method and terminal device for determining occluded area of virtual object
CN105637564B (zh) 产生未知对象的扩增现实内容
US9443353B2 (en) Methods and systems for capturing and moving 3D models and true-scale metadata of real world objects
EP2074499B1 (en) 3d connected shadow mouse pointer
CN110517319A (zh) 一种相机姿态信息确定的方法及相关装置
JP7343963B2 (ja) 画像を入力とする関数を学習するためのデータセット
KR102433857B1 (ko) 혼합 현실에서 동적 가상 콘텐츠들을 생성하기 위한 디바이스 및 방법
JP2013097806A (ja) 映像処理装置及び方法
CN105378792A (zh) 三维对象建模
KR20210013150A (ko) 조명 추정
JP7294788B2 (ja) 3d配置のタイプに応じた2d画像の分類
KR102403258B1 (ko) 볼륨 추론 기반 3차원 모델링 방법 및 시스템
CN108459704A (zh) 用于三维数字内容的笔画操作预测
CN111161398B (zh) 一种图像生成方法、装置、设备及存储介质
CN110232707A (zh) 一种测距方法及装置
US9454554B1 (en) View dependent query of multi-resolution clustered 3D dataset
Weber et al. Editable indoor lighting estimation
CN109064537A (zh) 基于3d渲染引擎的图像生成方法以及装置
KR102637774B1 (ko) Xr 온라인 플랫폼을 위한 3d 모델링 자동화 방법 및 시스템
CN110378948B (zh) 3d模型重建方法、装置及电子设备
CN112634439B (zh) 一种3d信息展示方法及装置
CN110038302A (zh) 基于Unity3D的网格生成方法及装置
CN112652056B (zh) 一种3d信息展示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant