CN111862305A - 处理图像的方法、装置和计算机存储介质 - Google Patents

处理图像的方法、装置和计算机存储介质 Download PDF

Info

Publication number
CN111862305A
CN111862305A CN202010624149.2A CN202010624149A CN111862305A CN 111862305 A CN111862305 A CN 111862305A CN 202010624149 A CN202010624149 A CN 202010624149A CN 111862305 A CN111862305 A CN 111862305A
Authority
CN
China
Prior art keywords
image
dimensional model
base
image sequence
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010624149.2A
Other languages
English (en)
Inventor
姚萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Intelligent Technology Beijing Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010624149.2A priority Critical patent/CN111862305A/zh
Publication of CN111862305A publication Critical patent/CN111862305A/zh
Priority to US17/214,191 priority patent/US11557047B2/en
Priority to EP21165541.0A priority patent/EP3933769B1/en
Priority to JP2021057214A priority patent/JP7202410B2/ja
Priority to KR1020210041967A priority patent/KR102428849B1/ko
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/32Determination of transform parameters for the alignment of images, i.e. image registration using correlation-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/38Registration of image sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/579Depth or shape recovery from multiple images from motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • G06T2207/10021Stereoscopic video; Stereoscopic image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/20Indexing scheme for editing of 3D models
    • G06T2219/2004Aligning objects, relative positioning of parts

Abstract

根据本公开的示例实施例,提供了一种处理图像的方法、装置和计算机存储介质,可用于自动驾驶、自主泊车领域。一种处理图像的方法,包括:获取图像序列集合,所述图像序列集合包括按照图像序列之间的相似度度量划分的多个图像序列子集,每个图像序列子集包括基础图像序列和其他图像序列,其中与所述基础图像序列对应的第一相似度度量高于等于与所述其他图像序列对应的第一相似度度量;使用所述基础图像序列,建立初始三维模型;以及基于所述初始三维模型,使用所述其他图像序列,建立最终三维模型。利用上述方法,可以提高建立三维模型的效率并且减少建立三维模型的开销。

Description

处理图像的方法、装置和计算机存储介质
技术领域
本公开的实施例涉及图像处理领域,并且更具体地,涉及处理图像的方法、装置和计算机存储介质,可以应用于自动驾驶领域中。
背景技术
在自动驾驶领域、尤其是在例如停车场或者小区道路的自主泊车或巡航场景中,需要基于例如由用于采集行车记录图像的交通工具或者其他设备采集的行车记录图像来重建和融合针对前述场景的三维模型。然而,由于行车记录图像的数据量通常非常大,因此重建和融合三维模型会涉及大量的计算量并且占用大量的系统资源。此外,随着行车记录图像的数据量的进一步上升,重建和融合三维模型的计算量和系统资源占用更是会以指数级数增长,不仅会对例如可以由云端进行的三维模型重建与融合造成巨大的计算负担,并且会耗费大量的时间,从而影响三维模型的重建融合效率,并且会降低用户体验。
发明内容
根据本公开的实施例,提供了一种基于图像时序特征匹配的海量行车技术图像的并行三维重建融合方法。
在本公开的第一方面中,提供了一种处理图像的方法,包括:获取图像序列集合,所述图像序列集合包括按照图像序列之间的相似度度量划分的多个图像序列子集,每个图像序列子集包括基础图像序列和其他图像序列,其中与所述基础图像序列对应的第一相似度度量高于等于与所述其他图像序列对应的第一相似度度量;使用所述基础图像序列,建立初始三维模型;以及基于所述初始三维模型,使用所述其他图像序列,建立最终三维模型。
在本公开的第二方面中,提供了一种处理图像的装置,包括:图像序列集合获取模块,被配置为获取图像序列集合,所述图像序列集合包括按照图像序列之间的相似度度量划分的多个图像序列子集,每个图像序列子集包括基础图像序列和其他图像序列,其中与所述基础图像序列对应的第一相似度度量高于等于与所述其他图像序列对应的第一相似度度量;初始三维模型建模模块,被配置为使用所述基础图像序列,建立初始三维模型;以及最终三维模型建模模块,被配置为基于所述初始三维模型,使用所述其他图像序列,建立最终三维模型。
在本公开的第三方面中,提供了一种电子设备,包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机实现根据本公开的第一方面的方法。
利用根据本申请的技术,可以提高建立三维模型的效率并且减少建立三维模型的开销。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中在本公开示例性实施例中,相同的参考标号通常代表相同部件。应当理解,附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示出了可以在其中实现本公开的某些示例性实施例中的处理图像的方法的图像处理环境100的示意图;
图2示出了根据本公开的实施例的用于处理图像的方法200的流程图;
图3示出了根据本公开的实施例的图像序列的相互关系300的示意图;
图4示出了根据本公开的实施例的基础图像序列的关联关系以及分段400的示意图;
图5示出了根据本公开的实施例的利用基础图像序列的增量建模过程500的示意图;
图6示出了根据本公开的实施例的初始三维模型600的示意图;
图7示出了根据本公开的实施例的利用初始三维模型建立最终三维模型的过程700的示意图;
图8示出了根据本公开的实施例的处理图像的装置800的示意性框图;以及
图9示出了根据本公开实施例的电子设备900的示意性框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如以上在背景技术中所描述的,使用传统的三维模型重建与融合方法会涉及大量的计算量并且占用大量的系统资源,从而会影响三维建模的有效性和可行性,进而导致用户体验的降低甚至无法满足用户要求。
为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题,本公开的实施例提出了一种用于三维建模的处理图像的方法。在本公开中所记载的解决方案中,将二维图像匹配与相似度计算用于三维融合重建,在三维重建前对数据进行优化分组,从而解决了利用海量数据进行三维模型融合对系统资源的占用以及时间复杂度高的问题。同时,在本公开中所记载的解决方案中,基于二维图像相似度构成的视频相关性关联图谱,将海量行车记录仪图像序列分组,从而使得三维重建的计算量从原来的指数级增长转化为线性增长,并且可以通过并行建模来提高建模的成功率。
图1示出了可以在其中实现本公开的某些示例性实施例中的处理图像的方法的图像处理环境100的示意图。如图1中所示,图像处理环境100包括作为计算设备120的输入数据的图像序列集合110、计算设备120以及作为计算设备120的输出数据的三维模型130。需要指出的是,图像处理环境100是可扩展的,其中可以包括更多的作为输入数据的图像序列集合110,更多的作为输出数据的三维模型130,或者更多的计算设备120以支持针对图像序列集合110进行更加高效的并行计算。出于简化示图的原因,在图1中仅示出了一个图像序列集合110、一个计算设备120以及一个三维模型130。
在本公开的实施例的描述中,图像序列集合是指由一个或多个图像序列组成的集合,其中图像序列中的每个图像对应于由图像采集设备采集的一帧图像。根据本公开的实施例,图像序列由被安装或者包括在用于采集行车记录图像的交通工具或者其他设备上的图像采集设备采集,其中采集到的每帧图像包括图像采集设备所朝向的周围环境以及处于该环境中的例如人、自行车、宠物等的其他对象。在图像的采集过程中,图像采集设备可以每隔一段距离或者每隔一段时间采集一帧图像,在整个图像采集过程中按顺序采集的图像构成针对这一图像采集过程的图像序列,其中这一图像序列可以被体现为视频的形式。
在本公开的实施例的描述中,对图像序列集合的三维模型重建和融合是指利用图像序列集合通过建模来得到三维模型的过程。根据本公开的实施例,所得到的三维模型可以包括图像序列集合所涉及的例如停车场或者小区道路的周围环境的三维点云,以及每张采集到的图像的内容和相关信息。
在本公开的实施例的描述中,三维模型重建和融合可以是顺序的线性过程,即,通过不断地添加新的图像参与建模来完成建模过程,其中参与建模的图像可能达到数十万张或者更多。
图2示出了根据本公开的实施例的用于处理图像的方法200的流程图。具体而言,方法200可以由计算设备120来执行。应当理解的是,方法200还可以包括未示出的附加操作和/或可以省略所示出的操作,本公开的范围在此方面不受限制。
在框202,计算设备120获取图像序列集合110。根据本公开的实施例,图像序列集合110包括按照图像序列之间的相似度度量划分的多个图像序列子集,每个图像序列子集包括基础图像序列和其他图像序列,其中与基础图像序列对应的第一相似度度量高于等于与其他图像序列对应的第一相似度度量。
以下结合图3来进一步说明图像序列集合110。图3示出了根据本公开的实施例的图像序列的相互关系300的示意图。图3中示出了共计13个图像序列,即,301。302、303、304、305、306、307、308、309、310、311、312和313,它们一起构成图像序列集合110的示例。在图3中用虚线圈320、330、340、350和360示出了多个图像序列子集,其中图像序列子集320包括图像序列303、301和313,图像序列子集330包括图像序列302、303、304和305,图像序列子集340包括图像序列301、306和309,图像序列子集350包括图像序列310、311、312和313,并且图像序列子集360包括图像序列301、307和308。
在图3中所示出的图像序列中,图像序列301、303和313为基础图像序列,它们一起构成图像序列子集320。基础图像序列中包括的稳定要素最多,它们之间相关度最高,体现为具有更高的相似度度量,因此可以首先利用基础图像序列来进行三维建模,而后再利用其它图像序列进行进一步的三维建模。此外,在图像序列子集320、330、340、350和360中均包括基础图像序列,从而使得可以在利用基础图像序列进行三维建模之后,再利用其它图像序列进行建模,因为这些其他图像序列都与某个基础图像序列具有较高相关度。此外,图像序列子集320、330、340、350和360可以按照相似度度量来确定其划分。根据本公开的示例性实施例,与每个图像序列子集中的图像序列子集对应的第二相似度度量高于等于与其他图像序列子集中的图像序列子集对应的第二相似度度量。根据本公开的实施例,第一相似度度量高于等于第二相似度度量。
在框204,计算设备120使用基础图像序列来建立初始三维模型。以图3中的示例为例,计算设备120使用作为基础图像序列的图像序列301、303和313来建立初始三维模型。
根据本公开的示例性实施例,当计算设备120使用作为基础图像序列的图像序列301、303和313来建立初始三维模型时,需要首先将图像序列301、303和313进行对齐,并且附加地可以对它们进行分段。
图4示出了根据本公开的实施例的基础图像序列的关联关系以及分段400的示意图。根据本公开的示例性实施例,结合图3中的示例,由于图像序列301、303和313的图像采集开始位置可能不同,因此图像序列301、303和313初始采集的图像所针对的场景也不相同。在三维建模中,需要使用在同一采集位置采集到的图像来进行三维建模。因此,需要在不同的图像序列中找到针对同一采集位置所采集的图像,这些图像之间具有较高的相似度度量,这一操作也可以被称为确定不同图像序列之间的相关联的图像。应当理解,图像序列301、303和313中的图像都是按照采集的先后顺序排列的,因此当将序列中的第一张图像对齐之后,序列中的后续图像有较大概率也是对齐的,此时可以省略对后续图像通过确定相似度度量来进行对齐的过程。
根据本公开的示例性实施例,计算设备120根据以下至少一项在基础图像序列之间确定针对基础图像序列的相关联的图像:图像的采集位置,以及图像之间的第三相似度度量。
如图4中所示,三个图像序列303、301和313被错位排列,即,对齐,从而使得,在同一位置对应的图像是针对同一采集位置所采集的,并且具有较高的相似度度量。根据本公开的示例性实施例,不同图像序列可以具有不同数目的图像,因此三个图像序列303、301和313的总长度并不相同。
当计算设备120在基础图像序列之间确定了针对基础图像序列的相关联的图像之后,即,将基础图像序列对齐之后,即可以使用针对基础图像序列的相关联的图像来建立三维模型。
根据本公开的示例性实施例,当基础图像序列长度较长时,直接对齐进行三维建模可能会涉及较大的计算量并且占用较大的系统资源。因此,为了进一步降低计算量和系统资源占用,可以将基础图像序列进行分段。分段的标准可以是可用计算机或者计算线程的计算能力。可用计算机或者计算线程的计算能力越强,则分段数目可以越少。
如图4中所示,基础图像序列303被分为5个分段,即,303-1、303-2、303-3、303-4和303-5,基础图像序列301被分为4个分段,即,301-2、301-3、301-4和301-5,基础图像序列313被分为4个分段,即,313-1、313-2、313-3和313-4。如图4中所示,分段303-1和313-1是对齐的,分段303-2、301-2和313-2是对齐的,分段303-3、301-3和313-3是对齐的,分段303-4、301-4和313-4是对齐的,并且分段303-5和301-5是对齐的。
根据本公开的示例性实施例,当计算设备120将基础图像序列进行了分段之后,可以针对第一个分段来建立初始基础分段三维模型。
图5示出了根据本公开的实施例的利用基础图像序列的增量建模过程500的示意图。如图5中所示,在利用图4中的分段303-1和313-1进行建模之后,得到了初始基础分段三维模型501。如图4中所示,由于分段303-2和313-2是紧接在分段303-1和313-1之后的分段,因此可以基于初始基础分段三维模型501来利用分段303-2和313-2以及对应的分段301-2进行增量建模,从而得到与分段303-2、313-2和301-2对应的增量基础分段三维模型502。而后,可以将增量基础分段三维模型502作为初始基础分段三维模型,仅基于基础分段三维模型502,利用进一步紧着的分段303-3、313-3和301-3来进行增量建模,从而得到增量基础分段三维模型503,并且依次类推得到增量基础分段三维模型504和505。
而后,计算设备120可以将建立的初始基础分段三维模型501以及后续建立的增量基础分段三维模型502、503、504和505融合在一起,以获得初始三维模型。
参见图6,其示出了根据本公开的实施例的初始三维模型600的示意图。如图6中所示,初始三维模型600包括基础分段三维模型501、502、503、504和505。
根据本公开的示例性实施例,可以使用图5中所示出的4对基础分段三维模型作为整体来建立初始三维模型,即,使用基础分段三维模型501和502,基础分段三维模型502和503,基础分段三维模型503和504,以及基础分段三维模型504和505。在这种情况下,由于每个基础分段三维模型配对都具有与之前或之后基础分段三维模型配对重合的部分,因此可以更为容易地实现建立初始三维模型。
根据本公开的示例性实施例,可以并行地建立多个增量基础分段三维模型。例如,如图4中所示,可以首先使用对应的分段303-3、301-3和313-3来建立初始基础分段三维模型503,而后可以分别使用两台计算机或者同一台计算机的不同线程来基于初始基础分段三维模型503,分别使用分段303-2、313-2和301-2,或者分段303-4、313-4和301-4,来并行地进行增量建模,以并行地得到增量初始基础分段三维模型502和504。
回到图2,在206,计算设备120基于初始三维模型,使用其他图像序列来建立最终三维模型。
根据本公开的实施例,如果初始三维模型并不涉及分段,并且所有图像序列是天然对齐的,则计算设备120可以基于初始三维模型,分别使用多个图像序列子集中的其他图像序列来建立多个中间三维模型,其中每个中间三维模型对应于一个图像序列子集。而后,计算设备120将多个中间三维模型融合以获得最终三维模型。应当理解,由于基于初始三维模型来建立中间三维模型的过程是增量建模,因此所得到的多个中间三维模型中,初始三维模型部分是相同的,因此可以更为容易地将它们融合以获得最终三维模型。根据本公开的实施例,建立中间三维模型的过程可以使用多个不同的计算机或者不同的计算线程来并行进行,从而可以提高获得最终三维模型的速度。
根据本公开的实施例,如果初始三维模型并不涉及分段,并且所有图像序列是并不是天然对齐的,则还需要将所有图像序列对齐。例如,计算设备120可以根据以下至少一项在图像序列集合中的图像序列之间确定相关联的图像:图像的采集位置,以及图像之间的第三相似度度量,其中相关联的图像包括针对基础图像序列的相关联的图像和针对其他图像序列的相关联的图像。这一对齐的过程与以上关于图4所描述的过程相似,在此不再赘述。
根据本公开的实施例,如果初始三维模型由多个基础分段三维模型组成,例如图6中所示的初始三维模型600由基础分段三维模型501、502、503、504和505组成,并且所有图像序列是并不是天然对齐的,则计算设备120首先将如上所述将所有图像序列对齐。而后,计算设备120将按照对基础图像序列的分段来将其他图像序列分段。
图7示出了根据本公开的实施例的利用初始三维模型建立最终三维模型的过程700的示意图。图7中的4个虚线框701、702、703和704分别表示四个不同的计算设备,其中计算设备也可以是服务器,并且这四个计算设备可以是云计算设备。在每个计算设备中,均基于由基础分段三维模型501、502、503、504和505组成的初始三维模型来进行增量建模,区分不同计算设备的目的在于说明这些增量建模过程可以由这些计算设备并行进行。
根据本公开的实施例,所有其他图像序列均被与基础图像序列303、301和313对齐并且被对应地划分成分段,其中其他图像序列302被划分成分段302-1、302-2、302-3、302-4和302-5,其他图像序列304被划分成分段304-2、304-3、304-4和304-5,其他图像序列305被划分成分段305-1、305-2、305-3和302-4,其他图像序列306被划分成分段306-1、306-2、306-3、306-4和306-5,其他图像序列309被划分成分段309-2、309-3、309-4和309-5,其他图像序列308被划分成分段308-2、308-3、308-4和308-5,其他图像序列307被划分成分段307-1、307-2、307-3和307-4,其他图像序列310被划分成分段310-1、310-2、310-3、310-4和310-5,其他图像序列311被划分成分段311-2、311-3、311-4和311-5,并且其他图像序列312被划分成分段312-1、312-2、312-3和312-4。
而后,4个计算设备701、702、703和704分别基于由基础分段三维模型501、502、503、504和505组成的初始三维模型,针对基础图像序列302、304、305、306、309、308、307、310、311和312所划分成的分段进行增量建模。其中由线段所连接的不同分段指示分段与基础分段三维模型的对应关系,并且一个基础分段三维模型与对应的全部分段的增量建模可以与其他基础分段三维模型与对应的全部分段的增量建模并行地进行,例如由计算设备701、702、703和704中的不同线程进行。
以上参考图1至图7描述了以在其中实现本公开的某些示例性实施例中的处理图像的方法的图像处理环境100、根据本公开的实施例的用于处理图像的方法200、根根据本公开的实施例的图像序列的相互关系300、根据本公开的实施例的基础图像序列的关联关系以及分段400、根据本公开的实施例的利用基础图像序列的增量建模过程500、根据本公开的实施例的初始三维模型600以及根据本公开的实施例的利用初始三维模型建立最终三维模型的过程700的相关内容。应当理解,上述描述是为了更好地展示本公开中所记载的内容,而不是以任何方式进行限制。
应当理解,本公开的上述各个附图中所采用的各种元件的数目和物理量的大小仅为举例,而并不是对本公开的保护范围的限制。上述数目和大小可以根据需要而被任意设置,而不会对本公开的实施方式的正常实施产生影响。
上文已经参见图1至图7描述了根据本公开的实施方式的处理图像的方法的细节。在下文中,将参见图8描述处理图像的装置中的各个模块。
图8是根据本公开实施例的处理图像的装置800的示意性框图。如图8所示,装置800可以包括:图像序列集合获取模块810,被配置为获取图像序列集合,所述图像序列集合包括按照图像序列之间的相似度度量划分的多个图像序列子集,每个图像序列子集包括基础图像序列和其他图像序列,其中与所述基础图像序列对应的第一相似度度量高于等于与所述其他图像序列对应的第一相似度度量;初始三维模型建模模块820,被配置为使用所述基础图像序列,建立初始三维模型;以及最终三维模型建模模块830,被配置为基于所述初始三维模型,使用所述其他图像序列,建立最终三维模型。
在某些实施例中,其中与每个图像序列子集中的图像序列子集对应的第二相似度度量高于等于与其他图像序列子集中的图像序列子集对应的第二相似度度量。
在某些实施例中,其中所述初始三维模型建模模块820包括:第一关联图像确定模块(未示出),被配置为根据以下至少一项在所述基础图像序列之间确定针对基础图像序列的相关联的图像:所述图像的采集位置,以及所述图像之间的第三相似度度量;以及第一初始三维模型建模模块(未示出),被配置为使用所述针对基础图像序列的相关联的图像,建立所述初始三维模型。
在某些实施例中,其中所述初始三维模型建模模块820包括:基础分段划分模块(未示出),被配置为将所述针对基础图像序列的相关联的图像按照图像采集顺序划分成多个对应的基础分段;初始基础分段三维模型建模模块(未示出),被配置为使用所述多个对应的基础分段中的一个对应的基础分段,建立初始基础分段三维模型;增量基础分段三维模型建模模块(未示出),被配置为基于建立的所述初始基础分段三维模型,使用与所述一个对应的基础分段相邻的对应的基础分段,建立增量基础分段三维模型;以及第二初始三维模型建模模块(未示出),被配置为将所述初始基础分段三维模型和所述增量基础分段三维模型融合,以获得所述初始三维模型。
在某些实施例中,其中所述增量基础分段三维模型建模模块被配置为并行地建立多个所述增量基础分段三维模型。
在某些实施例中,其中所述最终三维模型建模模块830包括:第一中间三维模型建模模块(未示出),被配置为基于所述初始三维模型,分别使用所述多个图像序列子集中的所述其他图像序列,建立多个中间三维模型;以及第一最终三维模型建模模块(未示出),被配置为将所述多个中间三维模型融合,以获得所述最终三维模型。
在某些实施例中,其中所述中间三维模型建模模块被配置为并行地建立多个所述中间三维模型。
在某些实施例中,其中所述最终三维模型建模模块830包括:第二关联图像确定模块(未示出),被配置为根据以下至少一项在所述图像序列集合中的图像序列之间确定相关联的图像:所述图像的采集位置,以及所述图像之间的第三相似度度量,其中所述相关联的图像包括针对所述基础图像序列的相关联的图像和针对所述其他图像序列的相关联的图像;以及第二最终三维模型建模模块(未示出),被配置为使用针对所述其他图像序列的相关联的图像,建立所述最终三维模型。
在某些实施例中,其中所述最终三维模型建模模块830包括:第二关联图像确定模块(未示出),被配置为根据以下至少一项在所述图像序列集合中的图像序列之间确定相关联的图像:所述图像的采集位置,以及所述图像之间的第三相似度度量,其中所述相关联的图像包括针对所述基础图像序列的相关联的图像和针对所述其他图像序列的相关联的图像;分段划分模块(未示出),被配置为将所述相关联的图像按照图像采集顺序划分成多个对应的分段,所述多个对应的分段包括所述多个对应的基础分段和从所述其他图像序列划分出的多个对应的其他分段;第一中间三维模型建模模块(未示出),被配置为基于所述初始三维模型,使用与所述初始基础分段三维模型和所述增量基础分段三维模型对应的所述对应的其他分段,建立多个中间三维模型;以及第一最终三维模型建模模块(未示出),被配置将所述多个中间三维模型融合,以获得所述最终三维模型。
在某些实施例中,其中所述第一中间三维模型建模模块被配置为并行地建立多个所述中间三维模型。
根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。
通过以上参考图1至图8的描述,根据本公开的实施方式的技术方案相对于传统方案具有诸多优点。例如,利用该技术方案,可以充分利用视频序列关联图谱,合理拆分三维重建模型融合的数据,大大降低了云端海量三维融合建模的计算复杂度,且过程适合进行分布式并行处理,充分发挥公司集群计算能力,大大提高了计算效率。
图9示出了根据本公开实施例的电子设备900的示意性框图。例如,如图1所示的计算设备120和如图8所示的处理图像的装置800可以由电子设备900来实施。电子设备900旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备900还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,该电子设备900包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备900内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备900,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本公开所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本公开所提供的处理图像的方法。本公开的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本公开所提供的处理图像的方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本公开实施例中的处理图像的方法对应的程序指令/模块(例如,图8所示的图像序列集合获取模块810、初始三维模型建模模块820以及最终三维模型建模模块830)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的处理图像的方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备900的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至电子设备900。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
电子设备900还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与电子设备900的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本公开实施例的技术方案,通过根据图像序列之间的相似度将包括图像序列集合的图像序列集合划分成一个或多个图像序列子集,然后在每个图像序列子集中确定一个图像序列中的图像与图像序列子集中其他图像序列中的图像的关联度,可以有效地确定具有高关联度的图像,使得能够仅针对所确定的高关联度的图像进行后续的耗时耗资源的特征匹配计算,从而减少计算量、提高计算效率。此外,由于图像序列集合被划分成一个或多个图像序列子集,因此不同的图像序列子集可以被分配到不同的计算设备上,以执行并行的特征匹配计算。通过这种方式,可以充分利用计算资源,进一步减少计算时间,提高计算效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (22)

1.一种处理图像的方法,包括:
获取图像序列集合,所述图像序列集合包括按照图像序列之间的相似度度量划分的多个图像序列子集,每个图像序列子集包括基础图像序列和其他图像序列,其中与所述基础图像序列对应的第一相似度度量高于等于与所述其他图像序列对应的第一相似度度量;
使用所述基础图像序列,建立初始三维模型;以及
基于所述初始三维模型,使用所述其他图像序列,建立最终三维模型。
2.根据权利要求1所述的方法,其中与每个图像序列子集中的图像序列子集对应的第二相似度度量高于等于与其他图像序列子集中的图像序列子集对应的第二相似度度量。
3.根据权利要求1所述的方法,其中建立初始三维模型包括:
根据以下至少一项在所述基础图像序列之间确定针对基础图像序列的相关联的图像:
所述图像的采集位置,以及
所述图像之间的第三相似度度量;以及
使用所述针对基础图像序列的相关联的图像,建立所述初始三维模型。
4.根据权利要求3所述的方法,其中建立所述初始三维模型包括:
将所述针对基础图像序列的相关联的图像按照图像采集顺序划分成多个对应的基础分段;
使用所述多个对应的基础分段中的一个对应的基础分段,建立初始基础分段三维模型;
基于建立的所述初始基础分段三维模型,使用与所述一个对应的基础分段相邻的对应的基础分段,建立增量基础分段三维模型;以及
将所述初始基础分段三维模型和所述增量基础分段三维模型融合,以获得所述初始三维模型。
5.根据权利要求4所述的方法,其中建立多个所述增量基础分段三维模型是并行进行的。
6.根据权利要求1所述的方法,其中建立最终三维模型包括:
基于所述初始三维模型,分别使用所述多个图像序列子集中的所述其他图像序列,建立多个中间三维模型;以及
将所述多个中间三维模型融合,以获得所述最终三维模型。
7.根据权利要求6所述的方法,其中建立多个所述中间三维模型是并行进行的。
8.根据权利要求3所述的方法,其中建立最终三维模型包括:
根据以下至少一项在所述图像序列集合中的图像序列之间确定相关联的图像:
所述图像的采集位置,以及
所述图像之间的第三相似度度量,
其中所述相关联的图像包括针对所述基础图像序列的相关联的图像和针对所述其他图像序列的相关联的图像;以及
使用针对所述其他图像序列的相关联的图像,建立所述最终三维模型。
9.根据权利要求4所述的方法,其中建立最终三维模型包括:
根据以下至少一项在所述图像序列集合中的图像序列之间确定相关联的图像:
所述图像的采集位置,以及
所述图像之间的第三相似度度量,
其中所述相关联的图像包括针对所述基础图像序列的相关联的图像和针对所述其他图像序列的相关联的图像;
将所述相关联的图像按照图像采集顺序划分成多个对应的分段,所述多个对应的分段包括所述多个对应的基础分段和从所述其他图像序列划分出的多个对应的其他分段;
基于所述初始三维模型,使用与所述初始基础分段三维模型和所述增量基础分段三维模型对应的所述对应的其他分段,建立多个中间三维模型;以及
将所述多个中间三维模型融合,以获得所述最终三维模型。
10.根据权利要求9所述的方法,其中建立多个所述中间三维模型是并行进行的。
11.一种处理图像的装置,包括:
图像序列集合获取模块,被配置为获取图像序列集合,所述图像序列集合包括按照图像序列之间的相似度度量划分的多个图像序列子集,每个图像序列子集包括基础图像序列和其他图像序列,其中与所述基础图像序列对应的第一相似度度量高于等于与所述其他图像序列对应的第一相似度度量;
初始三维模型建模模块,被配置为使用所述基础图像序列,建立初始三维模型;以及
最终三维模型建模模块,被配置为基于所述初始三维模型,使用所述其他图像序列,建立最终三维模型。
12.根据权利要求11所述的装置,其中与每个图像序列子集中的图像序列子集对应的第二相似度度量高于等于与其他图像序列子集中的图像序列子集对应的第二相似度度量。
13.根据权利要求11所述的装置,其中所述初始三维模型建模模块包括:
第一关联图像确定模块,被配置为根据以下至少一项在所述基础图像序列之间确定针对基础图像序列的相关联的图像:
所述图像的采集位置,以及
所述图像之间的第三相似度度量;以及
第一初始三维模型建模模块,被配置为使用所述针对基础图像序列的相关联的图像,建立所述初始三维模型。
14.根据权利要求13所述的装置,其中所述初始三维模型建模模块包括:
基础分段划分模块,被配置为将所述针对基础图像序列的相关联的图像按照图像采集顺序划分成多个对应的基础分段;
初始基础分段三维模型建模模块,被配置为使用所述多个对应的基础分段中的一个对应的基础分段,建立初始基础分段三维模型;
增量基础分段三维模型建模模块,被配置为基于建立的所述初始基础分段三维模型,使用与所述一个对应的基础分段相邻的对应的基础分段,建立增量基础分段三维模型;以及
第二初始三维模型建模模块,被配置为将所述初始基础分段三维模型和所述增量基础分段三维模型融合,以获得所述初始三维模型。
15.根据权利要求14所述的装置,其中所述增量基础分段三维模型建模模块被配置为并行地建立多个所述增量基础分段三维模型。
16.根据权利要求11所述的装置,其中所述最终三维模型建模模块包括:
第一中间三维模型建模模块,被配置为基于所述初始三维模型,分别使用所述多个图像序列子集中的所述其他图像序列,建立多个中间三维模型;以及
第一最终三维模型建模模块,被配置为将所述多个中间三维模型融合,以获得所述最终三维模型。
17.根据权利要求16所述的装置,其中所述中间三维模型建模模块被配置为并行地建立多个所述中间三维模型。
18.根据权利要求13所述的装置,其中所述最终三维模型建模模块包括:
第二关联图像确定模块,被配置为根据以下至少一项在所述图像序列集合中的图像序列之间确定相关联的图像:
所述图像的采集位置,以及
所述图像之间的第三相似度度量,
其中所述相关联的图像包括针对所述基础图像序列的相关联的图像和针对所述其他图像序列的相关联的图像;以及
第二最终三维模型建模模块,被配置为使用针对所述其他图像序列的相关联的图像,建立所述最终三维模型。
19.根据权利要求14所述的装置,其中所述最终三维模型建模模块包括:
第二关联图像确定模块,被配置为根据以下至少一项在所述图像序列集合中的图像序列之间确定相关联的图像:
所述图像的采集位置,以及
所述图像之间的第三相似度度量,
其中所述相关联的图像包括针对所述基础图像序列的相关联的图像和针对所述其他图像序列的相关联的图像;
分段划分模块,被配置为将所述相关联的图像按照图像采集顺序划分成多个对应的分段,所述多个对应的分段包括所述多个对应的基础分段和从所述其他图像序列划分出的多个对应的其他分段;
第一中间三维模型建模模块,被配置为基于所述初始三维模型,使用与所述初始基础分段三维模型和所述增量基础分段三维模型对应的所述对应的其他分段,建立多个中间三维模型;以及
第一最终三维模型建模模块,被配置将所述多个中间三维模型融合,以获得所述最终三维模型。
20.根据权利要求19所述的装置,其中所述第一中间三维模型建模模块被配置为并行地建立多个所述中间三维模型。
21.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。
CN202010624149.2A 2020-06-30 2020-06-30 处理图像的方法、装置和计算机存储介质 Pending CN111862305A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202010624149.2A CN111862305A (zh) 2020-06-30 2020-06-30 处理图像的方法、装置和计算机存储介质
US17/214,191 US11557047B2 (en) 2020-06-30 2021-03-26 Method and apparatus for image processing and computer storage medium
EP21165541.0A EP3933769B1 (en) 2020-06-30 2021-03-29 Method and apparatus for image processing, computer storage medium and program
JP2021057214A JP7202410B2 (ja) 2020-06-30 2021-03-30 画像処理方法と装置、電子機器、コンピュータ記憶媒体及びコンピュータプログラム
KR1020210041967A KR102428849B1 (ko) 2020-06-30 2021-03-31 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010624149.2A CN111862305A (zh) 2020-06-30 2020-06-30 处理图像的方法、装置和计算机存储介质

Publications (1)

Publication Number Publication Date
CN111862305A true CN111862305A (zh) 2020-10-30

Family

ID=72989713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010624149.2A Pending CN111862305A (zh) 2020-06-30 2020-06-30 处理图像的方法、装置和计算机存储介质

Country Status (5)

Country Link
US (1) US11557047B2 (zh)
EP (1) EP3933769B1 (zh)
JP (1) JP7202410B2 (zh)
KR (1) KR102428849B1 (zh)
CN (1) CN111862305A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115546174B (zh) * 2022-10-20 2023-09-08 数坤(北京)网络科技股份有限公司 图像处理方法、装置、计算设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7352386B1 (en) * 1999-06-22 2008-04-01 Microsoft Corporation Method and apparatus for recovering a three-dimensional scene from two-dimensional images
US20120041722A1 (en) * 2009-02-06 2012-02-16 The Hong Kong University Of Science And Technology Generating three-dimensional models from images
CN104809478A (zh) * 2015-05-15 2015-07-29 北京理工大学深圳研究院 一种面向大规模三维重建的图像分块方法及装置
CN107393000A (zh) * 2017-08-24 2017-11-24 广东欧珀移动通信有限公司 图像处理方法、装置、服务器及计算机可读存储介质
CN107705355A (zh) * 2017-09-08 2018-02-16 郭睿 一种基于多张图片的3d人体建模方法及装置
US20180365891A1 (en) * 2015-06-30 2018-12-20 Mapillary Ab Method in constructing a model of a scenery and device therefor
US20180373933A1 (en) * 2015-12-30 2018-12-27 Telecom Italia S.P.A System for generating 3d images for image recognition based positioning
CN109658365A (zh) * 2017-10-11 2019-04-19 阿里巴巴集团控股有限公司 图像处理方法、装置、系统和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2856548A1 (fr) 2003-06-18 2004-12-24 France Telecom Procede de representation d'une sequence d'images par modeles 3d, signal et dispositifs correspondants
DE112009000099T5 (de) 2008-01-04 2010-11-11 3M Innovative Properties Co., St. Paul Bildsignaturen zur Verwendung in einer bewegungsbasierten dreidimensionalen Rekonstruktion
JP5485954B2 (ja) * 2011-09-06 2014-05-07 東芝テック株式会社 店舗システム及びプログラム
JP6904695B2 (ja) 2016-12-20 2021-07-21 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7352386B1 (en) * 1999-06-22 2008-04-01 Microsoft Corporation Method and apparatus for recovering a three-dimensional scene from two-dimensional images
US20120041722A1 (en) * 2009-02-06 2012-02-16 The Hong Kong University Of Science And Technology Generating three-dimensional models from images
CN104809478A (zh) * 2015-05-15 2015-07-29 北京理工大学深圳研究院 一种面向大规模三维重建的图像分块方法及装置
US20180365891A1 (en) * 2015-06-30 2018-12-20 Mapillary Ab Method in constructing a model of a scenery and device therefor
US20180373933A1 (en) * 2015-12-30 2018-12-27 Telecom Italia S.P.A System for generating 3d images for image recognition based positioning
CN107393000A (zh) * 2017-08-24 2017-11-24 广东欧珀移动通信有限公司 图像处理方法、装置、服务器及计算机可读存储介质
CN107705355A (zh) * 2017-09-08 2018-02-16 郭睿 一种基于多张图片的3d人体建模方法及装置
CN109658365A (zh) * 2017-10-11 2019-04-19 阿里巴巴集团控股有限公司 图像处理方法、装置、系统和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MICHELA FARENZENA; ANDREA FUSIELLO; RICCARDO GHERARDI: "Structure-and-motion pipeline on a hierarchical cluster tree", 2009 IEEE 12TH INTERNATIONAL CONFERENCE ON COMPUTER VISION WORKSHOPS, ICCV WORKSHOPS, pages 1 - 8 *
PAUL BEARDSLEY: "3D model acquisition from extended image sequences", EUROPEAN CONFERENCE ON COMPUTER VISION, pages 683 - 695 *

Also Published As

Publication number Publication date
US11557047B2 (en) 2023-01-17
KR102428849B1 (ko) 2022-08-04
JP2021192227A (ja) 2021-12-16
US20210217187A1 (en) 2021-07-15
JP7202410B2 (ja) 2023-01-11
EP3933769A1 (en) 2022-01-05
EP3933769B1 (en) 2023-03-29
KR20210042861A (ko) 2021-04-20

Similar Documents

Publication Publication Date Title
US10447772B2 (en) Managed function execution for processing data streams in real time
US9396512B2 (en) Fully parallel construction of k-d trees, octrees, and quadtrees in a graphics processing unit
JP2021103555A (ja) 画像検出方法、装置、電子設備、記憶媒体、及びプログラム
CN111695517B (zh) 图像的表格提取方法、装置、电子设备及存储介质
JP7222040B2 (ja) モデル訓練、画像処理方法及びデバイス、記憶媒体、プログラム製品
CN108683877A (zh) 基于Spark的分布式海量视频解析系统
CN112269789A (zh) 存储数据的方法和装置、以及读取数据的方法和装置
CN113051446A (zh) 拓扑关系查询方法、装置、电子设备和介质
US11423650B2 (en) Visual positioning method and apparatus, and computer-readable storage medium
JP7242994B2 (ja) ビデオイベント識別方法、装置、電子デバイス及び記憶媒体
CN111553844A (zh) 用于更新点云的方法及装置
EP3872703A2 (en) Method and device for classifying face image, electronic device and storage medium
CN111862305A (zh) 处理图像的方法、装置和计算机存储介质
CN111696095B (zh) 用于检测物体表面缺陷的方法及装置
CN113344074A (zh) 模型训练方法、装置、设备及存储介质
CN111461306B (zh) 特征评估的方法及装置
CN112348107A (zh) 图像数据清洗方法及装置、电子设备和介质
CN111177479A (zh) 获取关系网络图中节点的特征向量的方法以及装置
CN111767990A (zh) 神经网络的处理方法和装置
CN112529181B (zh) 用于模型蒸馏的方法和装置
CN111339344B (zh) 室内图像检索方法、装置及电子设备
CN114356512A (zh) 一种数据处理方法、设备以及计算机可读存储介质
JP2021101370A (ja) モデリングルートの検証方法、装置、無人車両及び記憶媒体
CN112069155A (zh) 数据多维分析模型生成方法和装置
CN112101284A (zh) 图像识别方法、图像识别模型的训练方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211013

Address after: 105 / F, building 1, No. 10, Shangdi 10th Street, Haidian District, Beijing 100085

Applicant after: Apollo Intelligent Technology (Beijing) Co.,Ltd.

Address before: 100094 2 / F, baidu building, No.10 Shangdi 10th Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right