CN111627051A - 电子装置及用以估计光流的方法 - Google Patents
电子装置及用以估计光流的方法 Download PDFInfo
- Publication number
- CN111627051A CN111627051A CN201910145056.9A CN201910145056A CN111627051A CN 111627051 A CN111627051 A CN 111627051A CN 201910145056 A CN201910145056 A CN 201910145056A CN 111627051 A CN111627051 A CN 111627051A
- Authority
- CN
- China
- Prior art keywords
- image
- analyzed
- feature
- optical flow
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003287 optical effect Effects 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000000605 extraction Methods 0.000 claims abstract description 99
- 230000009467 reduction Effects 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000007670 refining Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 abstract description 16
- 238000013528 artificial neural network Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/269—Analysis of motion using gradient-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种电子装置,电子装置具有神经网路架构,用于估计光流。电子装置,适于连接影像获取单元,影像获取单元获取多个待分析影像,电子装置包括:储存单元,特征撷取单元,光流估测单元以及细化单元。储存单元储存特征撷取模块。特征撷取单元连接至影像获取单元及储存单元。光流估测单元连接至特征撷取单元,以产生预估光流。细化单元,连接至光流估测单元,将预估光流输入至细化模块,以获取预估光流结果。本发明也提供一种估计光流的方法,以降低估计光流时所需训练参数的数量,以降低训练时间,并且提高训练稳定度。
Description
技术领域
本发明是有关于一种影像处理技术,且特别是有关于一种具有神经网路架构的电子装置及其用以估计光流的方法。
背景技术
在科技时代,特征匹配技术逐渐充斥在生活之中,举凡图像缝合、即时定位与地图构建、手势辨识、影像追踪等,皆涉及到繁复的影像运算。在此之中,稠密匹配的技术更是常被应用于环景拼接及地图构建中。由于环景拼接及地图构建的技术中,匹配的精确度会影响到影像的处理效果。倘若匹配不够精确,将使得处理后的影像出现鬼影(Ghostingimage),或者建构出有误差的地图。
在现有的技术中,常被采用的稠密匹配技术例如为FlowNet 2.0,然其需要大量训练参数,导致效率降低。SPyNet亦被应用于电脑视觉技术领域之中,虽然SPyNet的训练参数数量优于FlowNet2.0,但精确度却不及FlowNet2.0。另一种常被采用的技术是PWC-Net,其所需的训练参数较少,且精确度也较高。然而,PWC-Net所需的训练时间很长。因此,如何能够找到适用于电脑视觉技术的方式,且降低训练参数的数量、维持精确度并降低训练时间为本领域技术人员所致力的课题。
“背景技术”段落只是用来帮助了解本发明内容,因此在“背景技术”段落所揭露的内容可能包含一些没有构成本领域技术人员所知道的已知技术。在“背景技术”段落所揭露的内容,不代表该内容或者本发明一个或多个实施例所要解决的问题,在本发明申请前已被本领域技术人员所知晓或认知。
发明内容
本发明提供一种电子装置及用以估计光流的方法,以降低估计光流时所需训练参数的数量,以降低训练时间,并且提高训练稳定度。电子装置具有神经网路架构,用于估计光流。
为达上述之一或部分或全部目的或是其他目的,本发明提供一种电子装置,电子装置具有神经网路架构,用于估计光流。电子装置适于连接影像获取单元。影像获取单元,获取多个待分析影像。此电子装置具有储存单元、特征撷取单元、光流估计单元以及细化单元。影像获取单元获取多个待分析影像。储存单元储存特征撷取模块,且特征撷取模块具有特征撷取层以及特征降维层。特征撷取单元连接至影像获取单元及储存单元,用以将待分析影像分别输入特征撷取模块,使待分析影像被输入至特征撷取层并分别产生待分析影像相应的中间影像特征。待分析影像相应的中间影像特征会分别被输入至特征降维层,以使中间影像特征经降维而分别产生影像特征。光流估测单元连接至特征撷取单元,用以将每一待分析影像的影像特征输入至光流估测模块,以产生预估光流。细化单元连接至光流估测单元,用以将预估光流输入至细化模块,以提取预估光流的预估光流特征,并将预估光流特征整合至预估光流中,以获取预估光流结果。
为达上述之一或部分或全部目的或是其他目的,本发明提供一种用以估计光流的方法,并具有下列步骤:获取多个待分析影像;将待分析影像分别输入至特征撷取模块,特征撷取模块包括特征撷取层及特征降维层,待分析影像会被输入至特征撷取层,以分别产生待分析影像相应的中间影像特征,且待分析影像相应的中间影像特征会分别被输入至特征降维层,以使中间影像特征经降维而分别产生影像特征;将每一待分析影像的影像特征输入至光流估测模块,以产生预估光流;以及将预估光流输入至细化模块,以提取预估光流的预估光流特征,并将预估光流特征整合至预估光流中,以获取预估光流结果。
基于上述,本发明的电子装置以及用以估计光流的方法通过设置特征降维层,能够降低估计光流所需的参数量,有效的降低训练所需的时间。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1绘示本发明一实施例电子装置的系统示意图。
图2与图3绘示本发明一实施例估计光流的方法的流程示意图。
图4与图5绘示本发明一实施例特征撷取单元的运作示意图。
图6及图7绘示本发明一实施例光流估测单元的运作示意图。
图8绘示本发明一实施例细化单元的运作示意图。
图9绘示本发明另一实施例估计光流的方法的流程示意图。
图10绘示本发明一实施例用以估计光流的方法的实验结果示意图。附图标记说明
10:显示器
100:电子装置
110:影像获取单元
120:储存单元
130:特征撷取单元
132:第一特征撷取模块
134:第二特征撷取模块
140:光流估测单元
142:光流估测模块
150:细化单元
152:细化模块
160:影像拼接单元
F1-1、F1-2、F2-1、F2-2:影像特征。
具体实施方式
有关本发明的前述及其他技术内容、特点与功效,在以下配合参考附图的多个实施例的详细说明中,将可清楚的呈现。以下实施例中所提到的方向用语,例如“上”、“下”、“前”、“后”、“左”、“右”等,仅是参考附图的方向。因此,使用的方向用语是用来说明,而非用来限制本发明。并且,以下实施例中所提到的“连接”一词可指任何直接或间接的连接手段。此外,“信号”一词可指至少一个电流、电压、电荷、温度、资料、电磁波或任何其他一个或多个信号。
图1绘示本发明一实施例电子装置的系统示意图。请参照图1,电子装置100能够通过撷取的影像预估光流。并且,依据不同的应用情境,电子装置100所估计的光流能够被应用于图像缝合、即时定位与地图构建、手势辨识、影像追踪等各类型的影像运算之中。举例来说,在图1绘示的情境里,电子装置100会依据撷取的影像预估光流,并依据光流而将撷取的影像缝合/接合成环景影像,并显示在显示器10当中。电子装置100电连接显示器10,以无线或有线的方式传递讯号给显示器10。
电子装置100连接影像获取单元110。电子装置100具有储存单元120、特征撷取单元130、光流估测单元140以及细化单元150。
影像获取单元110用以获取影像,特别是,在电子装置100预估光流的过程中,影像获取单元110能够获取多个待分析影像。在本发明的一实施例中,影像获取单元110例如为各种类型的摄相机,本发明并不限于此。
储存单元120用以储存电子装置100运行所需的必要程序与资料。特别是,储存单元120储存特征撷取模块。在本发明的一实施例中,特征撷取模块具有特征撷取层以及特征降维层。特征撷取模块例如是应用程序或软件的形式储存于储存单元120。并且,在电子装置100预估光流的过程中,特征撷取模块会被载入运行,借此分析待分析影像。特征撷取模块的细节将于后方再进行说明。在本发明的一实施例中,储存单元120可以为各类型非挥发性存储器,例如只读存储器(read only memory;ROM)、快闪存储器(flash)、硬盘驱动器(hard disk drive;HDD)以及固态驱动器(solid-state drive;SSD)等类型的储存装置,然本发明不限于此。
特征撷取单元130连接影像获取单元110以及储存单元120,用以载入特征撷取模块,并据此分析待分析影像的影像特征。特征撷取单元130例如是应用程序或软件的形式。光流估测单元140连接特征撷取单元130,用以运行光流估测模块,以依据影像特征产生预估光流。细化单元150连接至光流估测单元140,用以运行细化模块,以将预估光流输入至细化模块,并获取预估光流结果。特征撷取单元130、光流估测单元140以及细化单元150运行的细节将于后方再进行说明。在本发明的一实施例中,特征撷取单元130、光流估测单元140以及细化单元150分别采用中央处理单元(central processing unit,CPU),或是其他可程序化的一般用途或特殊用途的微处理器(Microprocessor)所实现。在本发明的另一实施例中,特征撷取单元130、光流估测单元140以及细化单元150也可以采用相同的处理器,并载入不同模块后所实现,本发明不限于此。
在本发明的一实施例中,影像获取单元110与储存单元120、特征撷取单元130、光流估测单元140以及细化单元150会以外接的方式相互连接,举例来说,影像获取单元110以及储存单元120、特征撷取单元130、光流估测单元140以及细化单元150所形成的组合能够通过有线或无线连接的方式相互连接,以形成电子装置100。又或者是,影像获取单元110与储存单元120、特征撷取单元130、光流估测单元140以及细化单元150会被组合并设置在相同的壳体之中。图1所绘示的组合方式仅为示意,本发明不以此为限。
图2与图3绘示本发明一实施例估计光流的方法的流程示意图。图2与图3所绘示的估计光流的方法至少适用于图1实施例的电子装置100,然本发明不限于此。以下将同时参照图1至图3说明本发明电子装置100所运作的方式以及估计光流的方法的细节。
在步骤S210,影像获取单元110获取多个待分析影像。在本实施例中,影像获取单元110至少会撷取两张待分析影像,并且,两张待分析影像至少有部分相应于相同的实景。
在步骤S220,特征撷取单元130将待分析影像分别输入至特征撷取模块。详细来说,特征撷取单元130会将每一张待分析影像分别输入至特征撷取模块,此时,待分析影像会先被输入至特征撷取层,以产生待分析影像相应的中间影像特征。接着,此中间影像特征会被输入至该特征降维层,以使中间影像特征经降维而产生影像特征。值得一提的是,在本实施例中,每一张待分析影像会被输入至相同的模块之中,并且权值共享(Weightsharing)。也就是说,特征撷取模块在撷取每一个待分析影像所采用的参数是相同的。
在步骤S230,光流估测单元140具有光流估测模块。将每一待分析影像的影像特征输入至光流估测模块,以产生预估光流。也就是说,光流估测单元140会依据每一待分析影像的影像特征,进而预估待分析影像之间可能的光流。光流估测模块例如是应用程序或软件的形式。
在步骤S240,细化单元150提取预估光流的预估光流特征,并将预估光流特征整合至预估光流中,以获取预估光流结果。也就是说,细化单元150是提取预估光流中的特征,以进一步强化预估光流中的特征边缘。经细化单元150处理所产生出来的预估光流结果能够被用于影像缝合、地图建构等各类影像处理之中。举例来说,在本发明的一实施例中,电子装置100还具有影像拼接单元160,连接至该细化单元,依据该预估光流结果整合所述多个待分析影像,以获取全景影像。电子装置100则传递全景影像至显示器10。影像拼接单元160例如是应用程序、软件或者芯片(硬件)的形式。
为了容易理解,下述将分别对步骤S220至S240的细节详加说明,并采用第一待分析影像以及第二待分析影像来表示影像获取单元110所撷取的两张待分析影像。
图4与图5绘示本发明一实施例特征撷取单元的运作示意图。以下将通过图4与图5说明步骤S220的细节。
在此实施例中,特征撷取单元130至少具有特征撷取模块。特征撷取模块包括特征撷取层以及特征降维层。特征撷取单元130至少具有第一特征撷取模块132以及第二特征撷取模块134。每一个特征撷取模块132、134中的特征撷取层具有至少一层卷积层(Convolutional layer)以及一池化层(Pooling layer)。特征降维层具有IR模块,即摄取模块(Inception module)以及残差模块(residual module)。
特征撷取单元130将待分析影像输入至第一特征撷取模块132后,经过卷积层会输出特定数量的特征图(feature map)。接着,特征图会被输入到池化层以对特征图降采样,以获取中间影像特征。在此实施例中,池化层是以2(即对2×2的区段提取最大的特征值)来实现,然本发明不限于此。中间影像特征会进一步被输入至特征降维层,即经过IR模块(Inception模块以及残差模块)。摄取模块(Inception module)采用大小为3×3以及1×1的卷积核来提取相应的中间影像特征,残差模块则借由加入捷径(short cut)来学习恒等映射(identity mapping)。也就是说,摄取模块和残差模块是对中间影像特征进行处理,增加了大小为1×1的卷积核,并使用适当数量3×3的卷积核整合成为第一影像特征。也就是说,经由摄取模块和残差模块所产生出来的第一影像特征是透过大小为1×1及3×3的卷积核所产生,且通过此卷积核所获取的特征图数量会相同于通过卷积核大小为3×3的特征图数量,然而,前者所使用的参数量少于后者所使用的参数量。因此,通过摄取模块及残差模块的处理能够有效的降低参数数量,降低影像处理的时间。
值得一提的是,在本发明的另一实施例中,特征撷取单元130还会进一步正规化(Batch normalization)第一影像特征,以使第一影像特征的值由不同的尺度、规格改变为0~1的区间,借此,以在多个不同特征撷取模块之间采用统一规格,而使每个特征撷取模块所产生的影像特征能够稳定的收敛。
在本发明的实施例中,第一影像特征会进一步被输入至第二特征撷取模块134,以获取待分析影像相应的第二影像特征。第二特征撷取模块134所运行的方式相似于第一特征撷取模块132,于此即不再赘述。
值得一提的,本发明并不限制特征撷取模块的数量。在本发明的另一实施例中,特征撷取单元130还具有六组特征撷取模块,每一组特征撷取模块所产生的影像特征皆作为下一阶段特征撷取模块的输入,以提取该阶段的影像特征。
此外,请参照图5,在此实施例中,在第一特征撷取模块132之前还具有另一特征撷取模块131。也就是说,本实施例是以特征撷取模块中顺序第二的特征撷取模块作为第一特征撷取模块132,特征撷取模块中顺序第三的特征撷取模块作为第二特征撷取模块134,然本发明不限于此。具体来说,由于经由顺序第一的特征撷取模块131所产生的影像特征不一定贴近实际的影像特征,因此,即便采用顺序第一的特征撷取模块131所产生的影像特征,对最终产出的预估光流结果的精准度影响并不明显。在时间成本的考量下,特征撷取模块131所产生的影像特征可以选择性地不被应用于后续预估光流的过程中,本发明不限于此。
图6及图7绘示本发明一实施例光流估测单元的运作示意图。以下将通过图6、图7说明步骤S230的细节。
光流估测单元140会接收并输入第一待分析影像相应的第二影像特征F2-1以及第二待分析影像相应的第二影像特征F2-2至光流估测模块之中。在本发明的一实施例中,光流估测模块142具有预处理层(即,扭曲处理层、成本计算层)以及六层卷积层。第二待分析影像相应的第二影像特征F2-2会先经过预处理,即,F2-2会先经过影像扭曲处理(Warping),经扭曲处理所产生的结果会经过成本计算层(Cost volume)与第一待分析影像相应的第二影像特征F2-1做卷积,借此计算两张特征图像素点之间的相关性,即,第二预处理结果。第二预处理结果以及第一待分析影像相应的第二影像特征F2-1会被整合为第二光流特征组,并经过六层卷积层之后,获取相应于第二影像特征F2-1、F2-2的中间预估光流。
接着,相应于第二影像特征F2-1、F2-2的中间预估光流、第一待分析影像相应的第一影像特征F1-1以及第二待分析影像相应的第一影像特征F1-2会一起被输入至下一个光流估测模块中。此时,第二待分析影像相应的第一影像特征F1-2以及相应于第二影像特征F2-1、F2-2的中间预估光流会经过预处理,即,第一影像特征F1-2以及相应于第二影像特征F2-1、F2-2的预估光流会先经过影像扭曲处理,经扭曲处理所产生的结果会经过成本计算层与第一待分析影像相应的第一影像特征F1-1进行卷积,借此计算两张特征图像素点之间的相关性,成本计算层的输出即为第一预处理结果。第一预处理结果、相应于第二影像特征F2-1、F2-2的中间预估光流以及第一影像特征F1-1会被整合为第一光流特征组,并经过六层卷积层之后,获取预估光流。换句话说,待分析影像包括第一待分析影像以及第二待分析影像,且第一待分析影像及第二待分析影像各自相应第一影像特征F1-1,F1-2及第二影像特征F2-1,F2-2。光流估测单元140对第二待分析影像的第二影像特征F2-2进行预处理,以产生第二预处理结果,并整合该第二预处理结果以及相应第二待分析影像的第一影像特征F1-2为第二影像特征组,并撷取第二影像特征组的特征,以产生中间预估光流。光流估测单元140还对中间预估光流以及第二待分析影像的第一影像特征F1-2进行预处理,以产生第一预处理结果,并整合第一预处理结果以及相应第一待分析影像的第一影像特征F1-1为第一影像特征组,并提取第一影像特征组的特征,以产生该预估光流。
图8绘示本发明一实施例细化单元的运作示意图。以下将通过图8说明步骤S240的细节。
在本实施例中,细化单元150包括细化模块152。细化单元150会将第一光流特征组的中间特征以及预估光流输入至细化模块152中。在本实施例中,细化模块152具有七层卷积层。中间特征是光流估测单元140运行中途所产生的中间特征。请再次参照图7,在光流估测单元140中的每一层卷积层之后都会产生一组在该层所产生的特征。而在本实施例中所采用的是第一光流特征组在第六层卷积层所输出的中间特征。详细来说,在本实施例中仅对最后产生的预估光流进行细化,因此,其所采用的中间特征会来自第一光流特征组的中间特征。再者,由于相较于第一至五层卷积层,第六层卷积层所输出的中间特征较为精准,且不同于最后输出的预估光流。因此,在本实施例的细化单元150即采用第六层卷积层所输出的中间特征,然本发明并不限于此。值得一提的是,倘若其他实施例的光流估测单元140的卷积层并非为七层,细化单元140可以任意提取倒数第二层卷积层所输出的中间特征,或者是采用其他层输出的中间特征,本发明不限于此。
在经过细化模块152的处理之后,细化单元150产生相应预估光流的预估光流特征,接着,细化单元150还会整合提取出来的预估光流特征与预估光流(即,将提取出来的影像特征与预估光流点对点的相加,以突显在预估光流之中的影像特征),以产生预估光流结果。
值得一提的是,在本发明的实施例中,细化模块所采用的卷积层为扩张卷积层(Dilation convolutional layer),借此以增加每一卷积层相应的感受野(Receptivefield),以提高输出预估光流的精准度。
图9绘示本发明另一实施例估计光流的方法的流程示意图。请参照图9,在此实施例中,第一待分析影像与第二待分析影像被输入至特征撷取模块132之中,并经过至少五个特征撷取模块,以分别产生相应于第一待分析影像与第二待分析影像的第一待分析影像与第二待分析影像的第一影像特征、第二影像特征、第三影像特征、第四影像特征以及第五影像特征。第五影像特征会被输入至光流估测模块并输出对应的中间预估光流,并与第四影像特征一起被输入至另一光流估测模块142,以输出另一对应的中间预估光流,以此类推。最终,第一影像特征以及前一阶的中间预估光流和中间特征会一起被输入至细化模块152,以获取最终的预估光流结果。图9的实施例的细节相同于图1至图8的实施例,差别仅在于特征撷取模块的数量以及光流估测模块的数量,此处即不再阐述细节。
图10绘示本发明一实施例用以估计光流的方法的实验结果示意图。在一实验的案例中是采用FlowNet模拟生成的资料集FlyingChairs中取4000对影像进行训练,1000对影像作为测试资料。并且,在此实验中同时采用了PWC-NeT以及图9实施例的估计光流的方法对前述的资料进行训练与测试。在经过100期(Epoch)的训练之后,可以看到相较于PWC-NeT,图9实施例所采用的估计光流的方法能够在0~20期之间使误差大幅的下降,有效的降低训练所需的时间。
综上所述,本发明的电子装置以及用以估计光流的方法通过设置特征降维层,能够降低估计光流所需的参数量,有效的降低训练所需的时间。除此之外,通过特征撷取单元对影像特征正规化的方式,能够使不同特征撷取模块间采用统一规格,进而使产生的影像特征能够稳定的收敛。
虽然本发明已以实施例揭露如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当视后附的权利要求书所界定者为准。以上所述,仅为本发明的优选实施例而已,当不能以此限定本发明实施的范围,即所有依本发明申请权利要求书及发明说明内容所作的简单等效变化与修改,皆仍属本发明专利涵盖的范围内。另外,本发明的任一实施例或权利要求不须达成本发明所揭露的全部目的或优点或特点。此外,摘要部分和标题仅是用来辅助专利文件检索之用,并非用来限制本发明的权利范围。另外,说明书中提及的第一、第二等用语,仅用以表示元件的名称,并非用来限制元件数量上的上限或下限。
Claims (18)
1.一种电子装置,用于估计光流,适于连接影像获取单元,其中所述影像获取单元,获取多个待分析影像,其特征在于,所述电子装置包括:
储存单元,储存特征撷取模块,其中所述特征撷取模块包括特征撷取层以及特征降维层;
特征撷取单元,连接至所述影像获取单元及所述储存单元,将所述多个待分析影像分别输入所述特征撷取模块,使所述多个待分析影像被输入至所述特征撷取层并分别产生所述多个待分析影像相应的中间影像特征,且所述多个待分析影像相应的所述中间影像特征会分别被输入至所述特征降维层,以使所述中间影像特征经降维而分别产生影像特征;
光流估测单元,连接至所述特征撷取单元,将每一所述多个待分析影像的所述影像特征输入至光流估测模块,以产生预估光流;以及
细化单元,连接至所述光流估测单元,将所述预估光流输入至细化模块,以提取所述预估光流的预估光流特征,并将所述预估光流特征整合至所述预估光流中,以获取预估光流结果。
2.根据权利要求1所述的电子装置,其特征在于,所述电子装置还包括:
影像拼接单元,连接至所述细化单元,依据所述预估光流结果整合所述多个待分析影像,以获取全景影像。
3.根据权利要求1所述的电子装置,其特征在于,所述特征撷取模块包括第一特征撷取模块以及第二特征撷取模块,
其中,所述特征撷取单元输入所述多个待分析影像至所述第一特征撷取模块,以获取每一所述多个待分析影像相应的第一影像特征,
所述特征撷取单元还将每一所述多个待分析影像相应的所述第一影像特征分别输入至所述第二特征撷取模块,以获取每一所述多个待分析影像相应的第二影像特征。
4.根据权利要求1所述的电子装置,其特征在于,所述特征撷取模块包括第一特征撷取模块以及第二特征撷取模块,
其中,所述特征撷取单元输入所述多个待分析影像至所述第一特征撷取模块,以获取每一所述多个待分析影像相应的第一影像特征,
所述特征撷取单元还正规化每一所述多个待分析影像相应的所述第一影像特征,
所述特征撷取单元还将正规化后的每一所述多个待分析影像相应的所述第一影像特征分别输入至所述第二特征撷取模块,以获取每一所述多个待分析影像相应的第二影像特征,
所述特征撷取单元还正规化每一所述多个待分析影像相应的所述第二影像特征。
5.根据权利要求1所述的电子装置,其特征在于,所述待分析影像包括第一待分析影像以及第二待分析影像,且所述第一待分析影像及第二待分析影像各自相应第一影像特征及第二影像特征,
其中,所述光流估测单元对所述第二待分析影像的所述第二影像特征进行预处理,以产生第二预处理结果,并整合所述第二预处理结果以及相应所述第二待分析影像的所述第一影像特征为第二影像特征组,并撷取所述第二影像特征组的特征,以产生中间预估光流,
其中,所述光流估测单元还对所述中间预估光流以及所述第二待分析影像的所述第一影像特征进行预处理,以产生第一预处理结果,并整合所述第一预处理结果以及相应所述第一待分析影像的所述第一影像特征为第一影像特征组,并提取所述第一影像特征组的特征,以产生所述预估光流。
6.根据权利要求5所述的电子装置,其特征在于,
所述光流估测单元还撷取所述第一影像特征组的中间特征,
所述细化单元依据所述预估光流以及所述中间特征获取所述预估光流特征。
7.根据权利要求1所述的电子装置,其特征在于,所述特征降维层包括摄取模块及残差模块。
8.根据权利要求1所述的电子装置,其特征在于,所述特征撷取层包括至少一个卷积层以及池化层。
9.根据权利要求1所述的电子装置,其特征在于,所述细化单元是将所述预估光流输入至扩张卷积层以提取所述预估光流的所述预估光流特征。
10.一种用以估计光流的方法,其特征在于,所述方法包括:
获取多个待分析影像;
将所述多个待分析影像分别输入至特征撷取模块,其中所述特征撷取模块包括特征撷取层及特征降维层,所述多个待分析影像会被输入至所述特征撷取层,以分别产生所述多个待分析影像相应的中间影像特征,且所述多个待分析影像相应的所述中间影像特征会分别被输入至所述特征降维层,以使所述中间影像特征经降维而分别产生影像特征;
将每一所述多个待分析影像的所述影像特征输入至光流估测模块,以产生预估光流;以及
将所述预估光流输入至细化模块,以提取所述预估光流的预估光流特征,并将所述预估光流特征整合至所述预估光流中,以获取预估光流结果。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
依据所述预估光流结果整合所述多个待分析影像,以获取全景影像。
12.根据权利要求10所述的方法,其特征在于,在所述特征撷取模块包括第一特征撷取模块以及第二特征撷取模块,且于将所述多个待分析影像分别输入至所述特征撷取模块的步骤中,还包括:
输入所述多个待分析影像至所述第一特征撷取模块,以获取每一所述多个待分析影像相应的第一影像特征;以及
将每一所述多个待分析影像相应的所述第一影像特征分别输入至所述第二特征撷取模块,以获取每一所述多个待分析影像相应的第二影像特征。
13.根据权利要求10所述的方法,其特征在于,在所述特征撷取模块包括所述第一特征撷取模块以及所述第二特征撷取模块,且于将所述多个待分析影像分别输入至所述特征撷取模块的步骤中,还包括:
输入所述多个待分析影像至所述第一特征撷取模块,以获取每一所述多个待分析影像相应的第一影像特征;
正规化每一所述多个待分析影像相应的所述第一影像特征;
将正规化后的每一所述多个待分析影像相应的所述第一影像特征分别输入至所述第二特征撷取模块,以获取每一所述多个待分析影像相应的第二影像特征;以及
正规化每一所述多个待分析影像相应的所述第二影像特征。
14.根据权利要求10所述的方法,其特征在于,所述待分析影像还包括第一待分析影像以及第二待分析影像,且所述第一待分析影像及第二待分析影像各自相应第一影像特征及第二影像特征,并且,在将每一所述多个待分析影像的所述影像特征输入至光流估测模块,以产生所述预估光流的步骤中,还包括:
对所述第二待分析影像的所述第二影像特征进行预处理,以产生第二预处理结果,并整合所述第二预处理结果以及相应所述第二待分析影像的所述第一影像特征为第二影像特征组,并撷取所述第二影像特征组的特征,以产生中间预估光流;以及
对所述中间预估光流以及所述第二待分析影像的所述第一影像特征进行预处理,以产生第一预处理结果,并整合所述第一预处理结果以及相应所述第一待分析影像的所述第一影像特征为第一影像特征组,并提取所述第一影像特征组的特征,以产生所述预估光流。
15.根据权利要求14所述的方法,其特征在于,在将所述预估光流输入至所述细化模块,以提取所述预估光流的预估光流特征的步骤中,还包括:
撷取所述第一影像特征组的中间特征;以及
依据所述预估光流以及所述中间特征获取所述预估光流特征。
16.根据权利要求10所述的方法,其特征在于,所述特征降维层包括摄取模块及残差模块。
17.根据权利要求10所述的方法,其特征在于,所述特征撷取层包括至少一个卷积层以及池化层。
18.根据权利要求10所述的方法,其特征在于,所述预估光流被输入至扩张卷积层以提取所述预估光流的所述预估光流特征。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910145056.9A CN111627051B (zh) | 2019-02-27 | 2019-02-27 | 电子装置及用以估计光流的方法 |
TW108109103A TWI725398B (zh) | 2019-02-27 | 2019-03-18 | 電子裝置及用以估計光流的方法 |
US16/784,214 US11532090B2 (en) | 2019-02-27 | 2020-02-06 | Electronic device and method for estimating optical flow |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910145056.9A CN111627051B (zh) | 2019-02-27 | 2019-02-27 | 电子装置及用以估计光流的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111627051A true CN111627051A (zh) | 2020-09-04 |
CN111627051B CN111627051B (zh) | 2023-12-15 |
Family
ID=72142508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910145056.9A Active CN111627051B (zh) | 2019-02-27 | 2019-02-27 | 电子装置及用以估计光流的方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11532090B2 (zh) |
CN (1) | CN111627051B (zh) |
TW (1) | TWI725398B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200294194A1 (en) * | 2019-03-11 | 2020-09-17 | Nvidia Corporation | View synthesis using neural networks |
EP4250729A4 (en) | 2021-02-22 | 2024-05-01 | Samsung Electronics Co Ltd | AI-BASED IMAGE ENCODING AND DECODING APPARATUS AND RELATED METHOD |
EP4262207A4 (en) * | 2021-02-22 | 2024-03-27 | Samsung Electronics Co Ltd | IMAGE ENCODING AND DECODING DEVICE USING AI AND IMAGE ENCODING AND DECODING METHOD USING SAID DEVICE |
WO2022177382A1 (ko) * | 2021-02-22 | 2022-08-25 | 삼성전자 주식회사 | Ai를 이용하는 영상의 부호화 및 복호화 장치 및 이에 의한 영상의 부호화 및 복호화 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157249A (zh) * | 2016-08-01 | 2016-11-23 | 西安电子科技大学 | 基于光流法和稀疏邻域嵌入的单图像超分辨率重建算法 |
CN106658023A (zh) * | 2016-12-21 | 2017-05-10 | 山东大学 | 一种基于深度学习的端到端视觉里程计及方法 |
TWI590663B (zh) * | 2016-05-09 | 2017-07-01 | 奇景光電股份有限公司 | 影像處理裝置及其影像處理方法 |
EP3223196A1 (en) * | 2016-03-24 | 2017-09-27 | Delphi Technologies, Inc. | A method and a device for generating a confidence measure for an estimation derived from images captured by a camera mounted on a vehicle |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4623199B2 (ja) * | 2008-10-27 | 2011-02-02 | ソニー株式会社 | 画像処理装置、画像処理方法およびプログラム |
CN104978728B (zh) | 2014-04-08 | 2017-11-14 | 南京理工大学 | 一种光流法的图像匹配系统 |
TWI548566B (zh) * | 2014-05-23 | 2016-09-11 | 國立臺北科技大學 | 多執行序全畫面即時光流估測方法 |
US10419669B2 (en) * | 2017-01-17 | 2019-09-17 | Disney Enterprises, Inc. | Omnistereoscopic panoramic video |
JP7036610B2 (ja) * | 2017-03-16 | 2022-03-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 学習方法およびプログラム |
CN107146248A (zh) | 2017-04-27 | 2017-09-08 | 杭州电子科技大学 | 一种基于双流卷积神经网络的立体匹配方法 |
US11122238B1 (en) * | 2017-11-07 | 2021-09-14 | Twitter, Inc. | Frame interpolation with multi-scale deep loss functions and generative adversarial networks |
US10542270B2 (en) * | 2017-11-15 | 2020-01-21 | Salesforce.Com, Inc. | Dense video captioning |
US10671855B2 (en) * | 2018-04-10 | 2020-06-02 | Adobe Inc. | Video object segmentation by reference-guided mask propagation |
US10380753B1 (en) * | 2018-05-30 | 2019-08-13 | Aimotive Kft. | Method and apparatus for generating a displacement map of an input dataset pair |
JP7131994B2 (ja) * | 2018-07-04 | 2022-09-06 | 株式会社東芝 | 自己位置推定装置、自己位置推定方法、自己位置推定プログラム、学習装置、学習方法及び学習プログラム |
US10986325B2 (en) * | 2018-09-12 | 2021-04-20 | Nvidia Corporation | Scene flow estimation using shared features |
US10547823B2 (en) * | 2018-09-25 | 2020-01-28 | Intel Corporation | View interpolation of multi-camera array images with flow estimation and image super resolution using deep learning |
US11083913B2 (en) * | 2018-10-25 | 2021-08-10 | Elekta, Inc. | Machine learning approach to real-time patient motion monitoring |
US10839543B2 (en) * | 2019-02-26 | 2020-11-17 | Baidu Usa Llc | Systems and methods for depth estimation using convolutional spatial propagation networks |
EP3994660A4 (en) * | 2019-07-01 | 2023-08-02 | Geomagical Labs, Inc. | METHOD AND SYSTEM FOR IMAGE GENERATION |
US11827214B2 (en) * | 2020-03-05 | 2023-11-28 | Huawei Technologies Co., Ltd. | Machine-learning based system for path and/or motion planning and method of training the same |
-
2019
- 2019-02-27 CN CN201910145056.9A patent/CN111627051B/zh active Active
- 2019-03-18 TW TW108109103A patent/TWI725398B/zh active
-
2020
- 2020-02-06 US US16/784,214 patent/US11532090B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3223196A1 (en) * | 2016-03-24 | 2017-09-27 | Delphi Technologies, Inc. | A method and a device for generating a confidence measure for an estimation derived from images captured by a camera mounted on a vehicle |
TWI590663B (zh) * | 2016-05-09 | 2017-07-01 | 奇景光電股份有限公司 | 影像處理裝置及其影像處理方法 |
CN106157249A (zh) * | 2016-08-01 | 2016-11-23 | 西安电子科技大学 | 基于光流法和稀疏邻域嵌入的单图像超分辨率重建算法 |
CN106658023A (zh) * | 2016-12-21 | 2017-05-10 | 山东大学 | 一种基于深度学习的端到端视觉里程计及方法 |
Also Published As
Publication number | Publication date |
---|---|
TWI725398B (zh) | 2021-04-21 |
CN111627051B (zh) | 2023-12-15 |
TW202032502A (zh) | 2020-09-01 |
US20200273185A1 (en) | 2020-08-27 |
US11532090B2 (en) | 2022-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111627051B (zh) | 电子装置及用以估计光流的方法 | |
Du et al. | Correlation-guided attention for corner detection based visual tracking | |
CN108710847B (zh) | 场景识别方法、装置及电子设备 | |
WO2021043168A1 (zh) | 行人再识别网络的训练方法、行人再识别方法和装置 | |
US20200218948A1 (en) | Thundernet: a turbo unified network for real-time semantic segmentation | |
JP6624794B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
WO2019001481A1 (zh) | 车辆外观特征识别及车辆检索方法、装置、存储介质、电子设备 | |
WO2021013095A1 (zh) | 图像分类方法、图像分类模型的训练方法及其装置 | |
WO2019055093A1 (en) | EXTRACTION OF SPATIO-TEMPORAL CHARACTERISTICS FROM A VIDEO | |
CN111667001B (zh) | 目标重识别方法、装置、计算机设备和存储介质 | |
CN107766864B (zh) | 提取特征的方法和装置、物体识别的方法和装置 | |
CN110738103A (zh) | 活体检测方法、装置、计算机设备和存储介质 | |
CN110222718A (zh) | 图像处理的方法及装置 | |
CN111914753A (zh) | 基于深度学习的低功耗智能枪瞄图像处理系统及处理方法 | |
WO2024077781A1 (zh) | 基于卷积神经网络模型的图像识别方法、装置及终端设备 | |
WO2022179606A1 (zh) | 一种图像处理方法及相关装置 | |
CN113297959A (zh) | 一种基于角点注意力孪生网络的目标跟踪方法及系统 | |
CN115346239A (zh) | 一种人体姿态估计方法、装置、电子设备及存储介质 | |
Wang et al. | Global contextual guided residual attention network for salient object detection | |
CN111914841B (zh) | 一种ct图像处理方法和装置 | |
AU2018101640A4 (en) | A system and method for image processing | |
CN115862119A (zh) | 基于注意力机制的人脸年龄估计方法及装置 | |
Fang et al. | MR-CapsNet: a deep learning algorithm for image-based head pose estimation on CapsNet | |
CN111832494A (zh) | 信息存储方法及设备 | |
CN113516089B (zh) | 人脸图像识别方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |