CN109255751A - 一种基于李群深度学习分析图像序列不变性的方法 - Google Patents
一种基于李群深度学习分析图像序列不变性的方法 Download PDFInfo
- Publication number
- CN109255751A CN109255751A CN201810841343.9A CN201810841343A CN109255751A CN 109255751 A CN109255751 A CN 109255751A CN 201810841343 A CN201810841343 A CN 201810841343A CN 109255751 A CN109255751 A CN 109255751A
- Authority
- CN
- China
- Prior art keywords
- lie
- group
- invariance
- image
- lie group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000013135 deep learning Methods 0.000 title claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 230000009466 transformation Effects 0.000 claims description 5
- 239000007787 solid Substances 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 abstract description 7
- 230000000007 visual effect Effects 0.000 abstract description 3
- 230000016776 visual perception Effects 0.000 abstract description 3
- 230000019771 cognition Effects 0.000 abstract description 2
- 230000004438 eyesight Effects 0.000 abstract description 2
- 238000013519 translation Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于李群深度学习分析图像序列不变性的方法,利用李群子范畴进行表示,系统提出面向图像序列隐含信息特征深度不变性的李群深度学习理论框架。通过该学习分析方法,李群理论在机器学习主要应用在视觉感知、目标跟踪、运动估计、自动控制等方面。李群机器学习的目标任务很多时候都直接或者间接地涉及到李群流形上的拓扑不变性问题,这样的拓扑不变性问题不仅能够帮助在计算机视觉中寻找恒常的视觉认知,还能够为机械系统估计复杂的刚性运动。
Description
技术领域
本发明涉及一种基于李群深度学习分析图像序列不变性的方法,属于图像处理技术领域。
背景技术
在识别图像序列中的一幅图像时主要是抓住图像的不变性进行识别。不变性是由图像的最小生成元决定的,有了最小生成元的基本元素,就可以生成复杂的图像。如汉字系统以基本笔画为最小生成元;英文语言系统以26个字母为最小生成元;图形、图像结构以点、线、面为最小生成元;空间变换以平移、旋转为最小生成元等。
发明内容
本发明所要解决的技术问题是,克服现有技术的缺点,提供一种基于李群深度学习分析图像序列不变性的方法,利用李群子范畴进行表示,系统提出面向图像序列隐含信息特征深度不变性的李群深度学习理论框架。
为了解决以上技术问题,本发明提供一种基于李群深度学习分析图像序列不变性的方法,其特征在于包括以下步骤:
⑴假设样例空间中有p个独立向量,观测空间有q个固变量,分别表示为:
x=(x1,…,xp)∈X=RP,u=(u1,…,up)∈U=Rq,
建立关系式:
uα=fα(x1,…,xp),α=1,…q
因此,开集M上的一个局部李变换群就称之为作用于X×U上的不变群;
⑵以X×U为基底构造X×U(n),即由低维结构到高维结构。
具体分析如下:
设f(x)=f(x1,…,xp),即f:Rp→R,它具有个不同的k阶偏导数,记为:
其中J=(j1,…jk),1≤jk≤p,k为J的重数。一般的,若 即u=(u1,…,uq)=f(x)=(f1(x1,…,xp),…,fq(x1,…,xp)2,则uα(α=1,…q)具有qpk个不同的k阶偏导数,
令其中α=1,…,q,J的重数为k;而
U(n)=U×U1×U2×…×Un;
即U(n)中的元素为其中α=1,…,q,Jk(k=1,…,n)的重数为k;
显然Uk是qpk维的,而U(n)的维数则为:
即记为qp(n);
⑶进一步将M扩展到多模态结构上,即M(n)
M(n)=M×U1×…×Un;
通过X×U和X×U(n)的关系,可以看出复杂图像可以由简单图像生成,即图像序列问题可以由单幅图像的方法在连续空间上处理。
本发明的有益效果是:本发明所介绍的李群理论的一个核心思想是将全局对象,也就是李群本身,用李群的局部或者称作李群的线性化版本来替代。这个李群局部的无穷小群被称作李代数;李群机器学习避免了常规流形学习中流形结构和性质难以确定以及两类空间中相互映射难以定义的问题。李群在现代几何中发挥的重要作用使得李群机器学习面对李群训练样例时能够明确界定学习的任务以及选择合适的性能度量标准,以此给出完整的机器学习系统。通过该学习分析方法,李群理论在机器学习主要应用在视觉感知、目标跟踪、运动估计、自动控制等方面。李群机器学习的目标任务很多时候都直接或者间接地涉及到李群流形上的拓扑不变性问题,这样的拓扑不变性问题不仅能够帮助在计算机视觉中寻找恒常的视觉认知,还能够为机械系统估计复杂的刚性运动。
具体实施方式
实施例1
本实施例以寻找图像序列中的一副图像的李不变子群和最小生成元为例说明本项目具体的研究方法。
(1)线性结构中不变群的方法:
M是m维微分流形,G是作用于M的一个局部李变换群,如果对M的一个子群中的任意一个x∈φ和g∈G均有g·x∈φ,即则M的一个子集φ就是G的不变子集。依此可类推得,若M的子集φ1和φ2是G不变子集,则和也是G不变子集。
(2)找线性结构中生成元的方法:
设G是作用于M的局部李交换群,对其李代数Ge中的任一非零元素v,有相应的单参数子群g(tv)。因此可得M上的向量场v,则称之为G的生成元。并且Ge到M向量场李代数L(M)的一个李代数同态可表示为:
σ:Ge→L(M)。
本实施例中通过建立ISO(2)在R2上的群作用与SO(3)在二维球面S2上的群作用之间的一个局部同构的平移和旋转两个不变性来具体说明本项目的技术路线。
(1)若ISO+(2)是非紧的,则我们处理的图像限定在一个紧区域上,并且我们所关注的平移旋转也就被限定在了完整变换群的一个紧子集上。由此可以看出,任何与ISO+(2)局部同构的群都产生相同的不变性问题。
(2)为找出局部同构,我们用参数化方法进行处理。即表示为:
Bq={(x,y)∈R2,||x+y||<ε}表示R2中原点周围的一个以ε为半径的圆曲面,x=rcosφ和y=rsinφ表示R2中点标记(r,φ)的极坐标。
S2曲线将被参数化为极坐标(θ,φ),其中0≤θ≤2π度量了到正z轴的极角,0≤φ≤2π度量了到正x轴的方位角,由此有如下表达式:
对于R∈SO(3),使用欧拉角(θ,φ,ψ)R分解为绕x轴、y轴以及z轴旋转:
该式直观表述的含义是R=(θ,φ,ψ)首先绕z轴旋转至球面坐标(θ,φ),然后绕ez的旋转图像以ψ来旋转另外两个基本向量。
下面再引入符号
现建立从B1中的点到(球面的北半球)上的点的映射为:
其中
其中,R2和S2之间的下标是为了证明使用的是球面坐标还是平面坐标。
三维旋转对应表示为:其中
α=ψ,tx=sinθcosφ,ty=sinθsinφ,
由此式可以看出,这些对应关系形成了一个局部同构。即:如果X=(x,y)∈Bε且
对某些且R=γ(T),则有||T(X)-ω-1UR(ω(X)))||=O(ε2)。进一步,通过Ω:(其中f(ω(x))=h(x))将它们射影到球面上。我们称同胚Φ:R2→R2是一个δ-同胚,当对所有x∈R2时,有||x-Φ(x)||≤δ,在这样的条件下有如下结论:
对任意其中存在一个δ-同胚ΦT,使得对任意之集被限定在Bε上的图像h有,(Ω-1((Ωf)γT))(x)=f(ΦT(x)),δ=O(ε2)。
上式表明,对大于ε的图像所做的不超过ε的平移/旋转可以通过将图像投影到球面上并旋转球面来实现。在实际中即使对ε=1/2的失真也是可以接收的,当ε<0.1时,对图像的影响也可以忽略不计。这就给我们在处理视觉感知图像旋转问题时提供了一种具体的实现技术。
(3)旋转可以看作是在s上按SO(3)的元素平移来进行处理。
对于一幅0<ω<1/2的n×n像素的图形M,向量可以按在O(L3n2)时间内计算出来。已经成功验证当ω=0.5时,L≈n。
综上所述,通过图像序列中的一副图像的李子群表示,利用李群的连通关系及李群子范畴的相关理论,建立李群深度学习理论框架。
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。
Claims (1)
1.一种基于李群深度学习分析图像序列不变性的方法,其特征在于包括以下步骤:
(1)假设样例空间中有p个独立向量,观测空间有q个固变量,分别表示为:
x=(x1,...,xp)∈X=RP,u=(u1,...,up)∈U=Rq,
建立关系式:
uα=fα(x1,...,xp),α=1,...q
因此,开集M上的一个局部李变换群就称之为作用于X×U上的不变群;
(2)以X×U为基底构造X×U(n),即由低维结构到高维结构;
具体分析如下:
设f(x)=f(x1,...,xp),即f:Rp→R,它具有个不同的k阶偏导数,记为:
其中J=(j1,...jk),1≤jk≤p,k为J的重数;一般的,若 即u=(u1,...,uq)=f(x)=(f1(x1,...,xp),...,fq(x1,...,xp)),则uα(α=1,...q)具有qpk个不同的k阶偏导数,
令其中α=1,...,q,J的重数为k;而
U(n)=U×U1×U2×...×Un;
即U(n)中的元素为其中α=1,...,q,Jk(k=1,...,n)的重数为k;
显然Uk是qpk维的,而U(n)的维数则为:
即记为qp(n);
(3)进一步将M扩展到多模态结构上,即M(n)
M(n)=M×U1×...×Un;
通过X×U和X×U(n)的关系,可以看出复杂图像可以由简单图像生成,即图像序列问题可以由单幅图像的方法在连续空间上处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810841343.9A CN109255751A (zh) | 2018-07-27 | 2018-07-27 | 一种基于李群深度学习分析图像序列不变性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810841343.9A CN109255751A (zh) | 2018-07-27 | 2018-07-27 | 一种基于李群深度学习分析图像序列不变性的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109255751A true CN109255751A (zh) | 2019-01-22 |
Family
ID=65049076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810841343.9A Pending CN109255751A (zh) | 2018-07-27 | 2018-07-27 | 一种基于李群深度学习分析图像序列不变性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109255751A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197195A (zh) * | 2019-04-15 | 2019-09-03 | 深圳大学 | 一种新型面向行为识别的深层网络系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050163384A1 (en) * | 2001-05-16 | 2005-07-28 | Yossi Avni | Apparatus for and method of pattern recognition and image analysis |
CN101609510A (zh) * | 2009-07-15 | 2009-12-23 | 北京交通大学 | 一种对图像、视频进行维数约简的方法 |
CN107886569A (zh) * | 2017-12-27 | 2018-04-06 | 武汉大学 | 一种基于离散李导数的测度可控的曲面参数化方法及系统 |
-
2018
- 2018-07-27 CN CN201810841343.9A patent/CN109255751A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050163384A1 (en) * | 2001-05-16 | 2005-07-28 | Yossi Avni | Apparatus for and method of pattern recognition and image analysis |
CN101609510A (zh) * | 2009-07-15 | 2009-12-23 | 北京交通大学 | 一种对图像、视频进行维数约简的方法 |
CN107886569A (zh) * | 2017-12-27 | 2018-04-06 | 武汉大学 | 一种基于离散李导数的测度可控的曲面参数化方法及系统 |
Non-Patent Citations (1)
Title |
---|
凌旭东: "李对称方法及其在微分方程中的应用", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197195A (zh) * | 2019-04-15 | 2019-09-03 | 深圳大学 | 一种新型面向行为识别的深层网络系统及方法 |
CN110197195B (zh) * | 2019-04-15 | 2022-12-23 | 深圳大学 | 一种新型面向行为识别的深层网络系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110096925B (zh) | 人脸表情图像的增强方法、获取方法和装置 | |
CN103839277B (zh) | 一种户外大范围自然场景的移动增强现实注册方法 | |
US20200211220A1 (en) | Method for Identifying an Object Instance and/or Orientation of an Object | |
CN109702738A (zh) | 一种基于三维物体识别的机械臂手眼标定方法及装置 | |
CN107644445A (zh) | 利用单个球及圆切线的性质标定拋物折反射摄像机的方法 | |
CN108492017A (zh) | 一种基于增强现实的产品质量信息传递方法 | |
US11244475B2 (en) | Determining a pose of an object in the surroundings of the object by means of multi-task learning | |
Xin et al. | Biological object recognition approach using space variant resolution and pigeon-inspired optimization for UAV | |
Luo et al. | Human pose estimation in 3-D space using adaptive control law with point-cloud-based limb regression approach | |
Wang et al. | Joint head pose and facial landmark regression from depth images | |
Zhu et al. | Learning generalizable manipulation policies with object-centric 3d representations | |
Xi et al. | Learning temporal-correlated and channel-decorrelated Siamese networks for visual tracking | |
CN109255751A (zh) | 一种基于李群深度学习分析图像序列不变性的方法 | |
Zhai et al. | DA $^{2} $ Dataset: Toward Dexterity-Aware Dual-Arm Grasping | |
Li et al. | Stereo neural vernier caliper | |
Jia et al. | Delving deep into pixel alignment feature for accurate multi-view human mesh recovery | |
Del-Tejo-Catalá et al. | Probabilistic pose estimation from multiple hypotheses | |
Cho et al. | Blur-robust object detection using feature-level deblurring via self-guided knowledge distillation | |
Yang | A dynamical perspective on point cloud registration | |
Cai et al. | Camera calibration with enclosing ellipses by an extended application of generalized eigenvalue decomposition | |
Wang et al. | Single-View Scene Point Cloud Human Grasp Generation | |
Li et al. | OCNN: Point cloud-based convolutional neural network for object orientation estimation | |
CN110097022A (zh) | 基于双向插值增强的2dpca人脸图像识别方法 | |
Xiao et al. | A spaceborne camera pose estimate method based on high-precision point cloud model | |
Song et al. | Joint Hand and Object Pose Estimation from a Single RGB Image using High‐level 2D Constraints |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190122 |