CN110609971B - 一种校准多元回归网络构建方法 - Google Patents
一种校准多元回归网络构建方法 Download PDFInfo
- Publication number
- CN110609971B CN110609971B CN201910741303.1A CN201910741303A CN110609971B CN 110609971 B CN110609971 B CN 110609971B CN 201910741303 A CN201910741303 A CN 201910741303A CN 110609971 B CN110609971 B CN 110609971B
- Authority
- CN
- China
- Prior art keywords
- face image
- multiple regression
- parameter
- calibration
- follows
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims abstract description 26
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 7
- 238000002474 experimental method Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims 3
- 238000000034 method Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 abstract description 5
- 238000012545 processing Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 11
- 238000002372 labelling Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 210000001331 nose Anatomy 0.000 description 3
- 101100129232 Danio rerio mafaa gene Proteins 0.000 description 2
- 210000004709 eyebrow Anatomy 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种校准多元回归网络构建方法,属于计算机算法领域,一种校准多元回归网络构建方法,它通过在多元回归网络中增加W矩阵,以及对W矩阵进行非线性处理,增加了输入‑输出变量之间非线性关系的刻画,提升了多元回归网络的系统性能,同时将标准校准多元回归网络中B矩阵用两个矩阵U、V实现,在这种矩阵分解过程中,遵循低秩的原则,这种低秩性原则可以保证用最少的参数解决函数近似问题,提高多元回归网络的运算性能,增加其运算的准确率。
Description
技术领域
本发明涉及计算机算法领域,更具体地说,涉及一种校准多元回归网络构建方法。
背景技术
多元回归是研究一个因变量、与两个或两个以上自变量的回归。亦称为多元线性回归,是反映一种现象或事物的数量依多种现象或事物的数量的变动而相应地变动的规律。建立多个变量之间线性或非线性数学模型数量关系式的统计方法。
使用计算机构建多元回归网络,是处理测量数据时,研究变量与变量之间的关系的重要手段。校准多元回归模型如公式(1)所示,其中Y为目标输出,X为输入,B为映射矩阵,即待优化的参数。
定义
A*k=(A1k,...;Adk)T,Aj*=(Aj1,...,Ajm)
则||*||2,1和||*||1,p具体表示如下:
目前有不同的方法根据(1)求解映射矩阵B。
公知的,校准多元回归网络的目标是寻找映射B,使得Y-XB的误差最小,并且采用||*||2,1计算误差。对矩阵B的约束上,公式(1)中只是利用||*||1,p范数来约束,这种约束中p一般两种选择,即p=∞和p=2。这分别对应下面两种情况:
其中(2)是限制B矩阵每行的最大值,而(3)则是限制B矩阵每行的二范数,对B中的其他关系没有任何限制。
在Y和X之间关系刻画上,只是用B矩阵刻画这种线性关系。在很多应用中,输入和输出之间不再是简单的线性关系,这在具体应用中,如根据输入人脸图像,输出人脸关键点等应用中,输入和输出的非线性关系很明显。简单用这种校准多元回归网络,则不能得到很好的精度。
发明内容
1.要解决的技术问题
针对现有技术中存在的问题,本发明的目的在于提供一种校准多元回归网络构建方法,它通过在多元回归网络中增加W矩阵,以及对W矩阵进行非线性处理,增加了输入-输出变量之间非线性关系的刻画,提升了多元回归网络的系统性能,同时将标准校准多元回归网络中B矩阵用两个矩阵U、V实现,在这种矩阵分解过程中,遵循低秩的原则,这种低秩性原则可以保证用最少的参数解决函数近似问题,提高多元回归网络的运算性能,增加其运算的准确率。
2.技术方案
为解决上述问题,本发明采用如下的技术方案。
一种校准多元回归网络构建方法,以X为输入层参数,W为非线性网络层参数,z为该层输出,其神经元节点的激活函数采用余弦函数,输入X和该层输出z之间的关系如下公式所示:
对于线性层,将z作为输入,Y为输出,其关系如下:
Y=f(M,z)=Mz (4)
其中M=UV,U、V为对M的低秩分解,校准多元回归网络具体构建步骤如下:
S1、随机选取W、U、V参数数值,并设定迭代次数t从1开始;
S2、给定输入数据X和输出数据Y,计算
S3、更新U参数;
S4、给定输入数据X和输出数据Y,计算
S5、更新V参数;
S6、给定输入数据X和输出数据Y,计算
S7、更新W参数;
S8、迭代更新,直到收敛。
进一步的,所述步骤S2中,的计算公式如下:
进一步的,所述步骤S2中,D为实验中可调节的一个参数,G为一对角矩阵,其对角线元素为:
进一步的,所述步骤S3中,U参数的更新公式如下:
进一步的,所述步骤S3中,ηU为迭代速率,其值一般在实验过程中调节确定。
进一步的,所述步骤S4中,的计算公式如下:
进一步的,所述步骤S5中,V参数的更新公式为:其中ηV为迭代速率,其值一般在实验过程中调节确定。
进一步的,所述步骤S6中,的计算公式如下:
其中Λ表示如下:
(A⊙B)ij=AijBij。
进一步的,所述步骤S7中,W参数的更新公式如下:
进一步的,所述步骤S7中,ηW为迭代速率,其值一般在实验过程中调节确定。
3.有益效果
相比于现有技术,本发明的优点在于:
本方案通过在多元回归网络中增加W矩阵,以及对W矩阵进行非线性处理,增加了输入-输出变量之间非线性关系的刻画,提升了多元回归网络的系统性能,同时将标准校准多元回归网络中B矩阵用两个矩阵U、V实现,在这种矩阵分解过程中,遵循低秩的原则,这种低秩性原则可以保证用最少的参数解决函数近似问题,提高多元回归网络的运算性能,增加其运算的准确率。
附图说明
图1为本发明的网络结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”、“顶/底端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“套设/接”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1:
请参阅图1,一种校准多元回归网络构建方法,本质是一种神经网络的构建,其包含两个部分,一是神经网络的结构,一是神经网络中参数的确定,神经网络的结构包含若干参数,其中X为输入层参数,W为非线性网络层参数,z为该层输出,其神经元节点的激活函数采用余弦函数,输入X和该层输出z之间的关系如下公式所示:
对于线性层,将z作为输入,Y为输出,其关系如下:
Y=f(M,z)=Mz (4)
其中M=UV,U、V为对M的低秩分解。
在构建神经网络,会对构造的神经网络的优化,在优化中,需要构造目标函数,然后利用梯度下降方法进行优化。其中目标函数如下:
其中Y为目标输出,X为输入。其中W、U、V之间的关系如图1所示。
在图1中,将X和Y的关系用神经网络刻画。分为非线性层和线性层,其中W参数表示的非线性网络层参数,利用余弦激活函数刻画X和Y之间的非线性关系;U、V表示了线性关系,其保证矩阵M=UV的低秩特性。
给定X,Y,按照图1的网络结构,构建校准多元回归网络,计算W、U、V参数的数值,其具体步骤如下:
S1、随机选取W、U、V参数数值,并设定迭代次数t从1开始;
S2、给定输入数据X和输出数据Y,计算如下:
其中D为实验中可调节的一个参数,G为一对角矩阵,其对角线元素如下:
S3、更新U参数:
其中ηU为迭代速率,其值一般在实验过程中调节确定;
S4、给定输入数据X和输出数据Y,计算如下:
S5、更新V参数:
其中ηV为迭代速率,其值一般在实验过程中调节确定;
S6、给定输入数据X和输出数据Y,计算如下:
其中Λ表示如下:
(A⊙B)ij=AijBij
S7、更新W参数:
其中ηW为迭代速率,其值一般在实验过程中调节确定。
S8、迭代更新,直到收敛。
至此,根据输入数据X和Y,得到基于余弦激活函数的稀疏低秩联合约束的校准多元回归网络的参数W、U、V。
使用时,给定X和W、U、V参数的数值,按照图1的网络结构计算Y:
其中D保持和构建校准多元回归网络的过程中同样的数值,且该多元回归网络投入使用前,前通过数据库进行实验验证,数据库描述和验证结果具体如下:
1、SARCOS数据库:这个数据库是描述具有7个自由度的机器臂针对不同任务产生的输出,其中用于学习的训练样本为44484个,用于预测的测试样本4449个,针对本方案的X输入数据,即为不同任务描述的21维特征,输出Y为机械臂的7个自由度数值,具体实验结果如下表所示:
表1本方案在SARCOS上实验结果对比
2、MAFL:这个数据库是CelebA的一个子数据库,用于人脸特征点标注,其标注点为5个,分别为两个眼睛、鼻子和两个嘴角,其中用于学习的训练样本为19000个,用于预测的测试数据为1000个,针对本方案的X输入数据,即为输入的人脸图像,输出Y为5个标注点的x坐标和y坐标数值,具体实验结果如下表所示:
表2本方案在MAFL上实验结果对比
3、AFLW:用于人脸特征点标注的另外一个数据库,其标注点为19个,包括眉毛(3个点×2)、眼睛(3个点×2)、鼻子(3个点)、嘴巴(3个点)和下巴(1个点),其中用于学习的训练样本为20000个,用于预测的测试数据为4386个,针对本方案的X输入数据,即为输入的人脸图像,输出Y为19个标注点的x坐标和y坐标数值;300-VW:一个视频数据库,可用于人脸特征点标注应用,其中视频数据包括50个用于学习的训练视频,64个用于预测的测试视频,这个数据库特征点标注包括68个点,包括轮廓(17个点)、眉毛(5个点×2)、眼睛(6个点×2)、鼻子(9个点)、嘴巴(20个点),针对本方案的X输入数据,即为输入的人脸图像,输出Y为68个标注点的x坐标和y坐标数值,具体实验结果如下表所示:
表3本方案在AFLW和300-VW上实验结果对比
由此可见,本发明通过在多元回归网络中增加W矩阵,以及对W矩阵进行非线性处理,增加了输入-输出变量之间非线性关系的刻画,提升了多元回归网络的系统性能,同时将标准校准多元回归网络中B矩阵用两个矩阵U、V实现,在这种矩阵分解过程中,遵循低秩的原则,这种低秩性原则可以保证用最少的参数解决函数近似问题,提高多元回归网络的运算性能,增加其运算的准确率。
以上所述,仅为本发明较佳的具体实施方式;但本发明的保护范围并不局限于此。任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其改进构思加以等同替换或改变,都应涵盖在本发明的保护范围内。
Claims (4)
1.一种用于人脸图像的校准点提取的校准多元回归网络构建方法,将人脸图像作为网络输入,即以X为输入层参数,W为非线性网络层参数,z为非线性的网络层输出,其神经元节点的激活函数采用余弦函数,这种非线性的余弦激活函数,更能体现出人脸图像特征的输入数据X和z之间的非线性关系,其特征在于,输入X和非线性的网络层输出z之间的关系如下公式所示:
对于线性层,将z作为输入,Y为输出,即人脸图像校准点的位置信息,其中每一个点用横纵坐标表示,有68个特征点,则Y输出的维度为68×2;Y与z的关系如下:
Y=f(M,z)=Mz
其中M=UV,U、V为对M的低秩分解,这种低秩分解是为了更好挖掘人脸图像特征点的潜在的结构信息,校准多元回归网络具体构建步骤如下:
S1、随机选取W、U、V参数数值,并设定迭代次数t从1开始;
S2、给定人脸图像输入数据X和人脸图像校准点的位置信息的输出数据Y,计算
S3、更新U参数;
S4、给定人脸图像输入数据X和人脸图像校准点的位置信息的输出数据Y,计算
S5、更新V参数;
S6、给定人脸图像输入数据X和人脸图像校准点的位置信息的输出数据Y,计算
S7、更新W参数;
S8、迭代更新,直到收敛;
所述步骤S2中,根据人脸图像输入数据X和人脸图像校准点的位置信息的输出数据Y,计算公式如下:
所述步骤S2中,D为实验中可调节的一个参数,G为一对角矩阵,其对角线元素为:
所述步骤S4中,根据人脸图像输入数据X和人脸图像校准点的位置信息的输出数据Y,的计算公式如下:
所述步骤S6中,根据人脸图像输入数据X和人脸图像校准点的位置信息的输出数据Y,的计算公式如下:
其中Λ表示如下:
(A⊙B)ij=AijBij。
2.根据权利要求1所述的用于人脸图像的校准点提取的校准多元回归网络构建方法,其特征在于:所述步骤S3中,U参数的更新公式如下:
ηU为迭代速率。
3.根据权利要求1所述的用于人脸图像的校准点提取的校准多元回归网络构建方法,其特征在于:所述步骤S5中,V参数的更新公式为:其中ηV为迭代速率。
4.根据权利要求1所述的用于人脸图像的校准点提取的校准多元回归网络构建方法,其特征在于:
所述步骤S7中,W参数的更新公式如下:
ηW为迭代速率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910741303.1A CN110609971B (zh) | 2019-08-12 | 2019-08-12 | 一种校准多元回归网络构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910741303.1A CN110609971B (zh) | 2019-08-12 | 2019-08-12 | 一种校准多元回归网络构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110609971A CN110609971A (zh) | 2019-12-24 |
CN110609971B true CN110609971B (zh) | 2023-12-12 |
Family
ID=68889885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910741303.1A Active CN110609971B (zh) | 2019-08-12 | 2019-08-12 | 一种校准多元回归网络构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110609971B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784795B (zh) * | 2021-01-30 | 2022-02-01 | 深圳市心和未来教育科技有限公司 | 一种人脸快速识别分析设备及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109992861A (zh) * | 2019-03-21 | 2019-07-09 | 温州大学 | 一种近红外光谱建模方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8989465B2 (en) * | 2012-01-17 | 2015-03-24 | Mayo Foundation For Medical Education And Research | System and method for medical image reconstruction and image series denoising using local low rank promotion |
US20140156575A1 (en) * | 2012-11-30 | 2014-06-05 | Nuance Communications, Inc. | Method and Apparatus of Processing Data Using Deep Belief Networks Employing Low-Rank Matrix Factorization |
US10335045B2 (en) * | 2016-06-24 | 2019-07-02 | Universita Degli Studi Di Trento | Self-adaptive matrix completion for heart rate estimation from face videos under realistic conditions |
-
2019
- 2019-08-12 CN CN201910741303.1A patent/CN110609971B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109992861A (zh) * | 2019-03-21 | 2019-07-09 | 温州大学 | 一种近红外光谱建模方法 |
Non-Patent Citations (1)
Title |
---|
Calibrated Multivariate Regression with Application to Neural Semantic Basis Discovery;Han Liu 等;《Journal of Machine Learning Research》;第1579-1606页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110609971A (zh) | 2019-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6504590B2 (ja) | 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体 | |
CN109086653B (zh) | 手写模型训练方法、手写字识别方法、装置、设备及介质 | |
CN109325875B (zh) | 基于在线社交用户隐特征的隐式群体发现方法 | |
CN110383299A (zh) | 记忆增强的生成时间模型 | |
CN111259738A (zh) | 人脸识别模型构建方法、人脸识别方法及相关装置 | |
CN113377964B (zh) | 知识图谱链接预测方法、装置、设备及存储介质 | |
JP2002190025A (ja) | パターン識別方法および装置 | |
CN112699215B (zh) | 基于胶囊网络与交互注意力机制的评级预测方法及系统 | |
CN111598213A (zh) | 网络训练方法、数据识别方法、装置、设备和介质 | |
WO2021036397A1 (zh) | 目标神经网络模型的生成方法和装置 | |
CN110210540A (zh) | 基于注意力机制的跨社交媒体用户身份识别方法及系统 | |
CN110609971B (zh) | 一种校准多元回归网络构建方法 | |
CN116363423A (zh) | 面向小样本学习的知识蒸馏方法、装置及存储介质 | |
CN117057258B (zh) | 基于权重分配相关系数的黑启动过电压预测方法及系统 | |
Jang et al. | Improving classifier confidence using lossy label-invariant transformations | |
CN115206421B (zh) | 药物重定位方法、重定位模型的训练方法及装置 | |
CN114970732A (zh) | 分类模型的后验校准方法、装置、计算机设备及介质 | |
CN110459266B (zh) | Snp致病因素与疾病关联关系模型建立方法 | |
CN115392594B (zh) | 一种基于神经网络和特征筛选的用电负荷模型训练方法 | |
CN111460732B (zh) | 一种平面电机非线性模型的构建方法 | |
CN117557870B (zh) | 基于联邦学习客户端选择的分类模型训练方法及系统 | |
CN113591383B (zh) | 面向多保真度数据的数字孪生建模方法及预测系统 | |
CN111783711B (zh) | 基于身体部件层面的骨架行为识别方法及装置 | |
CN115936073B (zh) | 一种语言导向卷积神经网络及视觉问答方法 | |
WO2023231796A1 (zh) | 一种视觉任务处理方法及其相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |