CN106407932A - 基于分数阶微积分与广义逆神经网络的手写数字识别方法 - Google Patents

基于分数阶微积分与广义逆神经网络的手写数字识别方法 Download PDF

Info

Publication number
CN106407932A
CN106407932A CN201610834842.6A CN201610834842A CN106407932A CN 106407932 A CN106407932 A CN 106407932A CN 201610834842 A CN201610834842 A CN 201610834842A CN 106407932 A CN106407932 A CN 106407932A
Authority
CN
China
Prior art keywords
weight matrix
hidden layer
fractional
generalized inverse
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610834842.6A
Other languages
English (en)
Other versions
CN106407932B (zh
Inventor
王健
龚晓玲
张炳杰
柳毓松
时贤
王延江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201610834842.6A priority Critical patent/CN106407932B/zh
Publication of CN106407932A publication Critical patent/CN106407932A/zh
Application granted granted Critical
Publication of CN106407932B publication Critical patent/CN106407932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种基于分数阶微积分与广义逆神经网络的手写数字识别方法,包括以下步骤,获取手写数字图像集合,根据所述手写数字图像集合,选择单隐层神经网络模型;利用分数阶微积分和广义逆计算单隐层神经网络中的权值矩阵和权值向量;根据权值矩阵和权值向量,获取神经网络网络参数,进行样本精度的计算。本发明应用于模式识别中的手写数字的识别,识别精度高;在优化输入权值矩阵时运用了分数阶导数,由于分数阶导数与整数阶相比,能够较为准确地反应神经网络模型的性能;本发明引入正则化项,具有更好的泛化性能,增强了系统的可控性,同时,正则化项可以降低数据集中存在的噪声,达到降噪的目的。

Description

基于分数阶微积分与广义逆神经网络的手写数字识别方法
技术领域
本发明涉及模式识别的技术领域,尤其是一种基于分数阶微积分与广义逆神经网络的手写数字识别方法。
背景技术
随着人工智能、信息检索和海量数据处理等技术的发展,模式识别成为了研究热点。在模式识别中,手写数字的识别因其计算复杂,识别率成为亟待解决的问题。在手写数字的识别中知识和经验的利用是必不可少的,然而知识的获取确是当前面临的瓶颈问题,特别是人脑的知识获取过程几乎是一种潜在的过程,神经网络作为一种抽取不易明确表达的知识和经验的方法在模式识别领域发挥着越来越重要的作用。
目前,传统的神经网络学习方法---单隐藏层前馈神经网络(Single-hiddenLayer Feed-forward Neural Network,SLFN)已经在模式识别领域取得了广泛的应用,但传统学习方法的训练速度远远不能满足实际模式识别的需要,成为制约其发展的主要瓶颈。产生这种情况的主要原因是:传统的神经网络学习方法中的误差反向传播方法(BackPropagation,BP)主要基于梯度下降的思想,需要多次迭代,网络的所有参数都需要在训练过程中迭代确定,因此该算法应用于模式识别领域所产生的计算量和搜索空间很大。
针对传统的神经学习方法的不足,黄广斌提出来了超限学习机(ExtremeLearning Machine,ELM)理论,ELM是的一种新型的、快速有效的单隐层前馈神经网络的学习算法,只需要设置合适的网络隐层节点个数,在执行过程中只需要为网络的输入权值和隐藏层偏差进行随机赋值,不需要再进行调整,然后输出层权值的最优解通过最小二乘法得到。整个过程一次完成,无需迭代,因此具有参数选择容易、因此具有学习速度极快(是BP算法的100倍以上)且泛化性能好的优点。但是,传统ELM算法为了弥补随机选取的隐层节点参数,往往需要较多的隐层节点个数。
俞栋等人发表的《Efficient and effective algorithms for trainingsingle-hidden-layer neural networks》将BP算法和ELM算法相结合,提出了一种用梯度下降法来选择合适的隐层节点输入参数的方法。这种算法使用最速下降法来更新从输入层到隐层之间的权值,优化网络结构,在达到好的精度前提下,减少了隐层节点个数。然而,将BP算法和ELM算法相结合,提出了一种用梯度下降法来选择合适的隐层节点输入参数的方法。这种算法使用最速下降法来更新从输入层到隐层之间的权值,优化网络结构,在达到好的精度前提下,减少了隐层节点个数。
因此,在现有的手写数字的识别中,传统的基于整数阶梯度下降法的神经网络在训练时速度缓慢,精度较低;ELM算法虽然速度快,但所需要的网络隐层节点数过多;而基于最速下降法的ELM算法虽然已经得到改进,但由于用的是整数阶导数,精度有待提高。
发明内容
本发明的目的是为克服上述现有技术的不足,提供一种基于分数阶微积分与广义逆神经网络的手写数字识别方法。
为实现上述目的,本发明采用下述技术方案:
基于分数阶微积分与广义逆神经网络的手写数字识别方法,包括以下步骤:
步骤一:获取手写数字图像集合,所述手写数字图像集合包括训练集合与待识别集合;
步骤二,根据所述手写数字图像集合,选择单隐层神经网络模型;
步骤三,利用分数阶微积分和广义逆计算单隐层神经网络中的权值矩阵和权值向量;
步骤四:根据所述权值矩阵和所述权值向量,获取神经网络网络参数,进行样本精度的计算。
优选的,所述步骤三包括以下子步骤:
步骤S31:初始化输入层到隐层的权值矩阵,获取初始权值矩阵V0
步骤S32:对初始权值矩阵V0进行优化。
进一步优选的,所述步骤S32优化步骤如下:
步骤S321:设置最大迭代次数K并初始迭代次数k=0;
步骤S322:利用最小化误差函数方法求解隐层到输出层的网络权值U;
式中,C表示正则化系数,G表示隐层输出矩阵,O表示训练集的理想输出矩阵;
步骤S323:若k<K,则执行步骤四,否则顺序执行步骤S324;
步骤S324:计算误差函数关于连接输入层和隐层的权值矩阵V的分数阶梯度,分数阶梯度导数公式为:
式中,α表示分数阶数;c表示连接输入层和隐层的权值矩阵V中元素的最小值;Γ(·)表示Gamma函数;
步骤S325:利用更新函数对步骤S324中的权值矩阵进行更新,更新函数表达式为:
式中,学习率ηk为常数;
步骤S326:迭代次数加一,返回执行步骤S322。
进一步优选的,所述步骤S325中,学习率ηk通过线搜索的方式获得。
求解从隐层到输出层旳权值时,采用了广义逆的方法,无需迭代,一步求输出权值的最小范数最小二乘解,相比于基于梯度下降法的相关算法(如BP算法)训练速度要快;
本发明的有益效果是:
1.本发明在进行模式识别中的手写数字图像的识别精度高:因为本发明在优化输入权值矩阵时运用了分数阶导数,由于分数阶导数与整数阶相比,优点是具有记忆性和遗传性,且对于一些复杂的系统,采用整数阶系统来描述其描述精度相对较低,并不能准确反映系统性能,因此本发明比基于整数阶求导的梯度下降算法精度高,能够较为准确地反应神经网络模型的性能;
2.本发明在进行模式识别中的手写数字图像识别时样本训练速度快且隐层节点数少:因为本发明对权值的迭代优化,在达到相同训练精度的前提下,本发明所需要的隐层节点数大大少于超限学习机算法所需要的隐层节点数;
在求解从隐层到输出层旳权值时,采用了广义逆的方法,无需迭代,一步求输出权值的最小范数最小二乘解,因此本发明比基于梯度下降法的相关算法(如BP算法)训练速度要快;
3.本发明在进行模式识别中的手写数字图像识别时有效降低训练样本中存在的噪声:本发明引入参数C,使得神经网络模型可以根据数据集的特点进行微调,从而得到更好的泛化性能,增强了系统的可控性,同时,正则化项可以降低数据集中存在的噪声,达到降噪的目的。
附图说明
图1是本发明结构示意图;
图2是本发明与传统神经网络建模方法的曲线图;
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本实施例利用本发明中的基于分数阶微积分与广义逆神经网络的手写数字识别方法对手写数字进行模式识别,并且将其训练精度与LM算法、USA算法进行比较。USA算法是文献《Efficient and effective algorithms for training single-hidden-layerneural networks》中的提出的算法,该算法是结合了整数阶最速下降法和广义逆的神经网络学习算法。
分数阶微积分(Fractional Derivatives and Integrals,或FractionCalculus,简写为FC)即指函数对变量非整数阶求导或积分,是古典微积分理论的自然推广,也是数学分析的一个重要的分支。一直以来,它在数学领域得到很大的发展。近年来,分数阶理论逐步应用于在电磁、信号处理、量子演变等实际复杂系统方面。许多研究者指出,分数阶具有能够很好地描述实际处理过程的记忆性和遗传性,分数阶系统甚至具有无限的记忆。考虑到这些方面,将分数阶理论引入到模式识别中,与神经网络理论相结合,即在神经网络模型中植入记忆模块,是值得研究的课题。神经网络本身的自学习性、自适应性、容错性、鲁棒性等性质也使得其在实际应用中具有很大的优势。综上而言,不管是在算法还是应用方面,将神经网络与分数阶理论结合使用都具有研究价值。
MNIST数据集是Google实验室的Corinna Cortes和纽约大学柯朗研究所的YannLeCun建立的一个手写数字模式识别数据库,训练样本有60,000张手写0-9的数字图像,测试样本有10,000张。每张图片灰度级都是8,且每张图片可以使用一个784大小的向量表征。
利用本发明中的基于分数阶微积分与广义逆神经网络的手写数字识别方法对MNIST数据集进行建模,本算法采用了2/3分数阶为例,也可选用其他阶数。
如图1所示,基于分数阶微积分与广义逆神经网络的手写数字识别方法,包括以下步骤:
步骤一:从MNIST数据集中获取手写数字图像集合,所述手写数字图像集合包括训练集合与待识别集合;
步骤二,根据所述手写数字图像集合,选择单隐层神经网络模型;
步骤三,利用分数阶微积分和广义逆计算单隐层神经网络中的权值矩阵和权值向量;
步骤四:根据权值矩阵和权值向量,获取神经网络网络参数,进行样本精度的计算。
优选的,所述步骤二中单隐层神经网络模型为:
单隐层神经网络中输入层,隐层和输出层神经元个数分别为p,n,m,从获取手写数字图像集合中给定j个输入样本xj∈Rp,相应的理想输出样本为Oj∈R,j=1,2,…,J;
设g:和f:R→R分别为隐层单元和输出层的激活函数,连接输入层和隐层的权值矩阵为V=(vij)n×p,记Vi=(vi1,vi2,…,vip)T∈Rp,i=1,2,…,n,连接隐层和输出层的权值向量为U=(uij)n×m,记Ui=(ui1,ui2,…,uip)T∈Rm,i=1,2,…,n,网络的最终输出即实际输出为Y=f(UTG(Vx)),神经网络模型误差函数为
优选的,所述步骤三包括以下子步骤:
步骤S31:初始化输入层到隐层的权值矩阵,获取初始权值矩阵V0
步骤S32:对初始权值矩阵V0进行优化。
进一步优选的,所述步骤S32优化步骤如下:
步骤S321:设置最大迭代次数K并初始迭代次数k=0;
步骤S322:利用最小化误差函数方法求解隐层到输出层的网络权值U;
式中,C表示正则化系数,G表示隐层输出矩阵,O表示训练集的理想输出矩阵;
加入上述正则化项后,神经网络的数学模型可表示为:
上式是条件极值问题,通过拉格朗日方程转换为无条件极值问题进行求解:
其中α=[α12,…,αn],αj∈Rm(j=1,2,…,n)代表拉格朗日乘子。
求拉格朗日方程的梯度并令其为0:
解上述方程组,得到:
本发明引入参数C,使得神经网络模型可以根据数据集的特点进行微调,从而得到更好的泛化性能,增强了系统的可控性,同时,正则化项可以降低数据集中存在的噪声,达到降噪的目的。
步骤S323:若k<K,则执行步骤四,否则顺序执行步骤S324;
步骤S324:计算误差函数关于连接输入层和隐层的权值矩阵V的分数阶梯度,分数阶梯度导数公式为:
式中,α表示分数阶数;本实施例中的c表示连接输入层和隐层的权值矩阵V中元素的最小值;Γ(·)表示Gamma函数;
权值ui的修正量可写为如下形式:
根据Caputo分数阶定义,得到:
因此,分数阶梯度导数公式为:
步骤S325:利用更新函数对步骤S324中的权值矩阵进行更新,更新函数表达式为:
式中,学习率ηk为常数;
步骤S326:k=k+1,返回执行步骤S322。
通过本发明中步骤四计算出测试样本的精度,并且与USA算法和ELM算法对测试样本的精度值进行比较,实验结果如图2所示。
从图2中可以看出,对于相同的隐层节点个数,本发明算法的测试精度高于USA算法和ELM算法。实验结果说明本发明算法有效的优化了初始权值,使网络在相同的隐层节点个数下,得到更高的训练精度。
本发明在优化输入权值矩阵时运用了分数阶导数,由于分数阶导数与整数阶相比,优点是具有记忆性和遗传性,且对于一些复杂的系统,采用整数阶系统来描述其描述精度相对较低,并不能准确反映系统性能。而大量的研究表明对于各种实际系统,分数阶模型的描述往往比整数阶模型更加准确。因此本发明比基于整数阶求导的梯度下降算法精度高。
本发明对权值通过迭代方式进行优化,因此在达到相同训练精度的前提下,本发明所需要的隐层节点数大大少于超限学习机算法所需要的隐层节点数。
本发明在求解从隐层到输出层旳权值时,采用了广义逆的方法,无需迭代,一步求输出权值的最小范数最小二乘解。因此本发明比基于梯度下降法的相关算法(例如BP算法)训练速度要快。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (4)

1.基于分数阶微积分与广义逆神经网络的手写数字识别方法,其特征是,包括以下步骤:
步骤一:获取手写数字图像集合,所述手写数字图像集合包括训练集合与待识别集合;
步骤二,根据所述手写数字图像集合,选择单隐层神经网络模型;
步骤三,利用分数阶微积分和广义逆计算单隐层神经网络中的权值矩阵和权值向量;
步骤四:根据权值矩阵和权值向量,获取神经网络网络参数,进行样本精度的计算。
2.如权利要求1所述的基于分数阶微积分与广义逆神经网络的手写数字识别方法,其特征是,所述步骤三包括以下子步骤:
步骤S31:初始化输入层到隐层的权值矩阵,获取初始权值矩阵V0
步骤S32:对初始权值矩阵V0进行优化。
3.如权利要求2所述的基于分数阶微积分与广义逆神经网络的手写数字识别方法,其特征是,所述步骤S32具体步骤如下:
步骤S321:设置最大迭代次数K并初始迭代次数k=0;
步骤S322:利用最小化误差函数方法求解隐层到输出层的网络权值U;
U = ( I C + GG T ) - 1 G O ;
式中,C表示正则化系数,G表示隐层输出矩阵,O表示训练集的理想输出矩阵;
步骤S323:若k<K,则执行步骤四,否则顺序执行步骤S324;
步骤S324:计算误差函数关于连接输入层和隐层的权值矩阵V的分数阶梯度,分数阶梯度导数公式为:
式中,α表示分数阶数;c表示连接输入层和隐层的权值矩阵V中元素的最小值;Γ(·)表示Gamma函数;
步骤S325:利用更新函数对步骤S324中的权值矩阵进行更新,更新函数表达式为:
式中,学习率ηk为常数;
步骤S326:迭代次数加一,返回执行步骤S322。
4.如权利要求3所述的基于分数阶微积分与广义逆神经网络的手写数字识别方法,其特征是,所述步骤S325中,学习率ηk通过线搜索的方式获得。
CN201610834842.6A 2016-09-20 2016-09-20 基于分数阶微积分与广义逆神经网络的手写数字识别方法 Active CN106407932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610834842.6A CN106407932B (zh) 2016-09-20 2016-09-20 基于分数阶微积分与广义逆神经网络的手写数字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610834842.6A CN106407932B (zh) 2016-09-20 2016-09-20 基于分数阶微积分与广义逆神经网络的手写数字识别方法

Publications (2)

Publication Number Publication Date
CN106407932A true CN106407932A (zh) 2017-02-15
CN106407932B CN106407932B (zh) 2019-05-28

Family

ID=57996619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610834842.6A Active CN106407932B (zh) 2016-09-20 2016-09-20 基于分数阶微积分与广义逆神经网络的手写数字识别方法

Country Status (1)

Country Link
CN (1) CN106407932B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858488A (zh) * 2018-12-28 2019-06-07 众安信息技术服务有限公司 一种基于样本增强的手写样本识别方法与系统
CN111353534A (zh) * 2020-02-27 2020-06-30 电子科技大学 一种基于自适应分数阶梯度的图数据类别预测方法
CN111881990A (zh) * 2020-08-03 2020-11-03 江南大学 一种用于数字图像识别的构建型神经网络参数融合优化方法
CN114120336A (zh) * 2020-08-25 2022-03-01 合肥本源量子计算科技有限责任公司 手写数字识别方法、系统、设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140328541A1 (en) * 2010-08-30 2014-11-06 Alibaba Group Holding Limited Recognition of numerical characters in digital images
US20140355871A1 (en) * 2012-06-15 2014-12-04 Vufind, Inc. System and method for structuring a large scale object recognition engine to maximize recognition accuracy and emulate human visual cortex
CN104992165A (zh) * 2015-07-24 2015-10-21 天津大学 基于极限学习机的交通标志识别方法
CN104992184A (zh) * 2015-07-02 2015-10-21 东南大学 一种基于半监督极限学习机的多类图像分类方法
CN105550649A (zh) * 2015-12-09 2016-05-04 武汉工程大学 基于全耦合局部约束表示的极低分辨率人脸识别方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140328541A1 (en) * 2010-08-30 2014-11-06 Alibaba Group Holding Limited Recognition of numerical characters in digital images
US20140355871A1 (en) * 2012-06-15 2014-12-04 Vufind, Inc. System and method for structuring a large scale object recognition engine to maximize recognition accuracy and emulate human visual cortex
CN104992184A (zh) * 2015-07-02 2015-10-21 东南大学 一种基于半监督极限学习机的多类图像分类方法
CN104992165A (zh) * 2015-07-24 2015-10-21 天津大学 基于极限学习机的交通标志识别方法
CN105550649A (zh) * 2015-12-09 2016-05-04 武汉工程大学 基于全耦合局部约束表示的极低分辨率人脸识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐勇: "分数阶理论在BP神经网络中的应用", 《电脑编程技巧与维护》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858488A (zh) * 2018-12-28 2019-06-07 众安信息技术服务有限公司 一种基于样本增强的手写样本识别方法与系统
CN109858488B (zh) * 2018-12-28 2021-09-17 众安信息技术服务有限公司 一种基于样本增强的手写样本识别方法与系统
CN111353534A (zh) * 2020-02-27 2020-06-30 电子科技大学 一种基于自适应分数阶梯度的图数据类别预测方法
CN111881990A (zh) * 2020-08-03 2020-11-03 江南大学 一种用于数字图像识别的构建型神经网络参数融合优化方法
CN111881990B (zh) * 2020-08-03 2024-03-08 江南大学 一种用于数字图像识别的构建型神经网络参数融合优化方法
CN114120336A (zh) * 2020-08-25 2022-03-01 合肥本源量子计算科技有限责任公司 手写数字识别方法、系统、设备及计算机可读存储介质
CN114120336B (zh) * 2020-08-25 2023-08-08 本源量子计算科技(合肥)股份有限公司 手写数字识别方法、系统、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN106407932B (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN112836618B (zh) 一种三维人体姿态估计方法及计算机可读存储介质
CN111369681B (zh) 三维模型的重构方法、装置、设备及存储介质
CN111667399B (zh) 风格迁移模型的训练方法、视频风格迁移的方法以及装置
CN107358293B (zh) 一种神经网络训练方法及装置
US20190147298A1 (en) Meta-learning for multi-task learning for neural networks
US20230153615A1 (en) Neural network distillation method and apparatus
CN109271933A (zh) 基于视频流进行三维人体姿态估计的方法
CN107103285B (zh) 基于卷积神经网络的人脸深度预测方法
CN106203625A (zh) 一种基于多重预训练的深层神经网络训练方法
CN106407932A (zh) 基于分数阶微积分与广义逆神经网络的手写数字识别方法
CN112613356B (zh) 一种基于深度注意力融合网络的动作检测方法及装置
CN112561846A (zh) 训练图像融合模型的方法、装置和电子设备
WO2016095068A1 (en) Pedestrian detection apparatus and method
CN116310318A (zh) 交互式的图像分割方法、装置、计算机设备和存储介质
US20220207831A1 (en) Simulated control for 3- dimensional human poses in virtual reality environments
CN115238909A (zh) 一种基于联邦学习的数据价值评估方法及其相关设备
CN116740362B (zh) 一种基于注意力的轻量化非对称场景语义分割方法及系统
CN109359542A (zh) 基于神经网络的车辆损伤级别的确定方法及终端设备
US20230362416A1 (en) Video processing method and apparatus, device, and storage medium
CN117033609A (zh) 文本视觉问答方法、装置、计算机设备和存储介质
CN116992151A (zh) 一种基于双塔图卷积神经网络的在线课程推荐方法
CN110866866A (zh) 图像仿色处理方法、装置、电子设备及存储介质
CN112052865A (zh) 用于生成神经网络模型的方法和装置
CN113869503B (zh) 一种基于深度矩阵分解补全的数据处理方法及存储介质
CN115966004A (zh) 基于注意力指导轻量级网络的人脸关键点检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant