CN115409159A - 对象操作方法、装置、计算机设备以及计算机存储介质 - Google Patents
对象操作方法、装置、计算机设备以及计算机存储介质 Download PDFInfo
- Publication number
- CN115409159A CN115409159A CN202211153843.6A CN202211153843A CN115409159A CN 115409159 A CN115409159 A CN 115409159A CN 202211153843 A CN202211153843 A CN 202211153843A CN 115409159 A CN115409159 A CN 115409159A
- Authority
- CN
- China
- Prior art keywords
- parameter set
- sample parameter
- sample
- target
- loss value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 118
- 238000012545 processing Methods 0.000 claims abstract description 115
- 238000003062 neural network model Methods 0.000 claims abstract description 18
- 230000004044 response Effects 0.000 claims description 56
- 238000005457 optimization Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 description 35
- 230000006870 function Effects 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 238000011017 operating method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种对象操作方法、装置、计算机设备以及计算机存储介质,属于数据处理技术领域。所述方法包括:获取待操作对象;将待操作对象输入目标模型,目标模型为经过训练的神经网络模型,目标模型中的至少一个参数组是通过预设方式获取的;获取目标模型输出的操作结果。本申请通过将待操作对象输入目标模型,并由该目标模型来对待操作对象进行处理,以输出操作结果,由于该目标模型为经过训练的神经网络模型,进而在处理时可以无需依赖对象库,解决了相关技术中对象操作方法的处理成功率依赖于对象库的大小,导致该对象操作方法的灵活性较低的问题,实现了提高对象操作方法的灵活性的效果。
Description
技术领域
本申请涉及数据处理技术领域,特别涉及一种对象操作方法、装置、计算机设备以及计算机存储介质。
背景技术
对象操作方法是一种用于对某种对象进行各种操作的方法,此种方法可以对图像、声音、信号等各种对象进行处理操作以及识别操作等各种,以得到操作结果。
一种对象操作方法中,会比较待操作对象与对象库中的对象的相似度,该对象库中包括多个对象,以及每个对象对应的操作结果。若对象库中存在一个与待操作对象相似度大于指定值的对象,则将对象库中的该对象对应的操作结果确定为待操作对象的操作结果。示例性的,待操作对象为图片,对象库中图片对应的操作结果为该图片内容对应的分类结果。
但是,上述对象操作方法的处理成功率依赖于对象库的大小,导致该对象操作方法的灵活性较低。
发明内容
本申请实施例提供了一种对象操作方法、装置、计算机设备以及计算机存储介质。所述技术方案如下:
根据本申请实施例的一方面,提供一种对象操作方法,所述方法包括:
获取待操作对象;
将所述待操作对象输入目标模型,所述目标模型为经过训练的神经网络模型,且所述目标模型中的至少一个参数组是通过预设方式获取的;
获取所述目标模型输出的操作结果;
其中,所述预设方式包括:获取所述目标模型的第一参数组对应的样本参数集合,所述样本参数集合包括多个样本参数组,对所述样本参数集合进行多次迭代处理,基于所述多次迭代处理后的样本参数集合获取目标参数组,并将所述目标参数组确定为所述第一参数组,一次所述迭代处理包括:获取所述样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,由所述四个待定参数组中损失值最小的待定参数替换所述两个样本参数中的一个样本参数。
可选地,所述对所述样本参数集合进行多次迭代处理,基于所述多次迭代处理后的样本参数集合获取目标参数组,包括:
对所述样本参数集合进行迭代处理,得到迭代处理后的样本参数集合;
响应于未达到预设的迭代终止条件,对所述迭代处理后的样本参数集合进行下一次迭代处理;
响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组。
可选地,所述样本参数集合中的样本参数组的数量为m+1,m+1个所述样本参数组为wn、wn+1、wn+2···wn+m,n为大于或等于0的整数,m为大于2的整数;
所述获取所述样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,包括:
通过预设公式获取所述四个待定参数组,所述预设公式包括:
wx=wn+1+s*(wn+1-wn),s大于0;
wx+1=wn+1+2s*(wn+2-wn);
wx+2=wn+1+u*(wn-wn+1),u大于0小于1;
wx+3=wn+1+s*(wn+1-wn);
所述wn、wn+2、wn+3以及wn+4为所述四个待定参数组,x为大于0的整数,所述s以及所述u为预设系数。
可选地,所述由所述四个待定参数组中损失值最小的待定参数替换所述两个样本参数中的一个样本参数,包括:
响应于满足第一公式Ln>Lx,Lx≥Lx+1,去除所述样本参数集合中的wn,并将所述wx+1确定为所述样本参数集合中的wn+m+1;
响应于满足第二公式Ln>Lx,Lx<Lx+1,去除所述样本参数集合中的wn,并将所述wx确定为所述样本参数集合中的wn+m+1;
响应于满足第三公式Ln≤Lx,Lx>Lx+2,去除所述样本参数集合中的wn,并将所述wx+2确定为所述样本参数集合中的wn+m+1;
响应于所述第一公式、所述第二公式所述第三公式均不满足,去除所述样本参数集合中的wn,并将所述wx+3确定为所述样本参数集合中的wn+m+1;
所述Ln为所述wn的损失值,所述Lx为所述wx的损失值,所述Lx+1为所述wx+1的损失值,所述Lx+2为所述wx+2的损失值。
可选地,所述响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组,包括:
响应于达到所述预设的迭代终止条件,确定所述迭代处理后的样本参数集合中损失值最小的第一样本参数组;
获取所述迭代处理后的样本参数集合中的多个样本参数组的均值样本参数组;
响应于所述第一样本参数组的损失值小于所述均值样本参数组的损失值,确定所述第一样本参数组为所述目标样本参数组;
响应于所述第一样本参数组的损失值大于所述均值样本参数组的损失值,确定所述均值样本参数组为所述目标样本参数组。
可选地,所述得到迭代处理后的样本参数集合之后,所述方法还包括:
响应于迭代处理的次数达到指定值,确定达到预设的迭代终止条件;
响应于迭代处理的次数未达到指定值,确定未达到预设的迭代终止条件。
可选地,所述得到迭代处理后的样本参数集合之后,所述方法还包括:
获取所述迭代处理后的样本参数集合对应的待定样本参数组,所述待定样本参数组为所述样本参数集合中的多个样本参数组的均值样本参数组,或者,所述待定样本参数组为所述样本参数集合中损失值最小的样本参数组;
响应于所述待定样本参数组的损失值小于或者等于指定损失值,确定达到所述预设的迭代终止条件;
响应于所述待定样本参数组的损失值大于所述指定损失值,确定未达到所述预设的迭代终止条件。
可选地,所述响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组,包括:
响应于达到所述预设的迭代终止条件,获取所述迭代处理后的样本参数集合中的多个样本参数组的均值样本参数组;
将所述均值样本参数组确定为所述目标样本参数组。
可选地,所述响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组,包括:
响应于达到所述预设的迭代终止条件,获取所述迭代处理后的样本参数集合中损失值最小的第一样本参数组;
将所述第一样本参数组确定为所述目标样本参数组。
可选地,所述通过预设公式获取所述四个待定参数组之前,所述方法还包括:
依次获取所述第一参数组对应的所述wn、所述wn+1、所述wn+2以及所述wn+3。
可选地,所述待操作对象包括图像数据、声音数据以及信号数据。
根据本申请实施例的另一方面,提供一种对象操作装置,所述对象操作装置包括:
对象获取模块,用于获取待操作对象;
输入模块,用于将所述待操作对象输入目标模型,所述目标模型为经过训练的神经网络模型,且所述目标模型中的至少一个参数组是通过预设方式获取的;
结果获取模块,用于所述目标模型输出的操作结果;
其中,所述预设方式包括:获取所述目标模型的第一参数组对应的样本参数集合,所述样本参数集合包括多个样本参数组,对所述样本参数集合进行多次迭代处理,基于所述多次迭代处理后的样本参数集合获取目标参数组,并将所述目标参数组确定为所述第一参数组,一次所述迭代处理包括:获取所述样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,由所述四个待定参数组中损失值最小的待定参数替换所述两个样本参数中的一个样本参数。
可选地,所述对象操作装置,还包括:
第一迭代模块,用于对所述样本参数集合进行迭代处理,得到迭代处理后的样本参数集合;
第二迭代模块,用于响应于未达到预设的迭代终止条件,对所述迭代处理后的样本参数集合进行下一次迭代处理;
目标获取模块,用于响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组。
根据本申请实施例的另一方面,提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述的对象操作方法。
根据本申请实施例的另一方面,提供一种非瞬态计算机存储介质,所述计算机存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述的对象操作方法。
提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过将待操作对象输入目标模型,并由该目标模型来对待操作对象进行处理,以输出操作结果,由于该目标模型为经过训练的神经网络模型,进而在处理时可以无需依赖对象库,解决了相关技术中对象操作方法的处理成功率依赖于对象库的大小,导致该对象操作方法的灵活性较低的问题,实现了提高对象操作方法的灵活性的效果。
另外,由于上述目标模型中的中的至少一个参数组是通过预设方式获取的,且该预设方式是通过前向传播的方式来进行参数组的优化,进而该预设方式降低了参数优化的计算量,提高了参数优化的速度,进而使得可以更为快速的获取上述目标模型以进行待处理对象的处理。也即是可以在整体上提升对于待操作对象的处理速度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种对象操作系统的示意图;
图2是本申请实施例示出的一种对象操作方法的流程图;
图3是本申请实施例提供的另一种对象操作方法的流程图;
图4是本申请实施例中一种迭代处理的方法流程图;
图5示出了本申请实施例中一种基于迭代处理后的样本参数集合获取目标参数组的流程图;
图6是本申请实施例中一种参数优化的迭代过程的二维等值线图;
图7是本申请实施例提供的一种对象操作装置的结构框图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供的对象操作方法,可以应用于对象操作系统中,如图1所示,图1是本申请实施例提供的一种对象操作系统的示意图,该对象操作系统可以包括服务器以及终端中的至少一种(图1以该对象操作系统包括服务器以及终端为例,但并不对此进行限制),该对象操作系统可以用于对待操作对象进行处理。当该对象操作系统包括服务器11以及终端12时,该服务器11和终端12之间可以建立有有线连接,和/或,无线连接。
其中,服务器11可以包括一个服务器,或者可以包括服务器集群,终端12可以包括台式计算机、笔记本型计算机、智能手机以及其他智能可穿戴设备等。
本申请实施例提供的对象操作方法可以包括模型优化过程以及对象操作过程,这两个过程可以均在服务器11中实施,或者,这两个过程可以均在终端12中实施,或者,也可以其中一个过程在服务器11中实施,另一个过程在终端12中实施。示例性的,这两个过程中的模型优化过程可以在服务器11中实施,对象操作过程可以在终端12中实施,本申请实施例对此不进行限制。
本申请实施例中所涉及的目标模型可以是一个经过训练的神经网络模型。神经网络(Neural Networks,NN)模型是由大量的的处理单元(称为神经元)广泛地互相连接而形成的复杂网络模型,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络模型具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,适合处理需要同时考虑许多因素和条件、不精确和模糊的信息处理问题。
神经网络模型在应用前会进行训练,以提升神经网络模型在应用时的准确程度。而在训练神经网络模型的过程中,会对神经网络模型中的参数组进行优化,目前常见的优化方式是采用反向传播算法对参数的梯度进行计算,该方法通过正向传播得到模型预测值,再通过误差的反向传播算法得到参数的梯度,而后将参数向梯度指示的下降方向及比例进行更新,逐步迭代,并得到优化后的参数。
但由于上述反向传播算法需要进行梯度的计算,而梯度的计算需要消耗大量的计算资源,这对于模型的训练速度会有严重影响,且对训练模型的设备的运算能力的要求较高,这都制约了神经网络模型在对象操作方法上的应用。
而本申请实施例提供的对象操作方法中,通过获取样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,由四个待定参数组中损失值最小的待定参数组替换两个样本参数组中的一个样本参数组,如此便实现了对于参数组的迭代,此种前向传播的方式可以无需计算梯度,进而便减少了参数优化过程中的计算量。如此一方面能够提升模型的训练速度,另一方面可以降低对训练模型的设备的运算能力的要求较高,以便于神经网络模型可以应用于对象操作方法中。
图2是本申请实施例示出的一种对象操作方法的流程图。该对象操作方法可以包括如下几个步骤:
步骤201、获取待操作对象。
步骤202、将待操作对象输入目标模型,目标模型为经过训练的神经网络模型,且目标模型中的至少一个参数组是通过预设方式获取的,目标模型用于对待操作对象进行识别操作或者处理操作。
步骤203、获取目标模型输出的操作结果。
其中,预设方式包括:获取目标模型的第一参数组对应的样本参数集合,样本参数集合包括多个样本参数组,对样本参数集合进行多次迭代处理,基于多次迭代处理后的样本参数集合获取目标参数组,并将目标参数组确定为第一参数组,一次迭代处理包括:获取样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,由四个待定参数组中损失值最小的待定参数替换两个样本参数中的一个样本参数。
综上所述,本申请实施例提供的对象操作方法,通过将待操作对象输入目标模型,并由该目标模型来对待操作对象进行处理,以输出操作结果,由于该目标模型为经过训练的神经网络模型,进而在处理时可以无需依赖对象库,解决了相关技术中对象操作方法的处理成功率依赖于对象库的大小,导致该对象操作方法的灵活性较低的问题,实现了提高对象操作方法的灵活性的效果。
另外,由于上述目标模型中的中的至少一个参数组是通过预设方式获取的,且该预设方式是通过前向传播的方式来进行参数组的优化,进而该预设方式降低了参数优化的计算量,提高了参数优化的速度,进而使得可以更为快速的获取上述目标模型以进行待处理对象的处理。也即是可以在整体上提升对于待操作对象的处理速度。
需要说明的是,本申请实施例的对象操作方法中,目标模型用于对待操作对象进行识别操作或者处理操作。其中,识别操作可以是指对待操作对象进行识别以获取识别结果的操作,而处理操作可以是指对待操作对象的部分或者全部数据进行处理,以得到处理对象的操作(待操作对象对于对象操作方法的执行主体来说可以是各种类型的数据,对待操作对象的处理操作可以包括对于数据的处理操作)。具体的,其中的待操作对象可以是图像、声音以及信号等各种数据,针对不同种类的待操作对象,目标模型所进行的识别操作以及处理操作的操作结果也会不同,示例性的,待操作对象为图像数据时,目标模型对图像数据进行的处理操作可以包括对图像数据的修复处理、美化处理,调整处理等,而对图像数据进行的识别操作可以包括识别图像数据中的物体、人物以及文字等;待操作对象为声音数据时,目标模型对声音数据进行的处理操作可以包括对声音数据进行的调整处理以及编辑处理等,而对声音数据进行的识别操作可以包括识别声音数据中的声纹信息、语言信息(如将声音转换为文字)等;待操作对象为信号数据时,对信号数据进行的处理操作以及识别操作即可以包括对信号数据进行的处理以及识别。
图3是本申请实施例提供的另一种对象操作方法的流程图。本申请实施例以该方法应用于服务器中为例进行说明。该对象操作方法可以包括如下几个步骤:
步骤301、依次获取目标模型的第一参数组对应的样本参数集合中的多个样本参数组。
在应用本申请实施例提供的对象操作方法,可以包括对目标模型中的参数值进行优化的过程,以及通过该目标模型进行对象操作的过程。其中,目标模型可以包括至少一个参数组,本申请实施例以对其中的第一参数值进行优化为例进行说明。
在第一参数值进行优化的过程中,服务器可以获取依次获取第一参数组对应的样本参数集合中的多个样本参数组,基于获取的顺序,这多个样本参数组对应的也会具有顺序,该顺序可以在后续迭代处理时起到相应的作用。
示例性的,样本参数集合中的样本参数组的数量为4,4个样本参数组为wn、wn+1、wn+2以及wn+3,n为大于0的整数。在本申请实施例中,可以通过随机初始化的方式来获取初始的样本参数集合,例如可以通过高斯分布数据对参数组进行初始化,以获得初始的样本参数集合。
步骤302、对样本参数集合进行迭代处理,得到迭代处理后的样本参数集合。
该迭代处理是一种对样本参数组进行优化的处理,该迭代处理可以用于使样本参数集合中的多个样本参数组整体的损失值更小。
示例性的,如图4所示,图4是本申请实施例中一种迭代处理的方法流程图,其中,一次迭代处理可以包括下面几个步骤:
子步骤3021、获取样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组。
服务器可以在每次进行迭代处理时,选取样本参数集合中两个样本参数组,并获取这两个样本参数组在多个优化方向上的四个待定参数组。这是一种正向传播的优化方式。服务器在选取时,可以依据样本参数集合中样本参数组的顺序,选取头两个样本参数组,也即是按照顺序的第一个以及第二个样本参数组。
在一种示例性的实施例中,样本参数集合中的样本参数组的数量为m+1,m+1个样本参数组为wn、wn+1、wn+2···wn+m,n为大于或等于0的整数,m为大于2的整数。
服务器可以通过预设公式获取四个待定参数组,这四个待定参数组即为wn以及wn+1这两个参数在多个优化方向上的四个待定参数组。
预设公式包括:
wx=wn+1+s*(wn+1-wn),s大于0;
wx+1=wn+1+2s*(wn+2-wn);
wx+2=wn+1+u*(wn-wn+1),u大于0小于1;
wx+3=wn+1+s*(wn+1-wn);
wn、wn+2、wn+3以及wn+4为四个待定参数组,x为大于0的整数,s以及u为预设系数。
子步骤3022、由四个待定参数组中损失值最小的待定参数替换两个样本参数中的一个样本参数。
在实施子步骤3022时,一种方式可以包括:
响应于满足第一公式Ln>Lx,Lx≥Lx+1,去除样本参数集合中的wn,并将wx+1确定为样本参数集合中的wn+m+1;
响应于满足第二公式Ln>Lx,Lx<Lx+1,去除样本参数集合中的wn,并将wx确定为样本参数集合中的wn+m+1;
响应于满足第三公式Ln≤Lx,Lx>Lx+2,去除样本参数集合中的wn,并将wx+2确定为样本参数集合中的wn+m+1;
响应于第一公式、第二公式第三公式均不满足,去除样本参数集合中的wn,并将wx+3确定为样本参数集合中的wn+m+1;
其中,Ln为wn的损失值,Lx为wx的损失值,Lx+1为wx+1的损失值,Lx+2为wx+2的损失值。
需要说明的是,由于以上四组条件的适用情况互斥,因此大多数情况并不需要进行4次判断以及相应的计算。多数情况仅需要进行前两次判断以及相应的技术即可。
其中,损失值Lx+i=loss(ytruth,f(s;wx+i))i=0,1,2,3,s为目标模型的输入,ytruth为输入s对应的真实值,f(s;wx+i)为目标模型对应的函数。
步骤303、判断是否达到预设的迭代终止条件。达到预设的迭代终止条件时,执行步骤304。未达到预设的迭代终止条件时,执行步骤302。
服务器可以在每次迭代处理完成后,判断是否达到预设的迭代终止条件。
在本申请实施例中,迭代终止条件可以包括多种,服务器可以在其中的一种迭代终止条件达到时,终止迭代处理。
第一种迭代终止条件的判断方式包括:
1)响应于迭代处理的次数达到指定值,确定达到预设的迭代终止条件;
2)响应于迭代处理的次数未达到指定值,确定未达到预设的迭代终止条件。
此种情况下,迭代终止条件为迭代处理的次数达到指定值,该指定值可以预先进行设置。
第二种迭代终止条件的判断方式包括:
1)获取迭代处理后的样本参数集合对应的待定样本参数组。
该待定样本参数组为样本参数集合中的多个样本参数组的均值样本参数组,或者,待定样本参数组为样本参数集合中损失值最小的样本参数组。
其中,均值样本参数组可以是当前迭代处理后的样本参数集合中的多个样本参数组的均值,该均值可以为算术平均值或者其他类型的平均值,本申请实施例对此不进行限制。
样本参数集合中损失值最小的样本参数组wi的损失值:
l=mi n Loss[ytruth,f(s;wi)];
服务器可以将均值样本参数组以及损失值最小的样本参数组中的任意一个确定为待定样本参数组,或者,可以将均值样本参数组以及损失值最小的样本参数组中损失值较小的一个确定为待定样本参数组,本申请实施例对此不进行限制。
2)响应于待定样本参数组的损失值小于或者等于指定损失值,确定达到预设的迭代终止条件;
当待定样本参数组的损失值小于或者等于指定损失值时,表面待定样本参数组满足条件,服务器可以确定达到了预设的迭代终止条件。
3)响应于待定样本参数组的损失值大于指定损失值,确定未达到预设的迭代终止条件。
当待定样本参数组的损失值大于指定损失值时,表面待定样本参数组不满足条件,服务器可以确定未达到预设的迭代终止条件。
未达到预设的迭代终止条件时,服务器可以重新执行步骤302以进行下一次的迭代处理。
步骤304、基于迭代处理后的样本参数集合获取目标参数组。
在达到预设的迭代终止条件时,服务器可以基于迭代处理后的样本参数集合获取目标参数组。
本申请实施例中,服务器可以通过多种方式来基于迭代处理后的样本参数集合获取目标参数组,示例性的,如图5所示,图5示出了本申请实施例中一种基于迭代处理后的样本参数集合获取目标参数组的流程图,其中,一种基于迭代处理后的样本参数集合获取目标参数组的过程可以包括下面几个步骤:
子步骤3041、确定迭代处理后的样本参数集合中损失值最小的第一样本参数组。
损失值最小的第一样本参数组的获取方式可以参考上述子步骤303,本申请实施例在此不再赘述。
子步骤3042、获取迭代处理后的样本参数集合中的多个样本参数组的均值样本参数组。
损失值最小的第一样本参数组的获取方式可以参考上述子步骤303,本申请实施例在此不再赘述。
子步骤3043、响应于第一样本参数组的损失值小于均值样本参数组的损失值,确定第一样本参数组为目标样本参数组。
子步骤3044、响应于第一样本参数组的损失值大于均值样本参数组的损失值,确定均值样本参数组为目标样本参数组。
也即是服务器可以将第一样本参数组以及均值样本参数组中损失值较小的一个参数组确定为目标样本参数组。
另一种基于迭代处理后的样本参数集合获取目标参数组的过程可以包括:
1)获取迭代处理后的样本参数集合中损失值最小的第一样本参数组;
损失值最小的第一样本参数组的获取方式可以参考上述子步骤303,本申请实施例在此不再赘述。
2)将第一样本参数组确定为目标样本参数组;
此种方式中,服务器可以将第一样本参数组确定为目标样本参数组。
步骤305、将目标参数组确定为目标模型的第一参数组。
目标样本参数组为优化后的样本参数组,服务器可以将目标参数组确定为目标模型的第一参数组,以实现对目标模型中参数的优化。
至步骤305结束,即完成了对目标模型的优化过程,服务器可以通过步骤301至305所示的方法来对目标模型中的参数组进行优化。
步骤306、获取待操作对象。
该待操作对象可以为图像数据、声音数据以及信号数据等各种数据。
需要说明的是,待操作对象的类型可以是和目标模型对应的类型,若目标模型所能够处理的对象已经确定,则在本步骤中服务器也可以获取对应类型的待操作对象。
示例性的,目标模型为用于对图像进行识别的模型,则步骤306获取的待操作对象可以为图像数据;目标模型为用于对声音进行处理的模型,则步骤306获取的待操作对象可以为声音数据。
步骤307、将待操作对象输入目标模型。
服务器获取了待操作对象后,即可以将待操作对象输入目标模型。
步骤308、获取目标模型输出的操作结果。
服务器可以获取目标模型输出的操作结果。
本申请实施例提供的对象操作方法,可以应用于各种模型中,例如LeNet网络模型、AlexNet网络模型等。
LeNet网络模型最初由图灵奖得主LeCun在20世纪末提出。LeNet网络模型的输入是手写数字的二值图,该二值图的大小为32像素*32像素,LeNet网络模型可以由两层卷积层、两层池化层和三层全连接层组成,在最后一层全连接层之后,增加了sigmoid函数运算,使网络具有非线性拟合能力。在一种具体的实施例中,LeNet网络模型的输出是10维向量。该LeNet网络模型执行的是图像分类任务,10维向量的每一维向量对应数字的0~9中的一个,当向量中对应位置的取值为1,则代表该图像的分类与相应的手写数字对应。
LeNet网络模型中的卷积层和全连接层具备可以进行优化的参数组。在相关技术的模型训练过程中,普遍采用反向传播算法进行参数的优化,反向传播算法在梯度计算步骤需要利用链式法则(链式法则是微积分中的求导法则,用于求一个复合函数的导数,是在微积分的求导运算中一种常用的方法)进行梯度的求解,耗时较长,计算量较大。
而本申请实施例提供的对象操作方法,通过正向传播的方法来进行参数的优化,可以应用于LeNet网络模型中,以对LeNet网络模型中的参数组进行优化,且由于本申请实施例提供的方法在对参数组进行优化时,计算量小,耗时较短,进而可以提升对于LeNet网络模型的优化速度,便于快速优化LeNet网络模型以进行图像的识别。
AlexNet网络模型所执行的任务可以包括图像分类任务。以彩色三通道RGB图像作为输入,输出为多维向量,向量的每一维度均代表了图像的具体类别,因此向量的维度与图像的分类数有关。
AlexNet网络模型中,具有5层卷积层,以及3层池化层和3层全连接层。这些卷积层和全连接层也具备可以进行优化的参数组。进而该AlexNet网络模型也可以通过本申请实施例提供的方法来进行参数组的优化。
综上所述,本申请实施例提供的对象操作方法,通过将待操作对象输入目标模型,并由该目标模型来对待操作对象进行处理,以输出操作结果,由于该目标模型为经过训练的神经网络模型,进而在处理时可以无需依赖对象库,解决了相关技术中对象操作方法的处理成功率依赖于对象库的大小,导致该对象操作方法的灵活性较低的问题,实现了提高对象操作方法的灵活性的效果。
另外,由于上述目标模型中的中的至少一个参数组是通过预设方式获取的,且该预设方式是通过前向传播的方式来进行参数组的优化,进而该预设方式降低了参数优化的计算量,提高了参数优化的速度,进而使得可以更为快速的获取上述目标模型以进行待处理对象的处理。也即是可以在整体上提升对于待操作对象的处理速度。
下面对本申请实施例提供的参数组的优化方法进行进一步的说明。
在一种示例性的实施例中,以目标模型中待优化的参数组为二维参数为例,该参数组表示为[a,b]^T,预设样本参数集合中样本参数组的组数为4,λ=1,ρ=0.5。
请参考图6,图6是本申请实施例中一种参数优化的迭代过程的二维等值线图。图6中的两圈曲线为损失函数值的等值线,描述了不同参数映射所在位置的损失值。图中点A、B、C、D为初始获取的4个样本参数组,这4个样本参数组构成了初始的样本参数集合。
第一次迭代处理的过程可以包括:
取点A、B所表示的参数,运用参数wA,wB,计算得到wA,wB对应的4个待定样本参数组:w01=wE,根据图中各点位置对应损失值(越靠近中心,损失值越小)的大小可知,成立(lv表示损失值,v为E、A、E1),将参数wA从备选优化参数组中移除,将参数wE加入样本参数集合。
第一次迭代处理结束时,样本参数集合中存在点B、C、D、E对应的参数组。
第二次迭代过程取点B、C,经过计算后可以取参数组wF(此处省略了计算过程,并假设wF为确定出满足步骤302中所涉及的条件的参数)加入样本参数集合。
经过多次迭代,由图6可知,参数组所对应的损失函数值逐渐接近极小值点。
当参数更新达到迭代终止条件,假设样本参数集合中存在点H、I、J、K
可以假设wk(也即是K点对应的参数组)对应的损失值最小,且wk的损失值为l。
其平均参数设为wz:
本申请实施例提供的对象操作方法中,对于参数组的优化的方法是一种局部极小值点的求解优化方法(也可以称为权值游走算法),该方法可以同梯度下降法满足相同的前提条件,即在函数优化的取值范围内可导的凸函数。
假定最优参数为w*,则有f′(w*)=0,f(w*)≤f(w),f(w)为损失函数。梯度下降法需要计算损失函数f(w)的一阶导数f′(w),函数f‘(w0)的值即为原函数梯度,梯度的负方向即为函数值减小的最速方向,借助一阶导数,梯度下降法使得函数值不断减小,当f′(w)→0,则判定函数接近极小值点。
根据梯度定义:
梯度下降法通过梯度值控制参数调整的幅度,通过梯度值的正负控制参数调整的方向。依据梯度定义,f′(w)的正负值取决于f(w+Δw)-f(w)的正负。梯度下降方向即为令f(w+Δw)-f(w)<0的方向。
而本申请提出方法会计算函数f(x)的值,由前述内容可知,待优化函数为凸函数,因此有且仅有一组参数w*,使得min f(w)=f(w*)成立,而distance(w,w*)∝f(w)-f(w*)。权重游走优化算法通过多组参数的初始化,不断更新参数的函数值,使得函数值f(w)不断减小,即f(w)-f(w*)不断减小,进而使得distance(w,w*)不断减小,趋近于局部极小值,如此便实现了对于目标函数中参数组的优化。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图7是本申请实施例提供的一种对象操作装置的结构框图,该对象操作装置700包括:
对象获取模块710,用于获取待操作对象;
输入模块720,用于将待操作对象输入目标模型,目标模型为经过训练的神经网络模型,且目标模型中的至少一个参数组是通过预设方式获取的;
结果获取模块730,用于目标模型输出的操作结果;
其中,预设方式包括:获取目标模型的第一参数组对应的样本参数集合,样本参数集合包括多个样本参数组,对样本参数集合进行多次迭代处理,基于多次迭代处理后的样本参数集合获取目标参数组,并将目标参数组确定为第一参数组,一次迭代处理包括:获取样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,由四个待定参数组中损失值最小的待定参数替换两个样本参数中的一个样本参数。
综上所述,本申请实施例提供的对象操作装置,通过将待操作对象输入目标模型,并由该目标模型来对待操作对象进行处理,以输出操作结果,由于该目标模型为经过训练的神经网络模型,进而在处理时可以无需依赖对象库,解决了相关技术中对象操作方法的处理成功率依赖于对象库的大小,导致该对象操作方法的灵活性较低的问题,实现了提高对象操作方法的灵活性的效果。
另外,由于上述目标模型中的中的至少一个参数组是通过预设方式获取的,且该预设方式是通过前向传播的方式来进行参数组的优化,进而该预设方式降低了参数优化的计算量,提高了参数优化的速度,进而使得可以更为快速的获取上述目标模型以进行待处理对象的处理。也即是可以在整体上提升对于待操作对象的处理速度。
可选地,对象操作装置,还包括:
第一迭代模块,用于对样本参数集合进行迭代处理,得到迭代处理后的样本参数集合;
第二迭代模块,用于响应于未达到预设的迭代终止条件,对迭代处理后的样本参数集合进行下一次迭代处理;
目标获取模块,用于响应于达到预设的迭代终止条件,基于迭代处理后的样本参数集合获取目标参数组。
可选地,样本参数集合中的样本参数组的数量为m+1,m+1个样本参数组为wn、wn+1、wn+2···wn+m,n为大于或等于0的整数,m为大于2的整数;
该对象操作装置还包括:待定参数获取模块,用于:
通过预设公式获取四个待定参数组,预设公式包括:
wx=wn+1+s*(wn+1-wn),s大于0;
wx+1=wn+1+2s*(wn+2-wn);
wx+2=wn+1+u*(wn-wn+1),u大于0小于1;
wx+3=wn+1+s*(wn+1-wn);
wn、wn+2、wn+3以及wn+4为四个待定参数组,x为大于0的整数,s以及u为预设系数。
可选地,该对象操作装置还包括:参数替换模块,用于:
响应于满足第一公式Ln>Lx,Lx≥Lx+1,去除样本参数集合中的wn,并将wx+1确定为样本参数集合中的wn+m+1;
响应于满足第二公式Ln>Lx,Lx<Lx+1,去除样本参数集合中的wn,并将wx确定为样本参数集合中的wn+m+1;
响应于满足第三公式Ln≤Lx,Lx>Lx+2,去除样本参数集合中的wn,并将wx+2确定为样本参数集合中的wn+m+1;
响应于第一公式、第二公式第三公式均不满足,去除样本参数集合中的wn,并将wx+3确定为样本参数集合中的wn+m+1;
Ln为wn的损失值,Lx为wx的损失值,Lx+1为wx+1的损失值,Lx+2为wx+2的损失值。
可选地,该对象操作装置还包括:第一目标参数组获取模块,用于:
响应于达到预设的迭代终止条件,确定迭代处理后的样本参数集合中损失值最小的第一样本参数组;
获取迭代处理后的样本参数集合中的多个样本参数组的均值样本参数组;
响应于第一样本参数组的损失值小于均值样本参数组的损失值,确定第一样本参数组为目标样本参数组;
响应于第一样本参数组的损失值大于均值样本参数组的损失值,确定均值样本参数组为目标样本参数组。
可选地,该对象操作装置还包括:第一迭代终止确定模块,用于:
响应于迭代处理的次数达到指定值,确定达到预设的迭代终止条件;
响应于迭代处理的次数未达到指定值,确定未达到预设的迭代终止条件。
可选地,该对象操作装置还包括:第二迭代终止确定模块,用于:
获取迭代处理后的样本参数集合对应的待定样本参数组,待定样本参数组为样本参数集合中的多个样本参数组的均值样本参数组,或者,待定样本参数组为样本参数集合中损失值最小的样本参数组;
响应于待定样本参数组的损失值小于或者等于指定损失值,确定达到预设的迭代终止条件;
响应于待定样本参数组的损失值大于指定损失值,确定未达到预设的迭代终止条件。
可选地,该对象操作装置还包括:第二目标参数组获取模块,用于:
响应于达到预设的迭代终止条件,获取迭代处理后的样本参数集合中的多个样本参数组的均值样本参数组;
将均值样本参数组确定为目标样本参数组。
可选地,该对象操作装置还包括:第三目标参数组获取模块,用于:
获取迭代处理后的样本参数集合中损失值最小的第一样本参数组;
将第一样本参数组确定为目标样本参数组。
可选地,该对象操作装置还包括:依次获取模块,用于:
依次获取第一参数组对应的wn、wn+1、wn+2以及wn+3。
可选地,待操作对象包括图像数据、声音数据以及信号数据。
根据本申请实施例的另一方面,提供一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上述的对象操作方法。
根据本申请实施例的另一方面,提供一种非瞬态计算机存储介质,计算机存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上述的对象操作方法。
提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法。
本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本申请中术语“A和B的至少一种”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B的至少一种,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。同理,“A、B和C的至少一种”表示可以存在七种关系,可以表示:单独存在A,单独存在B,单独存在C,同时存在A和B,同时存在A和C,同时存在C和B,同时存在A、B和C这七种情况。同理,“A、B、C和D的至少一种”表示可以存在十五种关系,可以表示:单独存在A,单独存在B,单独存在C,单独存在D,同时存在A和B,同时存在A和C,同时存在A和D,同时存在C和B,同时存在D和B,同时存在C和D,同时存在A、B和C,同时存在A、B和D,同时存在A、C和D,同时存在B、C和D,同时存在A、B、C和D,这十五种情况。
在本申请中,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种对象操作方法,其特征在于,所述方法包括:
获取待操作对象;
将所述待操作对象输入目标模型,所述目标模型为经过训练的神经网络模型,且所述目标模型中的至少一个参数组是通过预设方式获取的,所述目标模型用于对所述待操作对象进行识别操作或者处理操作;
获取所述目标模型输出的操作结果;
其中,所述预设方式包括:获取所述目标模型的第一参数组对应的样本参数集合,所述样本参数集合包括多个样本参数组,对所述样本参数集合进行多次迭代处理,基于所述多次迭代处理后的样本参数集合获取目标参数组,并将所述目标参数组确定为所述第一参数组,一次所述迭代处理包括:获取所述样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,由所述四个待定参数组中损失值最小的待定参数替换所述两个样本参数中的一个样本参数。
2.根据权利要求1所述的方法,其特征在于,所述获取待操作对象之前,所述对所述样本参数集合进行多次迭代处理,基于所述多次迭代处理后的样本参数集合获取目标参数组,包括:
对所述样本参数集合进行迭代处理,得到迭代处理后的样本参数集合;
响应于未达到预设的迭代终止条件,对所述迭代处理后的样本参数集合进行下一次迭代处理;
响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组。
3.根据权利要求1或2所述的方法,其特征在于,所述样本参数集合中的样本参数组的数量为m+1,m+1个所述样本参数组为wn、wn+1、wn+2···wn+m,n为大于或等于0的整数,m为大于2的整数;
所述获取所述样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,包括:
通过预设公式获取所述四个待定参数组,所述预设公式包括:
wx=wn+1+s*(wn+1-wn),s大于0;
wx+1=wn+1+2s*(wn+2-wn);
wx+2=wn+1+u*(wn-wn+1),u大于0小于1;
wx+3=wn+1+s*(wn+1-wn);
所述wn、wn+2、wn+3以及wn+4为所述四个待定参数组,x为大于0的整数,所述s以及所述u为预设系数。
4.根据权利要求3所述的方法,其特征在于,所述由所述四个待定参数组中损失值最小的待定参数替换所述两个样本参数中的一个样本参数,包括:
响应于满足第一公式Ln>Lx,Lx≥Lx+1,去除所述样本参数集合中的wn,并将所述wx+1确定为所述样本参数集合中的wn+m+1;
响应于满足第二公式Ln>Lx,Lx<Lx+1,去除所述样本参数集合中的wn,并将所述wx确定为所述样本参数集合中的wn+m+1;
响应于满足第三公式Ln≤Lx,Lx>Lx+2,去除所述样本参数集合中的wn,并将所述wx+2确定为所述样本参数集合中的wn+m+1;
响应于所述第一公式、所述第二公式所述第三公式均不满足,去除所述样本参数集合中的wn,并将所述wx+3确定为所述样本参数集合中的wn+m+1;
所述Ln为所述wn的损失值,所述Lx为所述wx的损失值,所述Lx+1为所述wx+1的损失值,所述Lx+2为所述wx+2的损失值。
5.根据权利要求2所述的方法,其特征在于,所述响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组,包括:
响应于达到所述预设的迭代终止条件,确定所述迭代处理后的样本参数集合中损失值最小的第一样本参数组;
获取所述迭代处理后的样本参数集合中的多个样本参数组的均值样本参数组;
响应于所述第一样本参数组的损失值小于所述均值样本参数组的损失值,确定所述第一样本参数组为所述目标样本参数组;
响应于所述第一样本参数组的损失值大于所述均值样本参数组的损失值,确定所述均值样本参数组为所述目标样本参数组。
6.根据权利要求2所述的方法,其特征在于,所述得到迭代处理后的样本参数集合之后,所述方法还包括:
响应于迭代处理的次数达到指定值,确定达到预设的迭代终止条件;
响应于迭代处理的次数未达到指定值,确定未达到预设的迭代终止条件。
7.根据权利要求2所述的方法,其特征在于,所述得到迭代处理后的样本参数集合之后,所述方法还包括:
获取所述迭代处理后的样本参数集合对应的待定样本参数组,所述待定样本参数组为所述样本参数集合中的多个样本参数组的均值样本参数组,或者,所述待定样本参数组为所述样本参数集合中损失值最小的样本参数组;
响应于所述待定样本参数组的损失值小于或者等于指定损失值,确定达到所述预设的迭代终止条件;
响应于所述待定样本参数组的损失值大于所述指定损失值,确定未达到所述预设的迭代终止条件。
8.根据权利要求2所述的方法,其特征在于,所述响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组,包括:
响应于达到所述预设的迭代终止条件,获取所述迭代处理后的样本参数集合中的多个样本参数组的均值样本参数组;
将所述均值样本参数组确定为所述目标样本参数组。
9.根据权利要求2所述的方法,其特征在于,所述响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组,包括:
响应于达到所述预设的迭代终止条件,获取所述迭代处理后的样本参数集合中损失值最小的第一样本参数组;
将所述第一样本参数组确定为所述目标样本参数组。
10.根据权利要求3所述的方法,其特征在于,所述通过预设公式获取所述四个待定参数组之前,所述方法还包括:
依次获取所述第一参数组对应的所述wn、所述wn+1、所述wn+2以及所述wn+3。
11.根据权利要求3~8任一所述的方法,其特征在于,所述待操作对象包括图像数据、声音数据以及信号数据。
12.一种对象操作装置,其特征在于,所述对象操作装置包括:
对象获取模块,用于获取待操作对象;
输入模块,用于将所述待操作对象输入目标模型,所述目标模型为经过训练的神经网络模型,且所述目标模型中的至少一个参数组是通过预设方式获取的,所述目标模型用于对所述待操作对象进行识别操作或者处理操作;
结果获取模块,用于所述目标模型输出的操作结果;
其中,所述预设方式包括:获取所述目标模型的第一参数组对应的样本参数集合,所述样本参数集合包括多个样本参数组,对所述样本参数集合进行多次迭代处理,基于所述多次迭代处理后的样本参数集合获取目标参数组,并将所述目标参数组确定为所述第一参数组,一次所述迭代处理包括:获取所述样本参数集合中两个样本参数组在多个优化方向上的四个待定参数组,由所述四个待定参数组中损失值最小的待定参数替换所述两个样本参数中的一个样本参数。
13.根据权利要求1所述的对象操作装置,其特征在于,所述对象操作装置,还包括:
第一迭代模块,用于对所述样本参数集合进行迭代处理,得到迭代处理后的样本参数集合;
第二迭代模块,用于响应于未达到预设的迭代终止条件,对所述迭代处理后的样本参数集合进行下一次迭代处理;
目标获取模块,用于响应于达到所述预设的迭代终止条件,基于所述迭代处理后的样本参数集合获取所述目标参数组。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的对象操作方法。
15.一种非瞬态计算机存储介质,其特征在于,所述计算机存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至11任一所述的对象操作方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211153843.6A CN115409159A (zh) | 2022-09-21 | 2022-09-21 | 对象操作方法、装置、计算机设备以及计算机存储介质 |
PCT/CN2023/110289 WO2024060839A1 (zh) | 2022-09-21 | 2023-07-31 | 对象操作方法、装置、计算机设备以及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211153843.6A CN115409159A (zh) | 2022-09-21 | 2022-09-21 | 对象操作方法、装置、计算机设备以及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115409159A true CN115409159A (zh) | 2022-11-29 |
Family
ID=84166466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211153843.6A Pending CN115409159A (zh) | 2022-09-21 | 2022-09-21 | 对象操作方法、装置、计算机设备以及计算机存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115409159A (zh) |
WO (1) | WO2024060839A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024060839A1 (zh) * | 2022-09-21 | 2024-03-28 | 京东方科技集团股份有限公司 | 对象操作方法、装置、计算机设备以及计算机存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766307A (zh) * | 2020-12-25 | 2021-05-07 | 北京迈格威科技有限公司 | 图像处理方法、装置、电子设备及可读存储介质 |
CN112862933B (zh) * | 2021-02-04 | 2023-06-27 | 北京百度网讯科技有限公司 | 用于优化模型的方法、装置、设备以及存储介质 |
CN113284142B (zh) * | 2021-07-16 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像检测方法、装置、计算机可读存储介质及计算机设备 |
CN115409159A (zh) * | 2022-09-21 | 2022-11-29 | 北京京东方技术开发有限公司 | 对象操作方法、装置、计算机设备以及计算机存储介质 |
-
2022
- 2022-09-21 CN CN202211153843.6A patent/CN115409159A/zh active Pending
-
2023
- 2023-07-31 WO PCT/CN2023/110289 patent/WO2024060839A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024060839A1 (zh) * | 2022-09-21 | 2024-03-28 | 京东方科技集团股份有限公司 | 对象操作方法、装置、计算机设备以及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2024060839A1 (zh) | 2024-03-28 |
WO2024060839A9 (zh) | 2024-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109949255B (zh) | 图像重建方法及设备 | |
CN108898087B (zh) | 人脸关键点定位模型的训练方法、装置、设备及存储介质 | |
WO2022068623A1 (zh) | 一种模型训练方法及相关设备 | |
CN111488985B (zh) | 深度神经网络模型压缩训练方法、装置、设备、介质 | |
CN112288011B (zh) | 一种基于自注意力深度神经网络的图像匹配方法 | |
CN109741341B (zh) | 一种基于超像素和长短时记忆网络的图像分割方法 | |
CN113326930B (zh) | 数据处理方法、神经网络的训练方法及相关装置、设备 | |
CN113705769A (zh) | 一种神经网络训练方法以及装置 | |
CN113989890A (zh) | 基于多通道融合和轻量级神经网络的人脸表情识别方法 | |
CN111784699B (zh) | 一种对三维点云数据进行目标分割方法、装置及终端设备 | |
CN112418320B (zh) | 一种企业关联关系识别方法、装置及存储介质 | |
CN112560639B (zh) | 人脸关键点数目转换方法、系统、电子设备及存储介质 | |
CN111738403A (zh) | 一种神经网络的优化方法及相关设备 | |
CN112446888A (zh) | 图像分割模型的处理方法和处理装置 | |
WO2024060839A1 (zh) | 对象操作方法、装置、计算机设备以及计算机存储介质 | |
CN113011532A (zh) | 分类模型训练方法、装置、计算设备及存储介质 | |
CN115601692A (zh) | 数据处理方法、神经网络模型的训练方法及装置 | |
CN112836820A (zh) | 用于图像分类任务的深度卷积网络训方法、装置及系统 | |
CN116863194A (zh) | 一种足溃疡图像分类方法、系统、设备及介质 | |
WO2022100607A1 (zh) | 一种神经网络结构确定方法及其装置 | |
WO2022127603A1 (zh) | 一种模型处理方法及相关装置 | |
CN115063847A (zh) | 一种面部图像获取模型的训练方法及装置 | |
CN115170599A (zh) | 通过图神经网络的链路预测进行血管分割的方法和装置 | |
CN114065913A (zh) | 模型量化方法、装置及终端设备 | |
CN114170465A (zh) | 基于注意力机制的3d点云分类方法、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |