CN113554048A - 数据识别方法、装置、设备及存储介质 - Google Patents
数据识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113554048A CN113554048A CN202010336465.XA CN202010336465A CN113554048A CN 113554048 A CN113554048 A CN 113554048A CN 202010336465 A CN202010336465 A CN 202010336465A CN 113554048 A CN113554048 A CN 113554048A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- preset
- training
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 136
- 238000010845 search algorithm Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 238000001514 detection method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种数据识别方法、装置、设备及存储介质,涉及边缘智能技术领域。该方法包括:获取待识别数据;基于第一模型对所述待识别数据进行识别处理,得到所述待识别数据的识别结果;其中,所述第一模型为采用预设网格搜索算法对预先获取的第二模型进行训练后得到。根据本申请实施例,能够提高边缘设备识别数据时的识别准确率。
Description
技术领域
本申请属于边缘智能技术领域,尤其涉及一种数据识别方法、装置、设备及存储介质。
背景技术
近年来,随着万物互联时代的到来和无线网络的普及,网络边缘的设备数量和其产生的数据量都急剧增长。为了高效地处理边缘设备产生的数据,边缘智能应运而生。边缘智能,是指将人工智能部署在边缘设备上,使边缘设备具备图像识别、文字识别等能力。
由于人工智能对计算资源和存储资源的要求较高,而现有的边缘设备往往在计算资源和存储资源受限,因此,通常由云端服务器负责训练模型,然后将云端服务器训练的模型部署在边缘设备。
然而,当边缘设备基于云端服务器训练的模型识别数据时,识别准确率往往较低。
发明内容
本申请实施例提供一种数据识别方法、装置、设备及存储介质,以解决边缘设备基于训练好的模型进行数据识别时,识别准确率低的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种数据识别方法,包括:
获取待识别数据;
基于第一模型对所述待识别数据进行识别处理,得到所述待识别数据的识别结果;
其中,所述第一模型为采用预设网格搜索算法对预先获取的第二模型进行训练后得到。
第二方面,本申请实施例提供了一种数据识别装置,包括:
获取模块,用于获取待识别数据;
识别模块,用于基于第一模型对所述待识别数据进行识别处理,得到所述待识别数据的识别结果;
其中,所述第一模型为采用预设网格搜索算法对预先获取的第二模型进行训练后得到。
第三方面,本申请实施例提供了一种边缘设备,包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如第一方面所述的数据识别方法。
第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面所述的数据识别方法。
相较于现有技术,本申请具有以下有益效果:
在本申请实施例中,边缘设备可以基于第一模型对待识别数据进行识别处理,得到待识别数据的识别结果,由于第一模型是由边缘设备基于预设网格搜索算法对预先获取的第二模型进行训练后得到,而预设网格搜索算法可以提高第一模型的模型参数的准确度,因此,相对于云端服务器训练的模型的模型参数,第一模型的模型参数更加准确,从而提高了边缘设备识别数据时的识别准确率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的应用场景示意图;
图2是本申请另一个实施例提供的数据识别方法的流程示意图;
图3是本申请另一个实施例提供的数据识别方法的流程示意图;
图4是本申请另一个实施例提供的系统架构示意图;
图5是本申请另一个实施例提供的模型训练示意图;
图6是本申请另一个实施例提供的数据识别装置的结构示意图;
图7是本申请又一个实施例提供的边缘设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
如背景技术部分,由于人工智能对计算资源和存储资源的要求较高,而现有的边缘设备往往在计算资源和存储资源受限,因此,通常由云端服务器负责训练模型,然后将云端服务器训练的模型部署在边缘设备。
申请人经过研究发现,边缘设备采用的基于云端服务器训练的模型的模型参数,通常是固化的模型参数,或者是由云端服务器基于边缘设备上传的训练数据进行调整后的模型参数,而该调整后的模型参数为滞后的模型参数。无论是上述固化的模型参数,还是滞后的模型参数,都不能较好地提升模型的泛化能力,导致边缘设备在基于云端服务器训练的模型识别数据时,识别准确率往往较低。
为了解决现有技术问题,本申请实施例提供了一种数据识别方法、装置、设备及存储介质。下面首先对本申请实施例所提供的数据识别方法进行介绍。
该数据识别方法的执行主体可以是一种边缘设备,如摄像头、传感器、视频监视器等。应用场景图可以如图1所示,边缘设备100可以获取待识别的数据,如文本数据、图片数据等,然后可以对待识别的数据进行识别处理,得到待识别数据的识别结果。
如图2所示,本申请实施例提供的数据识别方法包括以下步骤:
S210、获取待识别数据。
S220、基于第一模型对待识别数据进行识别处理,得到待识别数据的识别结果。
上述各步骤的具体实现方式将在下文中进行详细描述。
在本申请实施例中,边缘设备可以基于第一模型对待识别数据进行识别处理,得到待识别数据的识别结果,由于第一模型是由边缘设备基于预设网格搜索算法对预先获取的第二模型进行训练后得到,而预设网格搜索算法可以提高第一模型的模型参数的准确度,因此,相对于云端服务器训练的模型的模型参数,第一模型的模型参数更加准确,从而提高了边缘设备识别数据时的识别准确率。
下面介绍上述各个步骤的具体实现方式。
首先介绍S210的具体实现方式。
在一些示例实施例中,待识别数据可以是直接输入至模型的数据。边缘设备可以从其它设备处接收待识别数据,也可以通过主动采集数据的方式,获取待识别数据。
可选的,当通过主动采集数据的方式获取待识别数据时,如图3所示,S210的处理可以如下:
S211,采集第一数据。
在一些示例实施例中,第一数据可以是边缘设备采集的数据,如人脸照片、车辆的监控视频等数据。
S212,根据第一数据的数据格式,确定第一数据的目标数据类型。
在一些示例实施例中,数据格式,可以是TXT、Word、JPGE、MKV等格式;数据类型,可以是文本、视频等类型。边缘设备在采集到第一数据后,可以根据第一数据的数据格式,确定出第一数据的目标数据类型。
具体的,可以预先在边缘设备中配置数据格式和数据类型的对照表,进而边缘设备可以按照该对照表,对第一数据的数据类型进行确定。例如,在上述对照表中可以记录有TXT格式和文本数据的对应关系,当边缘设备采集的第一数据的数据格式为TXT格式时,边缘设备可以确定出该第一数据的数据类型为文本类型。
S213,采用目标数据类型对应的预设数据处理方式对第一数据进行处理,得到待识别数据。
在一些示例实施例中,边缘设备在识别出第一数据的目标数据类型后,可以按照目标数据类型对应的预设数据处理方式,对第一数据进行处理,从而得到待识别数据。
可选的,为了较好地理解上述预设数据处理方式,下面以目标数据类型为视频类型和文本类型为例,对S213的具体处理进行说明。
在一些示例实施例中,在目标数据类型为视频类型的情况下,边缘设备可以从第一数据中提取出各个视频帧的图片数据,例如视频帧中的I帧,以得到图片数据集合。之后,由于视频帧的数量较多,且存在较多的与待识别数据不相干的视频帧,因此,边缘设备可以获取图片数据集合中每个图片数据与预设对照数据的关联度,然后将关联度小于预设关联度的图片数据从图片数据集合中剔除。这样,剔除后的图片数据集合可以作为待识别数据。
在一些示例实施例中,在目标数据类型为文本类型的情况下,边缘设备可以将第一数据切分为字和词,如人、强等字,或者世界、任务等词。之后,边缘设备可以构建字的字向量以及词的词向量,然后可以将构建的子向量和词向量作为待识别数据。
以上为S210的具体实现方式,下面介绍S220的具体实现方式。
在一些示例实施例中,第一模型为边缘设备在本地进行训练的模型,边缘设备可以采用预设网格搜索算法对预先获取的第二模型进行训练后得到第一模型。
由于边缘设备在开展识别数据处理的初始阶段,所能获取的现有数据量较小,无法重头开始训练一个效果良好的模型,因此,可以采用迁移学习手段,如fine-tune(微调)方式,采用相同的模型框架以及已经确定的能取得较好训练结果的现有模型参数,作为初始模型,即第二模型,然后在第二模型的基础上,采用预设网格搜索算法和后续获取的数据,对第二模型进行训练,以得到第一模型。这样,不仅解决了因现有数据量小无法从头训练第一模型,以及由参数收敛速度慢带来的训练第一模型耗时长的问题,可以快速提高第一模型的识别准确率,在第一模型刚开始训练时就能获得良好的训练效果,可以提高第一模型的泛化能力,而且还可以节省边缘设备的计算资源。
这样,边缘设备在获取待识别数据后,可以基于第一模型对待识别数据进行识别处理,得到待识别数据的识别结果。
可选的,为了较好地理解采用预设网格搜索算法对第一模型进行训练的过程,S220的具体处理可以如下:初始化预设网格搜索算法的预设步长、预设衰减指数以及预设衰减步数;基于预设步长、预设衰减指数以及预设衰减步数,利用输入训练样本和输出训练样本迭代训练第二模型,在每次迭代训练过程中,将输入训练样本作为第二模型的输入,通过第二模型后得到预测结果;判断预测结果与输出训练样本之间的相似度是否满足第一预设条件,如果是,则停止迭代,第二模型训练完成,将训练完成的第二模型作为第一模型;如果否,继续进行下一次迭代训练过程。
在一些示例实施例中,边缘设备在获取待识别数据之前,可以采用预设网格搜索算法,对预先获取的第二模型进行训练,得到第一模型。传统的网络搜索存在一些问题,它非常依赖步长的选择,选择的步长过大或过小都会影响搜索的时间与准确率,而预设网格搜索算法,是在网格搜索算法的基础上,对网格搜索算法中的步长进行了改进的算法。
具体的,下面对预设网格搜索算法进行介绍。首先,边缘设备可以先对预设网格搜索算法的预设步长、预设衰减指数以及预设衰减步数进行初始化,其中,预设衰减步数是指迭代预设轮就衰减一次步长,预设衰减指数是指步长衰减的程度,一般可设为略小于1的值,如0.98。
下面给出一种预设网格搜索算法中用于计算指数衰减步长的公式(1):
在上述公式(1)中,default-stride为预设步长,global-steps为当前时刻的迭代次数,decay-rate为预设衰减指数,decay-steps为预设衰减步数,decayed-stride为指数衰减步长。
之后,边缘设备可以基于初始化得到的预设步长、预设衰减指数以及预设衰减步数,利用输入训练样本和输出训练样本迭代训练第二模型。在每次迭代训练过程中,边缘设备可以将输入训练样本作为第二模型的输入,通过第二模型后得到预测结果,然后判断预测结果与输出训练样本之间的相似度是否满足第一预设条件,该第一预设条件可以是预设相似度,如95%。如果预测结果与输出训练样本之间的相似度满足第一预设条件,则停止迭代,第二模型训练完成,将训练完成的第二模型作为第一模型。如果预测结果与输出训练样本之间的相似度不满足第一预设条件,则继续进行下一次迭代训练过程,直至判断预测结果与输出训练样本之间的相似度满足第一预设条件。
通过上述实施例,由于采用了指数衰减的形式逐步降低网格搜索算法的步长,因此,可以使得模型参数的寻优过程前快后慢,更容易寻找到全局最优参数,如超参数最优组合,故而,预设网格搜索算法可以提高第二模型的模型参数的准确度。
由于第一模型是由边缘设备基于预设网格搜索算法对预先获取的第二模型进行训练后得到,而预设网格搜索算法可以提高第一模型的模型参数的准确度,因此,相对于云端服务器训练的模型的模型参数,由边缘设备基于第二模型训练得到的第一模型的模型参数更加准确,而且边缘设备还可以基于获取的数据量持续对第一模型进行训练,以不断优化模型参数。
可选的,考虑到模型精度越高计算资源消耗越大,且边缘设备的计算资源较为有限的情况,为了较好地平衡训练第一模型的模型精度和消耗的边缘设备的计算资源,可以在输入训练样本满足第二预设条件的情况下,调整输入训练样本中已训练数据和未训练数据的比例。
在一些示例实施例中,边缘设备可以获取输入训练样本中每个已训练数据的训练次数,然后将预设数量的训练次数满足第三预设条件的已训练数据从输入训练样本中删除,同时,再将预设数量的未训练数据添加到输入训练样本中,以调整输入训练样本中已训练数据和未训练数据的比例。这样,随着边缘设备的数据量的不断增多,可以选择性的删除训练过的旧数据,并补充未训练的新数据,以平衡训练第一模型的模型精度和消耗的边缘设备的计算资源。
在一些示例实施例中,边缘设备还可以采用轻量级的网络结构,如MobileNet,以及one-stage目标检测算法,如SqueezeNet、DetectNet等,来提升模型参数的收敛速度,减少训练模型时的计算量。
具体的,目标检测算法通常可以分为one-stage目标检测算法和two-stage目标检测算法。其中,two-stage目标检测算法,如Faster R-CNN,会生成很多候选框,然后再对每个候选框进行分类,由于需要多次运行检测和分类流程,因此two-stage目标检测算法的计算速度较慢。而one-stage检测方法,由于数据通过一次网络模型就可以预测出所有的边界框,因而one-stage检测方法的计算速度较快,非常适合边缘设备。
在一些示例实施例中,还可以通过设定训练模型的时机,来节省边缘设备的计算资源。
由于边缘设备不仅需要训练模型,还需要使用模型进行数据识别。为了节省边缘设备的计算资源,可以根据边缘设备采集的数据量的规模,来设定何时训练模型。
具体的,可以设置一个阈值,如果在一定时间内,边缘设备采集的数据量的大小超过该阈值,则边缘设备使用模型进行数据识别。如果在一定时间内,边缘设备采集的数据量的大小未超过该阈值,则边缘设备可以在训练模型的同时,也进行数据识别。
需要说明的是,上述阈值可以设定一个比输入训练样本中数据量小的一个值,这样可以不影响模型训练。此外,还可以设定,只有当边缘设备采集的数据量达到预设数据量时,才开始训练模型,这样不仅可以为训练模型提供充足的数据,还可以达到更好的训练效果。
在本申请实施例中,边缘设备可以基于第一模型对待识别数据进行识别处理,得到待识别数据的识别结果,由于第一模型是由边缘设备基于预设网格搜索算法对预先获取的第二模型进行训练后得到,而预设网格搜索算法可以提高第一模型的模型参数的准确度,因此,相对于云端服务器训练的模型的模型参数,第一模型的模型参数更加准确,从而提高了边缘设备识别数据时的识别准确率。
此外,本申请实施例还提出了一种适用于边缘设备的模型训练方式,即可以由边缘设备对模型进行训练,其中,对模型的训练包括且不限于对模型的超参数进行优化。通过上述模型训练方式,不仅可以达到边缘设备对模型进行自适应优化的目的,还可以不断提高模型的泛化能力。此外,通过设定训练模型的时机,还可以节省边缘设备的计算资源,平衡训练模型的模型精度和消耗的边缘设备的计算资源。
另外,由于采用了指数衰减的形式逐步降低网格搜索算法的步长,因此,可以使得寻优过程前快后慢,更容易寻找到全局最优参数,如超参数最优组合,故而,预设网格搜索算法可以提高第二模型的模型参数的准确度。
可选了,为了较好地理解上述实施例提供的数据识别方法,下面给出一种实现上述数据识别方法的系统架构。如图4所示,上述系统架构包括云端服务器410和边缘设备420,其中,云端服务器410包括模型初始化训练411,即为边缘设备420提供第二模型;边缘设备420包括硬件设施421、数据处理422、模型优化423、模型管理424等组件。
具体的,下面首先介绍硬件设施421。边缘设备420的硬件设施421需要具有一定的算力和系统管理的能力,故而,边缘设备420需要部署操作系统4211,例如Windows系统、Linux系统,以及内存、硬盘等存储4212。此外,部署具有人工智能计算能力的边缘模组4213,也是不可缺少的。经过上述部署,可以为边缘设备的模型训练和数据识别处理,提供算力支撑。
下面介绍数据处理422。数据处理422包括数据采集4221和数据仓库4222,其中,数据采集4221用于进行上述实施例提到的获取待识别数据的处理,数据仓库4222用于对获取的待识别数据进行储存、清洗和整理数据。
此外,数据仓库4222还有两个特殊的功能。一方面,可以控制数据是否加入模型的输入训练样本,为此,可以设置导入输入训练样本的数据量的上限值和下限值,例如,对于图片数据,可以设置上限值为五万张图片,下限值为一万张图片。其中,下限值为进入模型训练阶段的初始数据量的阈值,且这个阈值可以随着训练的次数成倍数增长;上限值则限制了进入输入训练样本的数据规模,如果输入训练样本的数据量超过了上限值,则可以清空输入训练样本中的数据,或者调整输入样本中已训练数据和未训练数据的比例。另一方面,进入输入训练样本的数据量可以始终与下限值保持一致,如果数据仓库4222中保存的数据多于下限值,则可以采用随机采样的方式从数据仓库4222中选取加入输入训练样本的数据,从而可以保证输入训练样本中数据量的统一,避免因数据量的不同影响模型训练得到的模型精度。此外,数据仓库4222还可以接收经过数据识别后得到的数据标签,从而可以对数据自动标注数据标签。
下面介绍模型优化423。下面从模型精度4231和模型性能4232出发,对模型优化423进行介绍。
由于模型往往是通过某些特定的数据集训练出来的,即输入数据样本,这就导致模型的泛化能力不够,不足以拟合新数据,此外,在云端服务器上训练模型后再更新到边缘会带来时延等弊端。因此,将模型的训练也部署在边缘设备是很有必要的,可以实时更新模型精度4231。其中,提高模型精度4231不仅是增加输入训练样本中的数据量,调整模型的参数也很重要。模型中的参数通常分为模型参数和超参数两种,模型参数是可以从数据中自动进行估计,比如权重,偏置等,而超参数则需要人工指定,比如卷积核的大小、学习率、隐藏层数目、激活函数的选择等。尤其对于超参数,其往往很难手动调节至最优,而且将模型训练部署在边缘设备后,人工就更难以调整。因此,采用自适应的方式调节超参数就显得尤为重要了。本申请采用了上述预设网格搜索算法寻找最优超参数的组合。
模型精度4231越高对计算资源的消耗越大,因此,为了平衡训练模型的模型精度4231和消耗的边缘设备的计算资源,即模型性能4232,如图5所示,可以采用下述三种措施训练模型500:
510,使用迁移学习手段,如fine-tune,避免模型重头开始训练,节省计算资源且模型开始训练就能获得良好的效果。
520,采用轻量级的网络结构和one-stage目标检测算法,提升模型参数的收敛速度,减少模型计算量。
530,控制模型训练的数据量,有选择性的删除已训练数据,增加未训练数据。
下面介绍模型管理424。模型管理424可以包括模型训练4241和数据识别4242。考虑到边缘设备需要进行模型训练4241和数据识别4242这两个过程,而同时进行这两个过程很可能导致边缘模型的计算资源不足,因此,可以根据边缘设备采集的数据量大小,自动选择模型训练4241或者数据识别4242。例如,在收集数据时,可以设置一个阈值,如果在一定时间内,边缘设备采集的数据量的大小超过该阈值,则边缘设备使用模型进行数据识别4242。如果在一定时间内,边缘设备采集的数据量的大小未超过该阈值,则边缘设备可以在训练模型4241的同时,也进行数据识别4242。这个阈值需要设定一个比数据仓库4222的下限值低的值,这样就不会影响模型训练的稳定。此外,还可以与数据仓库4222协同操作,即只有数据量达到一定数据量时才进行模型训练4241,这样可以为模型训练4241保证充足的数据,以达到更好的模型精度。
通过上述实施例,提出了一种从边缘设备的数据采集、到数据仓库的管理、再到模型超参数的优化,最后到模型训练与数据识别的系统架构,在此系统架构下,边缘设备更加灵活智能,能对新采集的数据进行管理,导入到模型中训练,且合理的配置模型超参数,使之在最大化利用计算资源的同时提升模型的精度。
基于上述实施例提供的数据识别方法,相应地,本申请还提供了数据识别装置的具体实现方式。请参见以下实施例。
首先参见图6,本申请实施例提供的数据识别装置包括以下模块:
获取模块610,用于获取待识别数据;
识别模块620,用于基于第一模型对待识别数据进行识别处理,得到待识别数据的识别结果;
其中,第一模型为采用预设网格搜索算法对预先获取的第二模型进行训练后得到。
经过上述各模块的配合处理,可以基于第一模型对待识别数据进行识别处理,得到待识别数据的识别结果,由于第一模型是由边缘设备基于预设网格搜索算法对预先获取的第二模型进行训练后得到,而预设网格搜索算法可以提高第一模型的模型参数的准确度,因此,相对于云端服务器训练的模型的模型参数,第一模型的模型参数更加准确,从而提高了边缘设备识别数据时的识别准确率。
可选的,为了训练模型,上述装置还可以包括训练模块,用于:
初始化预设网格搜索算法的预设步长、预设衰减指数以及预设衰减步数;
基于预设步长、预设衰减指数以及预设衰减步数,利用输入训练样本和输出训练样本迭代训练第二模型,在每次迭代训练过程中,将输入训练样本作为第二模型的输入,通过第二模型后得到预测结果;
判断预测结果与输出训练样本之间的相似度是否满足第一预设条件,如果是,则停止迭代,第二模型训练完成,将训练完成的第二模型作为第一模型;如果否,继续进行下一次迭代训练过程。
可选的,为了平衡训练模型的模型精度和消耗的边缘设备的计算资源训练模型,上述装置还包括:
调整模块,用于在输入训练样本满足第二预设条件的情况下,调整输入训练样本中已训练数据和未训练数据的比例。
可选的,上述调整模块,具体用于:
获取输入训练样本中每个已训练数据的训练次数;
删除预设数量的训练次数满足第三预设条件的已训练数据,添加预设数量的未训练数据。
可选的,上述获取模块610,具体用于:
采集第一数据;
根据第一数据的数据格式,确定第一数据的目标数据类型;
采用目标数据类型对应的预设数据处理方式对第一数据进行处理,得到待识别数据。
可选的,上述获取模块610,还用于:
在目标数据类型为视频类型的情况下,从第一数据中提取出各个视频帧的图片数据,得到图片数据集合;
获取图片数据集合中每个图片数据与预设对照数据的关联度,并将关联度小于预设关联度的图片数据从图片数据集合中剔除;
将剔除后的图片数据集合作为待识别数据;
在目标数据类型为文本类型的情况下,将第一数据切分为字和词,并构建字的字向量以及词的词向量;
将构建的子向量和词向量作为待识别数据。
图6提供的数据识别装置中的各个模块具有实现图2所示实施例中各个步骤的功能,并达到与图2所示数据识别方法相同的技术效果,为简洁描述,在此不再赘述。
图7为实现本申请各个实施例的一种边缘设备的硬件结构示意图。
边缘设备可以包括处理器701以及存储有计算机程序指令的存储器702。
具体地,上述处理器701可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器702可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器702可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器702可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器702可在综合网关容灾设备的内部或外部。在特定实施例中,存储器702是非易失性固态存储器。在特定实施例中,存储器702包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器701通过读取并执行存储器702中存储的计算机程序指令,以实现上述实施例中的任意一种数据识别方法。
在一个示例中,边缘设备还可包括通信接口703和总线710。其中,如图7所示,处理器701、存储器702、通信接口703通过总线710连接并完成相互间的通信。
通信接口703,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线710包括硬件、软件或两者,将边缘设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线710可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该边缘设备可以执行本申请实施例中的数据识别方法,从而实现结合图2和图6描述的数据识别方法和装置。
本申请实施例还提供一种计算机可读存储介质,该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述数据识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (13)
1.一种数据识别方法,其特征在于,所述方法应用于边缘设备,所述方法包括:
获取待识别数据;
基于第一模型对所述待识别数据进行识别处理,得到所述待识别数据的识别结果;
其中,所述第一模型为采用预设网格搜索算法对预先获取的第二模型进行训练后得到。
2.根据权利要求1所述的方法,其特征在于,所述基于第一模型对所述待识别数据进行识别处理之前,所述方法还包括:
采用预设网格搜索算法对预先获取的第二模型进行训练,得到所述第一模型;
所述采用预设网格搜索算法对预先获取的第二模型进行训练,得到所述第一模型,包括:
初始化所述预设网格搜索算法的预设步长、预设衰减指数以及预设衰减步数;
基于所述预设步长、所述预设衰减指数以及所述预设衰减步数,利用输入训练样本和输出训练样本迭代训练所述第二模型,在每次迭代训练过程中,将所述输入训练样本作为所述第二模型的输入,通过所述第二模型后得到预测结果;
判断所述预测结果与所述输出训练样本之间的相似度是否满足第一预设条件,如果是,则停止迭代,所述第二模型训练完成,将训练完成的所述第二模型作为所述第一模型;如果否,继续进行下一次迭代训练过程。
3.根据权利要求2所述的方法,其特征在于,所述利用输入训练样本和输出训练样本迭代训练所述第二模型的模型参数之前,所述方法还包括:
在所述输入训练样本满足第二预设条件的情况下,调整所述输入训练样本中已训练数据和未训练数据的比例。
4.根据权利要求3所述的方法,其特征在于,所述在输入训练样本满足第二预设条件的情况下,调整所述输入训练样本中已训练数据和未训练数据的比例,包括:
获取所述输入训练样本中每个已训练数据的训练次数;
删除预设数量的训练次数满足第三预设条件的已训练数据,添加所述预设数量的未训练数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取待识别数据,包括:
采集第一数据;
根据所述第一数据的数据格式,确定所述第一数据的目标数据类型;
采用所述目标数据类型对应的预设数据处理方式对所述第一数据进行处理,得到所述待识别数据。
6.根据权利要求5所述的方法,其特征在于,所述采用所述目标数据类型对应的预设数据处理方式对所述第一数据进行处理,得到所述待识别数据,包括:
在所述目标数据类型为视频类型的情况下,从所述第一数据中提取出各个视频帧的图片数据,得到图片数据集合;
获取所述图片数据集合中每个图片数据与预设对照数据的关联度,并将关联度小于预设关联度的图片数据从所述图片数据集合中剔除;
将剔除后的图片数据集合作为所述待识别数据;
在所述目标数据类型为文本类型的情况下,将所述第一数据切分为字和词,并构建所述字的字向量以及所述词的词向量;
将构建的所述子向量和所述词向量作为所述待识别数据。
7.一种数据识别装置,其特征在于,包括:
获取模块,用于获取待识别数据;
识别模块,用于基于第一模型对所述待识别数据进行识别处理,得到所述待识别数据的识别结果;
其中,所述第一模型为采用预设网格搜索算法对预先获取的第二模型进行训练后得到。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括训练模块,用于:
初始化所述预设网格搜索算法的预设步长、预设衰减指数以及预设衰减步数;
基于所述预设步长、所述预设衰减指数以及所述预设衰减步数,利用输入训练样本和输出训练样本迭代训练所述第二模型,在每次迭代训练过程中,将所述输入训练样本作为所述第二模型的输入,通过所述第二模型后得到预测结果;
判断所述预测结果与所述输出训练样本之间的相似度是否满足第一预设条件,如果是,则停止迭代,所述第二模型训练完成,将训练完成的所述第二模型作为所述第一模型;如果否,继续进行下一次迭代训练过程。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
调整模块,用于在所述输入训练样本满足第二预设条件的情况下,调整所述输入训练样本中已训练数据和未训练数据的比例。
10.根据权利要求9所述的装置,其特征在于,所述调整模块,具体用于:
获取所述输入训练样本中每个已训练数据的训练次数;
删除预设数量的训练次数满足第三预设条件的已训练数据,添加所述预设数量的未训练数据。
11.根据权利要求7-10任一项所述的装置,其特征在于,所述获取模块,具体用于:
采集第一数据;
根据所述第一数据的数据格式,确定所述第一数据的目标数据类型;
采用所述目标数据类型对应的预设数据处理方式对所述第一数据进行处理,得到所述待识别数据。
12.一种边缘设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-6任意一项所述的数据识别方法。
13.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的数据识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010336465.XA CN113554048B (zh) | 2020-04-26 | 2020-04-26 | 数据识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010336465.XA CN113554048B (zh) | 2020-04-26 | 2020-04-26 | 数据识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113554048A true CN113554048A (zh) | 2021-10-26 |
CN113554048B CN113554048B (zh) | 2024-02-02 |
Family
ID=78129771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010336465.XA Active CN113554048B (zh) | 2020-04-26 | 2020-04-26 | 数据识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113554048B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103237222A (zh) * | 2013-05-07 | 2013-08-07 | 河海大学常州校区 | 多模式搜索的运动估计方法 |
CN104008399A (zh) * | 2014-06-12 | 2014-08-27 | 哈尔滨工业大学 | 一种仪表检测中基于支持向量机的仪表指针抖动的识别方法 |
US20180240041A1 (en) * | 2017-02-22 | 2018-08-23 | Sas Institute Inc. | Distributed hyperparameter tuning system for machine learning |
CN108519915A (zh) * | 2018-04-12 | 2018-09-11 | 北京邮电大学 | 流量任务调度方法和装置 |
CN109242105A (zh) * | 2018-08-17 | 2019-01-18 | 第四范式(北京)技术有限公司 | 机器学习模型中超参数的调优方法、装置、设备及介质 |
CN109645990A (zh) * | 2018-08-30 | 2019-04-19 | 北京航空航天大学 | 一种癫痫患者脑电信号的计算机模式识别方法 |
CN110163261A (zh) * | 2019-04-28 | 2019-08-23 | 平安科技(深圳)有限公司 | 不平衡数据分类模型训练方法、装置、设备及存储介质 |
US10417556B1 (en) * | 2017-12-07 | 2019-09-17 | HatchB Labs, Inc. | Simulation-based controls optimization using time series data forecast |
CN110428087A (zh) * | 2019-06-25 | 2019-11-08 | 万翼科技有限公司 | 企业稳定性预测方法、装置、计算机设备和存储介质 |
CN110633376A (zh) * | 2019-08-22 | 2019-12-31 | 北京奇艺世纪科技有限公司 | 一种媒体对象排序方法、装置、设备及存储介质 |
-
2020
- 2020-04-26 CN CN202010336465.XA patent/CN113554048B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103237222A (zh) * | 2013-05-07 | 2013-08-07 | 河海大学常州校区 | 多模式搜索的运动估计方法 |
CN104008399A (zh) * | 2014-06-12 | 2014-08-27 | 哈尔滨工业大学 | 一种仪表检测中基于支持向量机的仪表指针抖动的识别方法 |
US20180240041A1 (en) * | 2017-02-22 | 2018-08-23 | Sas Institute Inc. | Distributed hyperparameter tuning system for machine learning |
US10417556B1 (en) * | 2017-12-07 | 2019-09-17 | HatchB Labs, Inc. | Simulation-based controls optimization using time series data forecast |
CN108519915A (zh) * | 2018-04-12 | 2018-09-11 | 北京邮电大学 | 流量任务调度方法和装置 |
CN109242105A (zh) * | 2018-08-17 | 2019-01-18 | 第四范式(北京)技术有限公司 | 机器学习模型中超参数的调优方法、装置、设备及介质 |
CN109645990A (zh) * | 2018-08-30 | 2019-04-19 | 北京航空航天大学 | 一种癫痫患者脑电信号的计算机模式识别方法 |
CN110163261A (zh) * | 2019-04-28 | 2019-08-23 | 平安科技(深圳)有限公司 | 不平衡数据分类模型训练方法、装置、设备及存储介质 |
CN110428087A (zh) * | 2019-06-25 | 2019-11-08 | 万翼科技有限公司 | 企业稳定性预测方法、装置、计算机设备和存储介质 |
CN110633376A (zh) * | 2019-08-22 | 2019-12-31 | 北京奇艺世纪科技有限公司 | 一种媒体对象排序方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
RONG GE等: "The step decay schedule: A near optimal, geometrically decaying learning rate procedure for least squares", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》, vol. 32, pages 1 - 28 * |
周柏等: "基于随机步长具有最优瞬时收敛速率的稀疏随机优化算法", 《模式识别与人工智能》, vol. 28, no. 10, pages 876 - 885 * |
Also Published As
Publication number | Publication date |
---|---|
CN113554048B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022033150A1 (zh) | 图像识别方法、装置、电子设备及存储介质 | |
US11270166B2 (en) | Image identification system and image identification method | |
CN111401516B (zh) | 一种神经网络通道参数的搜索方法及相关设备 | |
CN112836676B (zh) | 一种异常行为检测方法、装置、电子设备及存储介质 | |
CN110633745A (zh) | 一种基于人工智能的图像分类训练方法、装置及存储介质 | |
CN110502962B (zh) | 视频流中目标的检测方法、装置、设备和介质 | |
CN110569754A (zh) | 图像目标检测方法、装置、存储介质及设备 | |
CN112733885A (zh) | 点云识别模型的确定方法、点云识别的方法及装置 | |
CN113792742A (zh) | 遥感图像的语义分割方法和语义分割模型的训练方法 | |
CN114359669A (zh) | 图片分析模型调整方法、装置以及计算机可读存储介质 | |
CN108596398B (zh) | 基于条件随机场与Stacking算法的时间序列预测方法和装置 | |
CN111401343B (zh) | 识别图像中人的属性的方法、识别模型的训练方法和装置 | |
CN113989721A (zh) | 目标检测方法和目标检测模型的训练方法、装置 | |
CN112949785B (zh) | 对象检测方法、装置、设备及计算机存储介质 | |
CN113554048B (zh) | 数据识别方法、装置、设备及存储介质 | |
CN112614168A (zh) | 一种目标人脸跟踪方法、装置、电子设备及存储介质 | |
CN116363444A (zh) | 模糊分类模型训练方法、识别模糊图像的方法及装置 | |
CN115294172A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN117635546B (zh) | 基于对比学习及弱监督的股骨头坏死区域识别方法及装置 | |
CN111160066A (zh) | 人脸识别方法、装置、设备和介质 | |
CN115147718B (zh) | 面向无人移动端视觉分析的场景自适应系统及其方法 | |
CN116229369B (zh) | 人流量的检测方法、装置、设备及计算机可读存储介质 | |
CN112380974B (zh) | 分类器优化方法、后门检测方法、装置和电子设备 | |
CN117095332A (zh) | 视频实例的分割方法及装置 | |
CN113537378A (zh) | 图像检测方法及装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |