CN114782960B - 模型训练方法、装置、计算机设备及计算机可读存储介质 - Google Patents
模型训练方法、装置、计算机设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN114782960B CN114782960B CN202210711300.5A CN202210711300A CN114782960B CN 114782960 B CN114782960 B CN 114782960B CN 202210711300 A CN202210711300 A CN 202210711300A CN 114782960 B CN114782960 B CN 114782960B
- Authority
- CN
- China
- Prior art keywords
- adjusted
- model
- character recognition
- layer
- optical character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012015 optical character recognition Methods 0.000 claims abstract description 163
- 238000004590 computer program Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 22
- 238000001514 detection method Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本申请提供一种模型训练方法、装置、计算机设备及计算机可读存储介质,涉及人工智能技术领域。方法包括:根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度;删除调整后的全连接层的模型参数,保留光学字符识别模型中除调整后的全连接层之外的层结构的模型参数;基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型;基于预设训练样本对模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。采用本申请能够实现降低对光学字符识别模型进行训练的工作量和训练成本。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种模型训练方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着科学技术的发展,深度学习算法在分类、检测、识别等任务中表现优异。在字符识别技术中,将图像输入到已训练的字符识别模型中,以通过字符识别模型对图像中的字符进行识别。在工业应用中,字符上下文间的关联性较小,光学字符识别模型往往由特征提取器和分类器(全连接层)组成。
但对于光学字符识别模型,其所支持的字符库在训练时即已确定,若要更改光学字符识别模型所能识别的字符,往往需要根据新的字符库建立的训练集重新训练新的光学字符识别模型,提高了光学字符识别模型的工作量以及训练成本。
发明内容
本申请提供一种模型训练方法、装置、计算机设备及计算机可读存储介质,能够实现降低了对光学字符识别模型进行训练的工作量和训练成本。
第一方面,本申请提供了一种模型训练方法,包括:
根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度;
删除调整后的全连接层的模型参数,保留光学字符识别模型中除调整后的全连接层之外的层结构的模型参数;
基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型;
基于预设训练样本对模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。
第二方面,本申请还提供了一种模型训练装置,包括:
维度调整模块,用于根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度;
第一参数调整模块,用于删除调整后的全连接层的模型参数,保留光学字符识别模型中除调整后的全连接层之外的层结构的模型参数;
第二参数调整模块,用于基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型;
模型训练模块,用于基于预设训练样本对模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。
第三方面,本申请还提供了一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述模型训练方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述模型训练方法的步骤。
第五方面,本申请还提供了一种计算机程序产品,计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述模型训练方法的步骤。
本申请通过对光学字符识别模型中全连接层的维度和模型参数的调整,以及保留全连接层以外层结构的模型参数,当待识别字符表发生改变时,降低了对光学字符识别模型进行训练的工作量和训练成本。
附图说明
图1为本申请实施例提供的一种模型训练方法的应用环境图;
图2为本申请实施例提供的一种模型训练方法的流程示意图;
图3为本申请实施例提供的一种调整全连接层的维度步骤的流程示意图;
图4为本申请实施例提供的一种模型训练装置的结构框图;
图5为本申请实施例提供的一种计算机设备的内部结构图;
图6为本申请实施例提供的一种计算机可读存储介质的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的模型训练方法,可以应用于如图1所示的应用环境中。其中,计算机设备102通过通信网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。
其中,计算机设备102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一些实施例中,如图2所示,提供了一种模型训练方法,以该方法应用于图1中的计算机设备102为例进行说明,包括以下步骤:
步骤202,根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度。
具体地,待识别字符表是由待识别的字符组成的,字符种类的目标数量是待识别字符表中不同种类字符的数量。根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度,使得调整后的全连接层的维度与目标数量相等。
步骤204,删除调整后的全连接层的模型参数,保留光学字符识别模型中除调整后的全连接层之外的层结构的模型参数。
具体地,光学字符识别模型包含全连接层以及其他层结构,如输入层、卷积层等;在卷积神经网络构成的模型中,全连接层起到“分类器”的作用,用于将学到的“分布式特征表示”映射到样本标记空间。由于更改光学字符识别模型所支持字库仅需对分类器进行更改,对其他网络结构无影响,对光学字符识别模型进行模型参数调整时,删除调整后的全连接层的模型参数,保留光学字符识别模型中除调整后的全连接层之外的层结构的模型参数。
步骤206,基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型。
具体地,线性层是指对输入参数进行线性变换的全连接层,判断调整后的全连接层是否为线性层;若是线性层,则光学字符识别模型中原字符范围内对应的全连接层的模型参数仍可使用,原字符范围以外对应的全连接层的模型参数需要初始化;若是非线性层,需要将调整后的全连接层的模型参数初始化,得到模型参数调整后的光学字符识别模型。
步骤208,基于预设训练样本对模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。
具体地,对调整后的全连接层的模型参数进行调整完成以后,基于预设训练样本对模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型,训练好的光学字符识别模型的识别误差达到目标值。训练结束后,获取模型参数调整后的光学字符识别模型中各层结构的模型参数,通过加载调整模型参数后的光学字符识别模型中各层结构的模型参数,完成对光学字符识别模型的更新。
上述模型训练方法中,通过对光学字符识别模型中全连接层的维度和模型参数的调整,以及保留全连接层以外层结构的模型参数,当待识别字符表发生改变时,降低了对光学字符识别模型进行训练的工作量和训练成本。
在一些实施例中,如图3所示,根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度,包括:
步骤302,获取目标图像的标注,标注包括标注框和字符;
步骤304,遍历标注中的字符,生成待识别字符表;
步骤306,统计待识别字符表中字符种类的目标数量,并根据目标数量调整光学字符识别模型中全连接层的维度,调整后的全连接层的维度与目标数量相等。
具体地,根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度时,首先获取目标图像的标注,标注包括标注框和字符,遍历标注中的字符,生成待识别字符表;待识别字符表中包含目标图像中所有不同种类的字符。统计待识别字符表中字符种类的目标数量,并基于目标数量调整光学字符识别模型中全连接层的维度,使得调整后的全连接层的维度与目标数量相等。
本实施例中,通过获取目标图像的标注,标注包括标注框和字符;遍历标注中的字符,生成待识别字符表;统计待识别字符表中字符种类的目标数量,并根据目标数量调整光学字符识别模型中全连接层的维度,调整后的全连接层的维度与目标数量相等,当待识别字符表发生改变时,降低了对光学字符识别模型进行训练的工作量以及训练成本。
在一些实施例中,根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度之前,还包括:
对获取的样本图像进行字符检测,得到样本图像的字符区域,并通过标注框对字符区域进行标注;
对标注后字符区域包括的字符进行标注,并基于字符区域和对应的字符形成样本训练集和样本测试集;
基于样本训练集对未训练的光学字符识别模型进行训练,并使用样本测试集对未训练的光学字符识别模型进行测试,当测试结果达到预设的准确率时完成训练,得到光学字符识别模型。
具体地,调整光学字符识别模型中全连接层的维度之前,需要获取样本图像,并对获取的样本图像进行字符检测,得到样本图像的字符区域,并通过标注框对字符区域进行标注,标注内容为字符区域对应的字符。之后,基于样本训练集对未训练的光学字符识别模型进行训练,并使用样本测试集对未训练的光学字符识别模型进行测试,当测试结果达到预设的准确率时完成训练,得到光学字符识别模型。
本实施例中,对获取的样本图像进行字符检测,得到样本图像的字符区域,并通过标注框对字符区域进行标注;对标注后字符区域包括的字符进行标注,并基于字符区域和对应的字符形成样本训练集和样本测试集;基于样本训练集对未训练的光学字符识别模型进行训练,并使用样本测试集对未训练的光学字符识别模型进行测试,当测试结果达到预设的准确率时完成训练,得到光学字符识别模型,有利于根据待识别字符表对光学字符识别模型的模型参数进行更改,有利于降低训练工作量。
在一些实施例中,基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型,包括:
若调整后的全连接层不是线性层,则初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型;或者,
若调整后的全连接层是线性层,且待识别字符表中的字符完全包含于样本训练集,则将待识别字符表中的各字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
具体地,基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,判断调整后的全连接层是否为线性层,若调整后的全连接层不是线性层,将调整后的全连接层的模型参数初始化;若调整后的全连接层是线性层,且待识别字符表中的字符完全包含于样本训练集,即待识别字符表中的字符均属于样本训练集中的字符,将待识别字符表中各字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,具体过程为,从1开始遍历待识别字符表,当遍历到的待识别字符表中的字符属于样本训练集中的字符时,提取该字符在调整后的全连接层的模型参数,并恢复为其在光学字符识别模型中全连接层的模型参数。
本实施例中,若调整后的全连接层不是线性层,初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型;或者,若调整后的全连接层是线性层,且待识别字符表中的字符完全包含于样本训练集,则将待识别字符表中的各字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,得到模型参数调整后的光学字符识别模型,通过对调整后的全连接层的模型参数的对应调整,避免了当待识别字符发生改变时,重新训练光学字符识别模型工作量大的缺陷。
在一些实施例中,基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型,还包括:
若调整后的全连接层是线性层,但待识别字符表中的字符完全不包含于样本训练集,则初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
具体地,若调整后的全连接层是线性层,但待识别字符表中的字符完全不包含于样本训练集,即待识别字符表中的字符均不属于样本训练集中的字符时,初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
本实施例中,当调整后的全连接层是线性层,但待识别字符表中的字符完全不包含于样本训练集时,初始化调整后的全连接层的模型参数,避免对全连接层以外层结构的模型参数的改变,降低了当待识别字符发生改变时,重新训练光学字符识别模型工作量。
在一些实施例中,基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型,还包括:
若调整后的全连接层是线性层,且待识别字符表中有部分字符包含于样本训练集,则将待识别字符表中包含于样本训练集的字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,且初始化待识别字符表中不包含于样本训练集的字符在调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
具体地,若调整后的全连接层是线性层,且待识别字符表中有部分字符包含于样本训练集,即待识别字符表中的字符有部分包含于样本训练集,同时有部分不包含于样本训练集。将待识别字符表中包含于样本训练集的字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,且初始化待识别字符表中不包含于样本训练集的字符在调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。具体过程为,从1开始遍历待识别字符表,当遍历到的待识别字符表中的字符属于样本训练集中的字符时,提取该字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数。同时,初始化待识别字符表中不包含于样本训练集的字符在调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型,完成对调整后的光学字符识别模型参数的调整。
本实施例中,当调整后的全连接层是线性层且待识别字符表中有部分字符包含于样本训练集时,将待识别字符表中包含于样本训练集的字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,且初始化待识别字符表中不包含于样本训练集的字符在调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型,避免对全连接层以外层结构的模型参数的改变,降低了当待识别字符发生改变时,重新训练光学字符识别模型工作量。
应该理解的是,虽然如上述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种模型训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的模型训练装置实施例中的具体限定可以参见上文中对于模型训练方法的限定,在此不再赘述。
在一些实施例中,如图4所示,提供了一种模型训练装置,包括:
维度调整模块401,用于根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度;
第一参数调整模块402,用于删除调整后的全连接层的模型参数,保留光学字符识别模型中除调整后的全连接层之外的层结构的模型参数;
第二参数调整模块403,用于基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型;
模型训练模块404,用于基于预设训练样本对模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。
在一些实施例中,在根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度方面,维度调整模块401具体用于:
获取目标图像的标注,标注包括标注框和字符;
遍历标注中的字符,生成待识别字符表;
统计待识别字符表中字符种类的目标数量,并根据目标数量调整光学字符识别模型中全连接层的维度,调整后的全连接层的维度与目标数量相等。
在一些实施例中,维度调整模块401还用于:
对获取的样本图像进行字符检测,得到样本图像的字符区域,并通过标注框对字符区域进行标注;
对标注后字符区域包括的字符进行标注,并基于字符区域和对应的字符形成样本训练集和样本测试集;
基于样本训练集对未训练的光学字符识别模型进行训练,并使用样本测试集对未训练的光学字符识别模型进行测试,当测试结果达到预设的准确率时完成训练,得到光学字符识别模型。
在一些实施例中,在基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型方面,第二参数调整模块403具体用于:
若调整后的全连接层不是线性层,则初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型;或者,
若调整后的全连接层是线性层,且待识别字符表中的字符完全包含于样本训练集,则将待识别字符表中的各字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
在一些实施例中,在基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型方面,第二参数调整模块403具体用于:
若调整后的全连接层是线性层,但待识别字符表中的字符完全不包含于样本训练集,则初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
在一些实施例中,在基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型方面,第二参数调整模块403具体用于:
若调整后的全连接层是线性层,且待识别字符表中有部分字符包含于样本训练集,则将待识别字符表中包含于样本训练集的字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,且初始化待识别字符表中不包含于样本训练集的字符在调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
上述模型训练装置,通过对光学字符识别模型中全连接层的维度和模型参数的调整,以及保留全连接层以外层结构的模型参数,当待识别字符表发生改变时,降低了对光学字符识别模型进行训练的工作量和训练成本。
上述模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于计算机设备中的处理器,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、通信接口及输入/输出接口(Input/Output,简称I/O)。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述的模型训练方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时用于实现以下步骤:
根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度;
删除调整后的全连接层的模型参数,保留光学字符识别模型中除调整后的全连接层之外的层结构的模型参数;
基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型;
基于预设训练样本对模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。
在一些实施例中,在根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度方面,处理器执行计算机程序时具体用于实现以下步骤:
获取目标图像的标注,标注包括标注框和字符;
遍历标注中的字符,生成待识别字符表;
统计待识别字符表中字符种类的目标数量,并根据目标数量调整光学字符识别模型中全连接层的维度,调整后的全连接层的维度与目标数量相等。
在一些实施例中,处理器执行计算机程序时还用于实现以下步骤:
对获取的样本图像进行字符检测,得到样本图像的字符区域,并通过标注框对字符区域进行标注;
对标注后字符区域包括的字符进行标注,并基于字符区域和对应的字符形成样本训练集和样本测试集;
基于样本训练集对未训练的光学字符识别模型进行训练,并使用样本测试集对未训练的光学字符识别模型进行测试,当测试结果达到预设的准确率时完成训练,得到光学字符识别模型。
在一些实施例中,在基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型方面,处理器执行计算机程序时具体用于实现以下步骤:
若调整后的全连接层不是线性层,则初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型;或者,
若调整后的全连接层是线性层,且待识别字符表中的字符完全包含于样本训练集,则将待识别字符表中的各字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
在一些实施例中,在基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型方面,处理器执行计算机程序时具体用于实现以下步骤:
若调整后的全连接层是线性层,但待识别字符表中的字符完全不包含于样本训练集,则初始化调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
在一些实施例中,在基于调整后的全连接层是否为线性层,对调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型方面,处理器执行计算机程序时具体用于实现以下步骤:
若调整后的全连接层是线性层,且待识别字符表中有部分字符包含于样本训练集,则将待识别字符表中包含于样本训练集的字符在调整后的全连接层的模型参数恢复为其在光学字符识别模型中全连接层的模型参数,且初始化待识别字符表中不包含于样本训练集的字符在调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
上述计算机设备,通过对光学字符识别模型中全连接层的维度和模型参数的调整,以及保留全连接层以外层结构的模型参数,当待识别字符表发生改变时,降低了对光学字符识别模型进行训练的工作量和训练成本。
本申请还提供了一种计算机可读存储介质,其内部结构如图6所示,其上存储有计算机程序,计算机程序被处理器执行时实现上述模型训练方法的步骤。
本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述模型训练方法的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(FerroelectricRandom Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(StaticRandom Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种模型训练方法,其特征在于,包括:
根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度;
删除调整后的全连接层的模型参数,保留所述光学字符识别模型中除所述调整后的全连接层之外的层结构的模型参数;
若所述调整后的全连接层是线性层,则继续使用光学字符识别模型中原字符范围内对应的全连接层的模型参数,初始化原字符范围以外对应的全连接层的模型参数;若是非线性层,初始化所述调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型;
基于预设训练样本对所述模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。
2.根据权利要求1所述的方法,其特征在于,所述根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度,包括:
获取目标图像的标注,所述标注包括标注框和字符;
遍历所述标注中的字符,生成待识别字符表;
统计所述待识别字符表中字符种类的目标数量,并根据所述目标数量调整光学字符识别模型中全连接层的维度,所述调整后的全连接层的维度与所述目标数量相等。
3.根据权利要求1所述的方法,其特征在于,所述根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度之前,还包括:
对获取的样本图像进行字符检测,得到所述样本图像的字符区域,并通过标注框对所述字符区域进行标注;
对标注后字符区域包括的字符进行标注,并基于所述字符区域和对应的字符形成样本训练集和样本测试集;
基于所述样本训练集对未训练的光学字符识别模型进行训练,并使用所述样本测试集对未训练的光学字符识别模型进行测试,当测试结果达到预设的准确率时完成训练,得到所述光学字符识别模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述调整后的全连接层是否为线性层,对所述调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型,包括:
若所述调整后的全连接层不是线性层,则初始化所述调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型;或者,
若所述调整后的全连接层是线性层,且所述待识别字符表中的字符完全包含于所述样本训练集,则将所述待识别字符表中的各字符在所述调整后的全连接层的模型参数恢复为其在所述光学字符识别模型中全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
5.根据权利要求4所述的方法,其特征在于,所述基于所述调整后的全连接层是否为线性层,对所述调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型,还包括:
若所述调整后的全连接层是线性层,但所述待识别字符表中的字符完全不包含于所述样本训练集,则初始化所述调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
6.根据权利要求5所述的方法,其特征在于,所述基于所述调整后的全连接层是否为线性层,对所述调整后的全连接层的模型参数进行调整,得到模型参数调整后的光学字符识别模型,还包括:
若所述调整后的全连接层是线性层,且所述待识别字符表中有部分字符包含于所述样本训练集,则将所述待识别字符表中包含于所述样本训练集的字符在所述调整后的全连接层的模型参数恢复为其在所述光学字符识别模型中全连接层的模型参数,且初始化所述待识别字符表中不包含于所述样本训练集的字符在所述调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型。
7.一种模型训练装置,其特征在于,包括:
维度调整模块,用于根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度;
第一参数调整模块,用于删除调整后的全连接层的模型参数,保留所述光学字符识别模型中除所述调整后的全连接层之外的层结构的模型参数;
第二参数调整模块,用于若所述调整后的全连接层是线性层,则继续使用光学字符识别模型中原字符范围内对应的全连接层的模型参数,初始化原字符范围以外对应的全连接层的模型参数;若是非线性层,初始化所述调整后的全连接层的模型参数,得到模型参数调整后的光学字符识别模型;
模型训练模块,用于基于预设训练样本对所述模型参数调整后的光学字符识别模型进行训练,得到训练好的光学字符识别模型。
8.根据权利要求7所述的装置,其特征在于,在根据获取的待识别字符表中字符种类的目标数量,调整光学字符识别模型中全连接层的维度方面,所述维度调整模块具体用于:
获取目标图像的标注,所述标注包括标注框和字符;
遍历所述标注中的字符,生成待识别字符表;
统计所述待识别字符表中字符种类的目标数量,并根据所述目标数量调整光学字符识别模型中全连接层的维度,所述调整后的全连接层的维度与所述目标数量相等。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210711300.5A CN114782960B (zh) | 2022-06-22 | 2022-06-22 | 模型训练方法、装置、计算机设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210711300.5A CN114782960B (zh) | 2022-06-22 | 2022-06-22 | 模型训练方法、装置、计算机设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114782960A CN114782960A (zh) | 2022-07-22 |
CN114782960B true CN114782960B (zh) | 2022-09-02 |
Family
ID=82422349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210711300.5A Active CN114782960B (zh) | 2022-06-22 | 2022-06-22 | 模型训练方法、装置、计算机设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114782960B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116910566B (zh) * | 2023-09-12 | 2024-01-05 | 深圳须弥云图空间科技有限公司 | 一种目标识别模型训练方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909780A (zh) * | 2019-11-14 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 一种图像识别模型训练和图像识别方法、装置及系统 |
CN111435445A (zh) * | 2019-12-24 | 2020-07-21 | 珠海大横琴科技发展有限公司 | 字符识别模型的训练方法及装置、字符识别方法及装置 |
CN113191241A (zh) * | 2021-04-23 | 2021-07-30 | 华为技术有限公司 | 一种模型训练方法及相关设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11995539B2 (en) * | 2017-06-09 | 2024-05-28 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for re-learning trained model |
US10769744B2 (en) * | 2018-10-31 | 2020-09-08 | Kabushiki Kaisha Toshiba | Computer vision system and method |
CN110147721B (zh) * | 2019-04-11 | 2023-04-18 | 创新先进技术有限公司 | 一种三维人脸识别方法、模型训练方法和装置 |
CN112949313A (zh) * | 2019-12-11 | 2021-06-11 | 中移(苏州)软件技术有限公司 | 信息处理模型训练方法、装置、设备及存储介质 |
CN111222545B (zh) * | 2019-12-24 | 2022-04-19 | 西安电子科技大学 | 基于线性规划增量学习的图像分类方法 |
CN113191479B (zh) * | 2020-01-14 | 2024-09-24 | 华为技术有限公司 | 联合学习的方法、系统、节点及存储介质 |
CN113496227A (zh) * | 2020-04-08 | 2021-10-12 | 顺丰科技有限公司 | 一种字符识别模型的训练方法、装置、服务器及存储介质 |
CN112085019A (zh) * | 2020-08-31 | 2020-12-15 | 深圳思谋信息科技有限公司 | 字符识别模型生成系统、方法、装置和计算机设备 |
CN112559784B (zh) * | 2020-11-02 | 2023-07-04 | 浙江智慧视频安防创新中心有限公司 | 基于增量学习的图像分类方法及系统 |
-
2022
- 2022-06-22 CN CN202210711300.5A patent/CN114782960B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909780A (zh) * | 2019-11-14 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 一种图像识别模型训练和图像识别方法、装置及系统 |
CN111435445A (zh) * | 2019-12-24 | 2020-07-21 | 珠海大横琴科技发展有限公司 | 字符识别模型的训练方法及装置、字符识别方法及装置 |
CN113191241A (zh) * | 2021-04-23 | 2021-07-30 | 华为技术有限公司 | 一种模型训练方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114782960A (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108920654B (zh) | 一种问答文本语义匹配的方法和装置 | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN110750523A (zh) | 数据标注方法、系统、计算机设备和存储介质 | |
CN114549913A (zh) | 一种语义分割方法、装置、计算机设备和存储介质 | |
CN114782960B (zh) | 模型训练方法、装置、计算机设备及计算机可读存储介质 | |
CN114841161A (zh) | 事件要素抽取方法、装置、设备、存储介质和程序产品 | |
CN112749737A (zh) | 图像分类方法及装置、电子设备、存储介质 | |
CN116894974A (zh) | 图像分类方法、装置、计算机设备及其存储介质 | |
CN114168787A (zh) | 音乐推荐方法、装置、计算机设备和存储介质 | |
CN117251777A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN116128575A (zh) | 物品推荐方法、装置、计算机设备、存储介质和程序产品 | |
CN114969253A (zh) | 市场主体与政策的匹配方法、装置、计算设备及介质 | |
CN114971892A (zh) | 贷款行为识别方法、装置、计算机设备和存储介质 | |
CN114580791A (zh) | 膨化机工作状态识别方法、装置、计算机设备、存储介质 | |
CN114219184A (zh) | 产品交易数据预测方法、装置、设备、介质和程序产品 | |
EP4007173A1 (en) | Data storage method, and data acquisition method and apparatus therefor | |
CN114358284A (zh) | 一种基于类别信息对神经网络分步训练的方法、装置、介质 | |
CN113535125A (zh) | 金融需求项生成方法及装置 | |
CN107451662A (zh) | 优化样本向量的方法及装置、计算机设备 | |
CN112149836B (zh) | 一种机器学习程序更新方法、装置及设备 | |
CN116881122A (zh) | 测试案例生成方法、装置、设备、存储介质和程序产品 | |
CN116861071A (zh) | 资讯推送方法、装置、计算机设备、存储介质和程序产品 | |
CN116204422A (zh) | 问题分类模型的训练方法、装置、计算机设备和存储介质 | |
CN118053161A (zh) | 卡面信息识别方法、装置、设备、存储介质和程序产品 | |
CN116229326A (zh) | 对象识别方法、装置、计算机设备及其存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |