CN108596180A - 图像中的参数识别、参数识别模型的训练方法及装置 - Google Patents

图像中的参数识别、参数识别模型的训练方法及装置 Download PDF

Info

Publication number
CN108596180A
CN108596180A CN201810312473.3A CN201810312473A CN108596180A CN 108596180 A CN108596180 A CN 108596180A CN 201810312473 A CN201810312473 A CN 201810312473A CN 108596180 A CN108596180 A CN 108596180A
Authority
CN
China
Prior art keywords
character
parameter
image
sample image
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810312473.3A
Other languages
English (en)
Inventor
黄盈
荆彦青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Network Information Technology Co Ltd
Original Assignee
Shenzhen Tencent Network Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Network Information Technology Co Ltd filed Critical Shenzhen Tencent Network Information Technology Co Ltd
Priority to CN201810312473.3A priority Critical patent/CN108596180A/zh
Publication of CN108596180A publication Critical patent/CN108596180A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Abstract

本发明公开了一种图像中的参数识别、参数识别模型的训练方法及装置,其中,所述图像中的参数识别方法包括:获取待识别字符图像;将待识别字符图像输入参数识别模型进行参数识别处理,得到所述待识别字符图像所对应的参数;其中,所述参数识别模型是基于字符样本图像与相应的参数标签进行机器学习训练确定的,所述字符样本图像所对应的参数与所述待识别字符图像所对应的参数属于同一类型的参数。本发明能够准确识别图像中参数。

Description

图像中的参数识别、参数识别模型的训练方法及装置
技术领域
本发明涉及图像信息处理技术领域,尤其涉及一种图像中的参数识别、参数识别模型的训练方法及装置。
背景技术
随着计算机技术的快速发展和电子设备的普及,手机、平板和电脑等电子设备在人们日常的学习、工作和生活中应用日益广泛。与此同时,电子设备上的各种APP(Application,应用程序),尤其是各种游戏APP得到了人们的广泛使用。
目前,在一些应用场景中,例如一些人机对战的游戏APP常常需要训练游戏的内部AI(Artificial Intelligence,人工智能),而训练游戏的内部AI过程中往往需要先获取游戏中的参数。现有的比较常用的参数获取方法是基于图像模板匹配的方式,具体的,可以采集APP参数的字符模板图像;然后,可以通过对待识别字符图像与字符模板图像进行图像匹配处理,选取与待识别字符图像匹配度最高的字符模板图像所对应的参数作为该待识别字符图像的参数。但现有的方法中,需要保证采集的字符模板图像中包含APP的参数的各种形式的全部字符图像,对于没有包含在字符模板图像中的字符图像的参数就无法准确的识别。因此,需要提供更可靠或更有效的方案,以便准确的识别图像中的参数。
发明内容
为了解决现有技术应用在参数识别时出现的识别准确率低的问题,本发明提供了一种图像中的参数识别、参数识别模型的训练方法及装置:
第一方面,本发明提供了一种图像中的参数识别方法,所述方法包括:
获取待识别字符图像;
将所述待识别字符图像输入参数识别模型进行参数识别处理,得到所述待识别字符图像所对应的参数;
其中,所述参数识别模型是基于字符样本图像与相应的参数标签进行机器学习训练确定的,所述字符样本图像所对应的参数与所述待识别字符图像所对应的参数属于同一类型的参数。第二方面提供了一种参数识别系统,所述系统包括:
待识别字符图像获取模块,用于获取待识别字符图像;
参数识别处理模块,用于将所述待识别字符图像输入参数识别模型进行参数识别处理,得到所述待识别字符图像所对应的参数;
其中,所述参数识别模型是基于字符样本图像与相应的参数标签进行机器学习训练确定的,所述字符样本图像所对应的参数与所述待识别字符图像所对应的参数属于同一类型的参数。
第三方面提供了一种参数识别服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的图像中的参数识别方法。
第四方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的图像中的参数识别方法。
第五方面提供了一种参数识别模型的训练方法,所述方法包括:
获取标注有参数标签的字符样本图像;
基于所述字符样本图像,使用预设机器学习模型进行字符识别训练,在字符识别训练中调整所述预设机器学习模型的模型参数至所述预设机器学习模型输出的参数标签与输入的字符样本图像相匹配;
将当前模型参数所对应的机器学习模型作为所述参数识别模型。
第六方面提供了一种参数识别模型的训练装置,所述装置包括:
字符样本图像获取模块,用于获取标注有参数标签的字符样本图像;
模型训练模块,用于基于所述字符样本图像,使用预设机器学习模型进行参数识别训练,在参数识别训练中调整所述预设机器学习模型的模型参数至所述预设机器学习模型输出的参数标签与输入的字符样本图像相匹配,将当前模型参数所对应的机器学习模型作为所述参数识别模型。
第七方面提供了一种训练服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第五方面所述的参数识别模型的训练方法。
第八方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第五方面所述的参数识别模型的训练方法。本发明提供的图像中的参数识别、参数识别模型的训练方法及装置,具有如下技术效果:
本发明能够得到具有高泛化能力的参数识别模型,在利用参数识别模型进行参数识别处理时可以提高对新的字符图像的参数识别适应能力,进而可以大大提高对图像中参数的识别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种参数识别模型的训练方法的流程示意图;
图2是本发明实施例提供的获取标注有参数标签的字符样本图像一种流程示意图;
图3是本发明实施例提供的一种在手机客户端的应用程序运行界面获取字符样本图像的场景示意图;
图4是本发明实施例提供的一种预设机器学习模型的示意图;
图5是本发明实施例提供的一种参数识别模型的应用场景示意图;
图6是本发明实施例提供的一种图像中的参数识别方法的流程示意图;
图7是本发明实施例提供的一种获取待识别字符图像的流程示意图;
图8是本发明实施例提供的另一种获取待识别字符图像的流程示意图;
图9是本发明提供的一种参数识别装置的结构示意图;
图10是本发明实施例提供的待识别字符图像获取模块的一种组成框图;
图11是本发明实施例提供的待识别字符图像获取模块的另一种组成框图;
图12是本发明提供的一种参数识别模型的训练装置的结构示意图;
图13是本发明实施例提供的字符样本图像获取模块的一种组成框图;
图14是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
目前,在一些应用场景中,例如获取游戏APP操作过程中的金币数,里程,击杀数,得分等等参数时,由于这些参数一般都是数字参数,且参数的字体和背景往往不同。在利用现有的基于图像模板匹配的方式获取图像中数字参数过程中,需要采集0-9十个数字的不同字体和不同背景的数字参数的字符模板图像,而十个数字的不同字体或不同背景的数字参数的字符模板图像数量庞大,无法做到全部采集。因此,对于字符模板图像中没有包含的字体或背景的字符图像就无法准确的识别出相应的参数,这种方法对参数的识别完全依赖字符模板图像的采集,对于新出现的不同字体或不同背景的字符图像的识别适应能力差,导致在实际应用中对图像中的参数识别准确率低。
针对上述基于图像模板匹配的参数识别方法所存在的问题,可以采用机器学习训练参数识别模型,利用神经网络机器学习训练得到的参数识别模型具有高泛化能力,以便后续利用参数识别模型进行参数识别处理时可以提高对新的字符图像的参数识别适应能力,进而可以提高对图像中参数的识别准确率。
以下先具体介绍神经网络机器学习训练参数识别模型的实现过程:
图1是本发明实施例提供的一种参数识别模型的训练方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图1所示,所述方法可以包括:
S101:获取标注有参数标签的字符样本图像。
在实际由于中,在进行神经网络机器学习之前,可以先确定训练数据,具体的,本发明实施例中,可以获取标注有参数标签的字符样本图像作为训练数据。
具体的,本发明实施例中,所述字符样本图像可以包括包含有相应参数字符的图像。所述参数标签可以作为相应的参数的标识,在一些实施例中,所述参数标签可以为相应的参数。
在一个具体的实施例中,如图2所示,图2是本发明实施例提供的获取标注有参数标签的字符样本图像一种流程示意图,具体的。可以包括:
S201:采集字符样本图像。
本发明实施例中,可以针对需要识别参数的一个或多个应用程序采集相应的字符样本图像。以数字参数为例,考虑到不同字体或者不同背景的数字参数的字符图像之间差异较大。具体的实施例中,可以采集实际应用中的大量不同字体和不同背景的数据参数的字符样本图像。
此外,需要说明的是,本发明实施例中字符样本图像并不仅限于从应用程序中采集,在实际应用中,还可以结合实际应用需求从其他途径采集。
在一个具体的实施例中,在应用程序运行操作过程中,可以在相应的客户端通过在抓取固定位置的字符的方式来获取字符样本图像。如图3所示,以手机客户端中某一游戏程序操作过程为例,图3中的参数可以包括得分参数和距离参数。具体的,在采集字符样本图像可以直接抓取得分参数和距离参数所在区域的字符图像,得到的字符样本图像可以包括:宋体的白底黑字的数字参数3、4和6的三个字符图像,以及罗马体的黑底白字的数字参数5和3的两个字符图像。
此外,需要说明的是,上述仅仅是采集字符样本图像的一种示例,在实际应用中,采集的方式、字符样本图像的形式并不以上述为限。
S203:创建字符模板图像,所述字符模板图像与参数标签相对应。
本说明书实施例中,所述字符模板图像可以与相应的参数标签相对应的字符图像。以数字参数为例,可以将0-9中每个参数的多种字体数字的字符图像作为字符模板图像。
在一些实施例中,所述字符模板图像中还可以包括多种背景的字符图像。
S205:计算所述字符样本图像与所述字符模板图像之间的匹配度。
本说明书实施例中,两幅图像之间的匹配度可以包括按照一定规则将图像之间的相似程度量化后的数值。
在一个具体的实施例中,两幅图像之间的匹配度可以包括像素匹配度,即图像像素之间的相似程度的量化值,相应的,所述计算字符样本图像与字符模板图像之间的匹配度可以包括:
计算所述字符样本图像与所述字符模板图像之间的像素匹配度。
在另一个具体的实施例中,两幅图像之间的匹配度可以包括特征点匹配度,即图像特征点之间的相似程度的量化值。具体的,计算图像特征点之间的相似程度的量化值时可以提取图像特征点的特征向量,然后,通过计算特征向量之间的距离来判断两幅图像之间的匹配度。具体的,这里的距离可以包括但不限于欧氏距离、余弦距离、曼哈顿距离等。相应的,所述计算字符样本图像与字符模板图像之间的匹配度可以包括:
计算所述字符样本图像与所述字符模板图像之间的特征点匹配度。
此外,需要说明的是,本发明实施例中,两幅图像之间的匹配度可以包括但不限于像素匹配度和/或特征点匹配度,在实际应用中,还可以包括其他能够表征两幅图像相似程度的量化值。
S207:选取与字符样本图像的匹配度最高的字符模板图像所对应的参数标签作为相应的字符样本图像的参数标签。
由以上实施例提供的技术方案可见,本发明实施例中通过基于字符样本图像与字符模板图像之间的匹配处理,可以实现快速为字符样本图像标注标签,与传统训练数据采用的人工标注标签的方式相比,可以有效提高标签标注的处理效率。
在另一些实施例中,考虑到通过图像之间的匹配来实现为字符样本图像进行标注的方式中,每个参数的字符模板图像的形式有限,在与字符样本图像进行匹配时,存在一定的误标情况。因此,在上述实施例中确定字符样本图像的参数标签之后,还可以对字符样本图像的参数标签进行纠错处理,以提高训练数据的可靠性。具体的实施例中,为了提高效率,在进行纠错处理时,可以选取参数标签所对应的字符模板图像与字符样本图像之间匹配率低于一定阈值的字符样本图像进行人工纠错处理。
S103:基于所述字符样本图像,使用预设机器学习模型进行字符识别训练,在字符识别训练中调整所述预设机器学习模型的模型参数至所述预设机器学习模型输出的参数标签与输入的字符样本图像相匹配。
本说明书实施例中,所述模型参数可以包括训练过程中学习到的模型参数(权重)。在一个具体的实施例中,本发明实施例中,所述预设机器学习模型,可以包括两层卷积层、两层池化层、两层全两层和一层输出层的神经网络机器学习模型。
具体的,所述卷积层可以对所述输入的字符图像进行卷积处理,实现对字符图像的特征提取。在一个具体的实施例中,输入的字符样本图像可以为28x28像素的数字图像。
具体的,所述池化层可以对上一层的输出进行降采样操作,即返回采样窗口中最大值作为降采样的输出。一方面可以使图像变小,简化计算复杂度;另一方面可以进行特征压缩,提取主要特征。在一个具体的实施例中,所述采样窗口均设置为2*2,采样间隔可以为2像素。
具体的,所述全连接层可以作为上下两层的节点之间的连接层,将上下两层所得到的各节点数据建立连接关系,将输出值送给分类器(如softmax分类器)。
在上述的预设机器学习模型中,每一层输出的都是上一层输入的线性函数,考虑到在实际应用中数据往往不是线性可分的,可以通过增加激活函数的方式引入非线性因数。即增加线性校正层,以激活函数Relu为例(rectified linear unit,校正线性单元),具体的,Relu层(线性校正层)是对上一层数据结果进行修正的层,可以将上一层小于0的输入全部变成0后输出,大于0的输出不变。
具体的,所述输出层可以对字符样本图像进行参数识别,输出相应的参数标签。在一个具体的实施例中,输出层可以采用softmax函数进行参数标签输出,Softmax函数中包含的是一个非线性分类器,对字符样本图像进行字符分类器训练(即识别出字符样本图像中字符所对应的参数标签)。具体的,可以确定所述字符样本图像与各个参数标签匹配的概率值。将与字符样本图像匹配的概率值最高的参数标签确定为所述字符样本图像的参数标签。
此外,需要说明的是,本发明实施例所述机器学习模型并不仅限于上述的神经网络机器学习模型,在实际应用中,还可以包括其他机器学习模型,例如决策树机器学习模型等,本发明实施例并不以上述为限。
在一个具体的实施例中,如图4所示,所述预设机器学习模型可以被设置成,包括:
第一卷积层;以及与所述第一卷积层相连的第一池化层;以及与所述第一池化层相连的第二卷积层;以及与所述第二卷积层相连的第二池化层;以及第二池化层相连接的第一全连接层;以及与所述第一全连接层相连的第二全连接层;以及与所述第一全连接层相连的线性校正层;以及与所述第二全连接层连接的输出层的神经网络机器学习模型。
在上述的预设机器学习模型中,每一层输出的都是上一层输入的线性函数,考虑到在实际应用中数据往往不是线性可分的,可以通过增加激活函数的方式引入非线性因数。以激活函数Relu为例(rectified linear unit,校正线性单元),具体的,Relu是对上一层数据结果进行修正的层,可以将上一层小于0的输入全部变成0后输出,大于0的输出不变。
此外,需要说明的是,上述仅仅是本发明进行参数识别模型训练所采用的预设机器学习模型的一种示例,在实际应用中,还可以结合实际应用需求包括更多或更少的层。
S105:将当前模型参数所对应的机器学习模型作为所述参数识别模型。
如图5所示,图5是本发明实施例提供的一种参数识别模型的应用场景示意图。图5中训练数据为标注有参数标签的字符样本图像,相应的,后续训练出来的参数识别模型可以对新的字符图像(该新的字符图像所对应的参数与字符样本图像所对应的参数为同一类型,例如都为数字)进行参数标签的识别。
由以上本发明实施例可见,本发明以标注有相应参数标签的字符样本图像作为训练数据,通过机器学习,训练出的参数识别模型可以识别与训练数据同一类型的字符图像的参数标签。在实际应用中,对于需要进行同一类型的参数识别的多种应用程序有良好的泛化性。
基于上述的参数识别模型,以下介绍本说明书一种图像中的参数识别方法的一种具体实施例。图6是本发明实施例提供的一种图像中的参数识别方法的流程示意图,本发明提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图6所示,所述方法可以包括:
S601:获取待识别字符图像。
本发明实施例中,所述待识别字符图像可以包括需要进行的参数识别的图像。
在实际应用中,参数的字符往往位于一幅图像的某一区域,而图像的其它区域往往包含很多其它的图像信息,为了减少图像中其他图像信息对后续参数识别时的干扰,本发明实施例中可以从一幅图像的预设字符区域来获取待识别的字符图像。
在一些实施例中,如图7所示,图7是本发明实施例提供的一种获取待识别字符图像的流程示意图,具体的,可以包括:
S701:采集待识别图像。
所述待识别图像可以包括截取的应用程序运行过程中的图像。以图3中所示的场景为例,可以将应用程序运行中的图像作为待识别图像。
另外,所述待识别图像也可以是其他途径获取的需要识别参数的图像,并不仅限于应用程序中的图像。
S703:从所述待识别图像的预设字符区域获取字符图像。
本发明实施例中,所述预设字符区域可以包括预先设置的待识别参数的字符所在位置的一定范围内。以图3为例,所述预设字符区域可以为得分参数和距离参数所在的方框区域内。
结合图3,以得分参数为例,在获取字符图像时,可以根据字符之间的位置间隔,划分字符,得到宋体的白底黑字的数字参数3、4和6的三个字符图像。
S705:计算所述字符图像与字符模板图像之间的匹配度。
具体的,这里字符图像与字符模板图像之间的匹配度可以参见上述两幅图像之间匹配度的相关描述,在此不再赘述。
S707:选取与字符模板图像的匹配度大于等于第一阈值的字符图像作为所述待识别字符图像。
具体的,这里的第一阈值可以结合实际应用中对字符图像获取的精确度设定。一般的,所述第一阈值越大,字符图像获取的精确度越高。
在另一写实施例中,如图8所示,图8是本发明实施例提供的另一种获取待识别字符图像的流程示意图,具体的,可以包括:
S801:采集待识别图像。
具体的,这里待识别图像的采集可以参见上述相关描述,在此不再赘述。
S803:在所述待识别图像的预设字符区域搜寻字符,确定所述字符的字符轮廓信息。
本发明实施例中,所述字符的字符轮廓信息至少可以包括下述之一:
字符大小信息、字符位置信息。
具体的,所述预设字符区域可以包括预先设置的待识别参数的字符所在位置的一定范围内。
S805:从搜寻到的字符中选取字符轮廓信息与字符模板的字符轮廓信息相匹配的字符。
在实际应用中,特别是在动态运行的应用程序中采集的待识别图像,即时在一个较小范围内获取字符图像,也常常存在不是参数的字符图像。因此,可以从搜寻到的字符中选取字符轮廓信息与字符模板的字符轮廓信息相匹配的字符。
具体的,这里的字符模板可以为待识别参数所对应的字符模板。另外,字符轮廓信息的相匹配可以包括表征字符的字符轮廓信息之间的差异程度的差异度小于等于设定的第二阈值。
具体的,这里的第二阈值可以结合实际应用中对字符图像获取的精确度设定。一般的,所述第二阈值越小,字符图像获取的精确度越高。
S807:生成包含所述相匹配的字符的图像,将所述包含所述相匹配的字符的图像作为所述待识别字符图像。
在实际应用中,上述确定图像中某一区域的字符图像的处理过程还可以结合OpenCV(open source computer vision library,开放源代码计算机视觉类库)提供的findContours函数在指定范围内(预设字符区域)搜寻字符的大小和位置信息。然后,根据需要被检测的字符的大小和位置信息(字符模板的字符轮廓信息),删除位置不合适,或过大或过小的字符,输出符合的字符图像(包含所述相匹配的字符的图像)。
由上述实施例可见,通过字符的字符轮廓信息来确定字符图像,可以动态的获取参数的字符位置,对实际用于中应用程序因为客户端设备分辨率不同而产生的变化,可以避免因分辨率问题导致搜索到的字符与字符模板之间差异。
S603:将所述待识别字符图像输入参数识别模型进行参数识别处理,得到所述待识别字符图像所对应的参数。其中,所述参数识别模型是基于字符样本图像与相应的参数标签进行机器学习训练确定的,所述字符样本图像所对应的参数与所述待识别字符图像所对应的参数属于同一类型的参数。
在实际应用中,考虑到由机器学习训练得到的参数识别模型在进行参数识别时,一般会对输入图像的大小由一定的设置,相应的,本发明实施例中,输入参数识别模型的待识别字符图像的大小与参数识别模型要求的输入图像大小一致。
由以上本发明实施例提供的技术方案可见,本发明实施例基于与待识别字符图像所对应的参数属于同一类型的参数的字符样本图像与相应的参数标签的机器学习训练,得到具有高泛化能力的参数识别模型,在利用参数识别模型进行参数识别处理时可以提高对新的字符图像的参数识别适应能力,进而可以大大提高对图像中参数的识别准确率。
本发明实施例还提供了一种参数识别装置,如图9所示,图9是本发明提供的一种参数识别装置的结构示意图,具体的,所述装置可以包括:
待识别字符图像获取模块910,可以用于获取待识别字符图像;
参数识别处理模块920,可以用于将所述待识别字符图像输入参数识别模型进行参数识别处理,得到所述待识别字符图像所对应的参数;
其中,所述参数识别模型是基于字符样本图像与相应的参数标签进行机器学习训练确定的,所述字符样本图像所对应的参数与所述待识别字符图像所对应的参数属于同一类型的参数。
另一实施例中,如图10所示,所述待识别字符图像获取模块910可以包括:
第一待识别图像采集单元9110,可以用于采集待识别图像;
字符轮廓信息确定单元9120,可以用于在所述待识别图像的预设字符区域搜寻字符,确定所述字符的字符轮廓信息;
匹配单元9130,可以用于从搜寻到的字符中选取字符轮廓信息与字符模板的字符轮廓信息相匹配的字符;
第一待识别字符图像确定单元9140,可以用于生成包含所述相匹配的字符的图像,将所述包含所述相匹配的字符的图像作为所述待识别字符图像;
所述字符的字符轮廓信息至少可以包括下述之一:
字符大小信息、字符位置信息。
另一实施例中,如图11所示,所述待识别字符图像获取模块910可以包括:
第二待识别图像采集单元9150,可以用于采集待识别图像;
字符图像获取单元9160,可以用于从所述待识别图像的预设字符区域获取字符图像;
匹配度计算单元9170,可以用于计算所述字符图像与字符模板图像之间的匹配度;
第二待识别字符图像确定单元9180,可以用于选取与字符模板图像的匹配度大于等于第一阈值的字符图像作为所述待识别字符图像。
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
本发明实施例还提供了一种参数识别模型的训练装置,如图12所示,图12是本发明提供的一种参数识别模型的训练装置的结构示意图,具体的,所述装置可以包括:
字符样本图像获取模块1210,可以用于获取标注有参数标签的字符样本图像;
模型训练模块1220,可以用于基于所述字符样本图像,使用预设机器学习模型进行参数识别训练,在参数识别训练中调整所述预设机器学习模型的模型参数至所述预设机器学习模型输出的参数标签与输入的字符样本图像相匹配,将当前模型参数所对应的机器学习模型作为所述参数识别模型。
另一实施例中,如图13所示,所述字符样本图像获取模块1210可以包括:
字符样本图像采集单元1211,可以用于采集字符样本图像;
字符模板图像创建单元1213,可以用于创建字符模板图像,所述字符模板图像与参数标签相对应;
第一匹配度计算单元1215,可以用于计算所述字符样本图像与所述字符模板图像之间的匹配度;
参数标签确定单元1217,可以用于选取与字符样本图像的匹配度最高的字符模板图像所对应的参数标签作为相应的字符样本图像的参数标签。
另一实施例中,所述第一匹配度计算单元1215可以包括:
第一匹配度计算单元,可以用于计算所述字符样本图像与所述字符模板图像之间的像素匹配度;
和/或,
第二匹配度计算单元,可以用于计算所述字符样本图像与所述字符模板图像之间的特征点匹配度。
另一实施例中,所述预设机器学习模型可以被设置成,包括:
第一卷积层;以及与所述第一卷积层相连的第一池化层;以及与所述第一池化层相连的第二卷积层;以及与所述第二卷积层相连的第二池化层;以及第二池化层相连接的第一全连接层;以及与所述第一全连接层相连的第二全连接层的神经网络机器学习模型。
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
本发明实施例提供了一种参数识别服务器,该参数识别服务器包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例所提供的图像中的参数识别方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本发明实施例还提供了一种服务器的结构示意图,请参阅图14,该服务器1400用于实施上述实施例中提供的图像中的参数识别方法,具体来讲,所述服务器结构可以包括上述参数识别装置。该服务器1400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1410(例如,一个或一个以上处理器)和存储器1430,一个或一个以上存储应用程序1423或数据1422的存储介质1420(例如一个或一个以上海量存储设备)。其中,存储器1430和存储介质1420可以是短暂存储或持久存储。存储在存储介质1420的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1410可以设置为与存储介质1420通信,在服务器1400上执行存储介质1420中的一系列指令操作。服务器1400还可以包括一个或一个以上电源1460,一个或一个以上有线或无线网络接口1450,一个或一个以上输入输出接口1440,和/或,一个或一个以上操作系统1421,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本发明的实施例还提供了一种存储介质,所述存储介质可设置于服务器之中以保存用于实现方法实施例中一种图像中的参数识别方法相关的至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的图像中的参数识别方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提供了一种训练服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述方法实施例提供的参数识别模型的训练方法。
本发明的实施例还提供了一种存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述方法实施例提供的参数识别模型的训练方法。
由上述本发明提供的图像中的参数识别、参数识别模型的训练方法、装置、服务器或存储介质的实施例可见,本发明中基于与待识别字符图像所对应的参数属于同一类型的参数的字符样本图像与相应的参数标签的机器学习训练,得到具有高泛化能力的参数识别模型,在利用参数识别模型进行参数识别处理时可以提高对新的字符图像的参数识别适应能力。与现有技术相比,可以大大提高对图像中参数的识别准确率。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种图像中的参数识别方法,其特征在于,所述方法包括:
获取待识别字符图像;
将所述待识别字符图像输入参数识别模型进行参数识别处理,得到所述待识别字符图像所对应的参数;
其中,所述参数识别模型是基于字符样本图像与相应的参数标签进行机器学习训练确定的,所述字符样本图像所对应的参数与所述待识别字符图像所对应的参数属于同一类型的参数。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别字符图像包括:
采集待识别图像;
在所述待识别图像的预设字符区域搜寻字符,确定所述字符的字符轮廓信息;
从搜寻到的字符中选取字符轮廓信息与字符模板的字符轮廓信息相匹配的字符;
生成包含所述相匹配的字符的图像,将所述包含所述相匹配的字符的图像作为所述待识别字符图像;
所述字符的字符轮廓信息至少包括下述之一:
字符大小信息、字符位置信息。
3.根据权利要求1所述的方法,其特征在于,所述获取待识别字符图像包括:
采集待识别图像;
从所述待识别图像的预设字符区域获取字符图像;
计算所述字符图像与字符模板图像之间的匹配度;
选取与字符模板图像的匹配度大于等于第一阈值的字符图像作为所述待识别字符图像。
4.一种参数识别模型的训练方法,其特征在于,所述方法包括:
获取标注有参数标签的字符样本图像;
基于所述字符样本图像,使用预设机器学习模型进行字符识别训练,在字符识别训练中调整所述预设机器学习模型的模型参数至所述预设机器学习模型输出的参数标签与输入的字符样本图像相匹配;
将当前模型参数所对应的机器学习模型作为所述参数识别模型。
5.根据权利要求4所述的方法,其特征在于,所述获取标注有参数标签的字符样本图像包括:
采集字符样本图像;
创建字符模板图像,所述字符模板图像与参数标签相对应;
计算所述字符样本图像与所述字符模板图像之间的匹配度;
选取与字符样本图像的匹配度最高的字符模板图像所对应的参数标签作为相应的字符样本图像的参数标签。
6.根据权利要求5所述的方法,其特征在于,所述计算所述字符样本图像与所述字符模板图像之间的匹配度包括:
计算所述字符样本图像与所述字符模板图像之间的像素匹配度;
和/或,
计算所述字符样本图像与所述字符模板图像之间的特征点匹配度。
7.根据权利要求4至6任一所述的方法,其特征在于,所述预设机器学习模型被设置成,包括:
第一卷积层;以及与所述第一卷积层相连的第一池化层;以及与所述第一池化层相连的第二卷积层;以及与所述第二卷积层相连的第二池化层;以及第二池化层相连接的第一全连接层;以及与所述第一全连接层相连的第二全连接层;以及与所述第一全连接层相连的线性校正层;以及与所述第二全连接层连接的输出层的神经网络机器学习模型。
8.一种图像中的参数识别装置,其特征在于,所述装置包括:
待识别字符图像获取模块,用于获取待识别字符图像;
参数识别处理模块,用于将所述待识别字符图像输入参数识别模型进行参数识别处理,得到所述待识别字符图像所对应的参数;
其中,所述参数识别模型是基于字符样本图像与相应的参数标签进行机器学习训练确定的,所述字符样本图像所对应的参数与所述待识别字符图像所对应的参数属于同一类型的参数。
9.根据权利要求8所述的装置,其特征在于,所述待识别字符图像获取模块包括:
第一待识别图像采集单元,用于采集待识别图像;
字符轮廓信息确定单元,用于在所述待识别图像的预设字符区域搜寻字符,确定所述字符的字符轮廓信息;
匹配单元,用于从搜寻到的字符中选取字符轮廓信息与字符模板的字符轮廓信息相匹配的字符;
第一待识别字符图像确定单元,用于生成包含所述相匹配的字符的图像,将所述包含所述相匹配的字符的图像作为所述待识别字符图像;
所述字符的字符轮廓信息至少包括下述之一:
字符大小信息、字符位置信息。
10.根据权利要求8所述的装置,其特征在于,所述待识别字符图像获取模块包括:
第二待识别图像采集单元,用于采集待识别图像;
字符图像获取单元,用于从所述待识别图像的预设字符区域获取字符图像;
匹配度计算单元,用于计算所述字符图像与字符模板图像之间的匹配度;
第二待识别字符图像确定单元,用于选取与字符模板图像的匹配度大于等于第一阈值的字符图像作为所述待识别字符图像。
11.一种参数识别模型的训练装置,其特征在于,所述装置包括:
字符样本图像获取模块,用于获取标注有参数标签的字符样本图像;
模型训练模块,用于基于所述字符样本图像,使用预设机器学习模型进行参数识别训练,在参数识别训练中调整所述预设机器学习模型的模型参数至所述预设机器学习模型输出的参数标签与输入的字符样本图像相匹配,将当前模型参数所对应的机器学习模型作为所述参数识别模型。
12.根据权利要求11所述的装置,其特征在于,所述字符样本图像获取模块包括:
字符样本图像采集单元,用于采集字符样本图像;
字符模板图像创建单元,用于创建字符模板图像,所述字符模板图像与参数标签相对应;
第一匹配度计算单元,用于计算所述字符样本图像与所述字符模板图像之间的匹配度;
参数标签确定单元,用于选取与字符样本图像的匹配度最高的字符模板图像所对应的参数标签作为相应的字符样本图像的参数标签。
13.根据权利要求12所述的装置,其特征在于,所述第一匹配度计算单元包括:
第一匹配度计算单元,用于计算所述字符样本图像与所述字符模板图像之间的像素匹配度;
和/或,
第二匹配度计算单元,用于计算所述字符样本图像与所述字符模板图像之间的特征点匹配度。
14.根据权利要求11至13任一所述的装置,其特征在于,所述预设机器学习模型被设置成,包括:
第一卷积层;以及与所述第一卷积层相连的第一池化层;以及与所述第一池化层相连的第二卷积层;以及与所述第二卷积层相连的第二池化层;以及第二池化层相连接的第一全连接层;以及与所述第一全连接层相连的第二全连接层;以及与所述第一全连接层相连的线性校正层;以及与所述第二全连接层连接的输出层的神经网络机器学习模型。
15.一种参数识别服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至3任一所述的图像中的参数识别方法。
CN201810312473.3A 2018-04-09 2018-04-09 图像中的参数识别、参数识别模型的训练方法及装置 Pending CN108596180A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810312473.3A CN108596180A (zh) 2018-04-09 2018-04-09 图像中的参数识别、参数识别模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810312473.3A CN108596180A (zh) 2018-04-09 2018-04-09 图像中的参数识别、参数识别模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN108596180A true CN108596180A (zh) 2018-09-28

Family

ID=63621193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810312473.3A Pending CN108596180A (zh) 2018-04-09 2018-04-09 图像中的参数识别、参数识别模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN108596180A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685100A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 字符识别方法、服务器及计算机可读存储介质
CN109785303A (zh) * 2018-12-28 2019-05-21 上海联影智能医疗科技有限公司 肋骨标记方法、装置、设备以及图像分割模型的训练方法
CN109871847A (zh) * 2019-03-13 2019-06-11 厦门商集网络科技有限责任公司 一种ocr识别方法及终端
CN110363117A (zh) * 2019-06-28 2019-10-22 深圳数位传媒科技有限公司 一种对加密后的随机编码字符文件进行解析的方法及装置
CN110503105A (zh) * 2019-09-02 2019-11-26 苏州美能华智能科技有限公司 字符识别方法、训练数据获取方法、装置和介质
WO2020088338A1 (zh) * 2018-10-30 2020-05-07 杭州海康威视数字技术股份有限公司 一种建立识别模型的方法及装置
TWI697795B (zh) * 2019-02-12 2020-07-01 緯創資通股份有限公司 資料擷取方法及其系統
CN111435424A (zh) * 2019-01-14 2020-07-21 北京京东尚科信息技术有限公司 一种图像处理方法和设备
WO2020224118A1 (zh) * 2019-05-05 2020-11-12 平安科技(深圳)有限公司 基于图片转换的病灶判断方法、装置、计算机设备
CN112801087A (zh) * 2019-11-13 2021-05-14 广东技术师范大学 一种基于自适应参数调整的智能卡表面字符识别的方法
CN114444608A (zh) * 2022-02-08 2022-05-06 中国电信股份有限公司 数据集质量评估方法及装置、电子设备及存储介质
CN116436974A (zh) * 2023-06-15 2023-07-14 国能日新科技股份有限公司 一种数据传输方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982349A (zh) * 2012-11-09 2013-03-20 深圳市捷顺科技实业股份有限公司 一种图像识别方法及装置
CN104217203A (zh) * 2013-06-03 2014-12-17 支付宝(中国)网络技术有限公司 复杂背景卡面信息识别方法及系统
CN106611174A (zh) * 2016-12-29 2017-05-03 成都数联铭品科技有限公司 一种非常见字体的ocr识别方法
CN106845530A (zh) * 2016-12-30 2017-06-13 百度在线网络技术(北京)有限公司 字符检测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982349A (zh) * 2012-11-09 2013-03-20 深圳市捷顺科技实业股份有限公司 一种图像识别方法及装置
CN104217203A (zh) * 2013-06-03 2014-12-17 支付宝(中国)网络技术有限公司 复杂背景卡面信息识别方法及系统
CN106611174A (zh) * 2016-12-29 2017-05-03 成都数联铭品科技有限公司 一种非常见字体的ocr识别方法
CN106845530A (zh) * 2016-12-30 2017-06-13 百度在线网络技术(北京)有限公司 字符检测方法和装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020088338A1 (zh) * 2018-10-30 2020-05-07 杭州海康威视数字技术股份有限公司 一种建立识别模型的方法及装置
CN109685100A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 字符识别方法、服务器及计算机可读存储介质
WO2020098250A1 (zh) * 2018-11-12 2020-05-22 平安科技(深圳)有限公司 字符识别方法、服务器及计算机可读存储介质
CN109785303A (zh) * 2018-12-28 2019-05-21 上海联影智能医疗科技有限公司 肋骨标记方法、装置、设备以及图像分割模型的训练方法
CN109785303B (zh) * 2018-12-28 2020-12-11 上海联影智能医疗科技有限公司 肋骨标记方法、装置、设备以及图像分割模型的训练方法
CN111435424A (zh) * 2019-01-14 2020-07-21 北京京东尚科信息技术有限公司 一种图像处理方法和设备
US11062171B2 (en) 2019-02-12 2021-07-13 Wistron Corp. Data capturing method and system thereof
TWI697795B (zh) * 2019-02-12 2020-07-01 緯創資通股份有限公司 資料擷取方法及其系統
CN111553340A (zh) * 2019-02-12 2020-08-18 昆山纬绩资通有限公司 数据撷取方法及其系统
CN109871847A (zh) * 2019-03-13 2019-06-11 厦门商集网络科技有限责任公司 一种ocr识别方法及终端
WO2020224118A1 (zh) * 2019-05-05 2020-11-12 平安科技(深圳)有限公司 基于图片转换的病灶判断方法、装置、计算机设备
CN110363117A (zh) * 2019-06-28 2019-10-22 深圳数位传媒科技有限公司 一种对加密后的随机编码字符文件进行解析的方法及装置
CN110503105A (zh) * 2019-09-02 2019-11-26 苏州美能华智能科技有限公司 字符识别方法、训练数据获取方法、装置和介质
CN112801087A (zh) * 2019-11-13 2021-05-14 广东技术师范大学 一种基于自适应参数调整的智能卡表面字符识别的方法
CN114444608A (zh) * 2022-02-08 2022-05-06 中国电信股份有限公司 数据集质量评估方法及装置、电子设备及存储介质
CN114444608B (zh) * 2022-02-08 2024-03-29 中国电信股份有限公司 数据集质量评估方法及装置、电子设备及存储介质
CN116436974A (zh) * 2023-06-15 2023-07-14 国能日新科技股份有限公司 一种数据传输方法及系统
CN116436974B (zh) * 2023-06-15 2023-08-11 国能日新科技股份有限公司 一种数据传输方法及系统

Similar Documents

Publication Publication Date Title
CN108596180A (zh) 图像中的参数识别、参数识别模型的训练方法及装置
Bartz et al. STN-OCR: A single neural network for text detection and text recognition
Bartz et al. See: towards semi-supervised end-to-end scene text recognition
Singh et al. Hide-and-seek: A data augmentation technique for weakly-supervised localization and beyond
CN109583325B (zh) 人脸样本图片标注方法、装置、计算机设备及存储介质
Goodfellow et al. Multi-digit number recognition from street view imagery using deep convolutional neural networks
Xiao et al. Deep salient object detection with dense connections and distraction diagnosis
CN109492643A (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN111709406B (zh) 文本行识别方法及装置、可读存储介质、电子设备
CN110598686B (zh) 发票的识别方法、系统、电子设备和介质
CN109902662B (zh) 一种行人重识别方法、系统、装置和存储介质
CN107368827A (zh) 字符识别方法及装置、用户设备、服务器
Lin et al. Live Face Verification with Multiple Instantialized Local Homographic Parameterization.
Paul et al. Rethinking generalization in american sign language prediction for edge devices with extremely low memory footprint
CN112966685B (zh) 用于场景文本识别的攻击网络训练方法、装置及相关设备
CN106067019A (zh) 针对图像进行文字识别的方法及装置
Liu et al. Robust long-term tracking via instance-specific proposals
CN111680753A (zh) 一种数据标注方法、装置、电子设备及存储介质
CN113822264A (zh) 一种文本识别方法、装置、计算机设备和存储介质
CN107786867A (zh) 基于深度学习架构的图像辨识方法及系统
CN109063720A (zh) 手写字训练样本获取方法、装置、计算机设备及存储介质
Nguyen et al. Towards real-time smile detection based on faster region convolutional neural network
CN110414622B (zh) 基于半监督学习的分类器训练方法及装置
CN113420763B (zh) 文本图像处理方法、装置、电子设备及可读存储介质
CN114639150A (zh) 情绪识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180928

RJ01 Rejection of invention patent application after publication