WO2019232870A1

WO2019232870A1 - 手写字训练样本获取方法、装置、计算机设备及存储介质

Info

Publication number: WO2019232870A1
Application number: PCT/CN2018/094345
Authority: WO
Inventors: 吴启; 周罡
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-06-04
Filing date: 2018-07-03
Publication date: 2019-12-12
Also published as: CN109063720A

Abstract

本申请公开了手写字训练样本获取方法、装置、计算机设备及存储介质。该方法包括：获取原始图像，原始图像包括手写字和背景图像；对原始图像进行预处理，获取有效图像；采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像，获取包括手写字的目标图像；采用垂直投影方法对目标图像进行单字体切割，获取单字体图像；将单字体图像输入到目标手写字识别模型中进行识别，当单字体图像的识别概率大于预设概率时，则获取单字体图像对应的识别结果；基于识别结果查询语义库，获取单字体图像对应的目标汉字；将单字体图像和对应的目标汉字关联，获取手写字训练样本。该方法可以获取手写字训练样本过程简单方便，提高模型训练的效率。

Description

手写字训练样本获取方法、装置、计算机设备及存储介质

本申请以2018年6月4日提交的申请号为201810564731.7，名称为“手写字训练样本获取方法、装置、计算机设备及存储介质”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及手写字识别领域，尤其涉及一种手写字训练样本获取方法、装置、计算机设备及存储介质。

背景技术

在手写字识别过程中，通常需要采用预先训练好的手写字识别模型进行识别，以获取识别结果。当前手写字识别模型通常需要采用人工手写的训练样本训练该手写字识别模型。这种人工手写的训练样本需人工书写并进行人工标注，每个人的书写习惯不相同，在手写字数量庞大的情况下，采用人工标注训练样本效率低，并且数量有限，影响手写字识别模型的训练效率和准确性。

发明内容

基于此，有必要针对上述技术问题，提供一种方便后续模型训练时直接调用手写字训练样本，提高模型训练的效率和准确性的手写字训练样本获取方法、装置、计算机设备及存储介质。

一种手写字训练样本获取方法，包括：

获取原始图像，所述原始图像包括手写字和背景图像；

对所述原始图像进行预处理，获取有效图像；

采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像；

采用垂直投影方法对所述目标图像进行单字体切割，获取单字体图像；

将所述单字体图像输入到目标手写字识别模型中进行识别，当所述单字体图像的识别概率大于预设概率时，则获取所述单字体图像对应的识别结果；

基于所述识别结果查询语义库，获取所述单字体图像对应的目标汉字；

将所述单字体图像和对应的目标汉字关联，获取手写字训练样本。

一种手写字训练样本获取装置，包括：

原始图像获取模块，用于获取原始图像，所述原始图像包括手写字和背景图像；

有效图像获取模块，用于对所述原始图像进行预处理，获取有效图像；

目标图像获取模块，用于采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像；

单字体图像获取模块，用于采用垂直投影方法对所述目标图像进行单字体切割，获取单字体图像；

识别结果获取模块，用于将所述单字体图像输入到目标手写字识别模型中进行识别，当所述单字体图像的识别概率大于预设概率时，则获取所述单字体图像对应的识别结果；

目标汉字确认模块，用于基于所述识别结果查询语义库，获取对应的目标汉字；

手写字训练样本获取模块，用于将所述单字体图像和对应的目标汉字关联，获取手写字训练样本。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

获取原始图像，所述原始图像包括手写字和背景图像；

对所述原始图像进行预处理，获取有效图像；

一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器实现如下步骤：

获取原始图像，所述原始图像包括手写字和背景图像；

对所述原始图像进行预处理，获取有效图像；

本申请的一个或多个实施例的细节在下面的附图及描述中提出。本申请的其他特征和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中手写字训练样本获取方法的一应用场景图；

图2是本申请一实施例中手写字训练样本获取方法的一流程图；

图3是图2中步骤S20的一具体流程图；

图4是图2中步骤S30的一具体流程图；

图5是图4中步骤S34的一具体流程图；

图6是本申请一实施例中手写字训练样本获取方法的另一流程图；

图7是图6中步骤S73的一具体流程图；

图8是本申请一实施例中手写字训练样本获取装置的一示意图；

图9是本申请一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的手写字训练样本获取方法，可应用在如图1的应用环境中。该手写字训练样本获取方法的应用环境包括服务器和客户端，其中，客户端通过网络与服务器进行通信，客户端是可与用户进行人机交互的设备，包括但不限于电脑、智能手机和平板等设备。本申请实施例提供的手写字训练样本获取方法应用于服务器。

在一实施例中，如图2所示，提供一种手写字训练样本获取方法，该手写字训练样本获取方法包括如下步骤：

S10：获取原始图像，原始图像包括手写字和背景图像。

其中，原始图像指没有经过任何处理的特定图像，该特定图像是指需要包括手写字的图像。本实施例中的原始图像包括手写字和背景图像。其中，背景图像是指原始图像上的背景图案对应的图像。该原始图像的获取方式包括但不限于从网页上爬取或者通过访问与服务器相连的数据库上获取，该数据库上的原始图像可以是终端设备预先上传的图像。

S20：对原始图像进行预处理，获取有效图像。

其中，有效图像指原始图像经过预处理后的图像。服务器获取有效图像的具体步骤为：(1)判断原始图像是否为彩色图像，若原始图像为彩色图像，则对原始图像进行灰度化处理，获取灰度图像，使得彩色图像中每个像素对应的三个分量R(红色)、G(绿色)和B(蓝色)可以用一个值替代，有助于简化后续进行极差标准化处理的复杂度。可以理解地，若原始图像不为彩色图像，则原始图像为灰度图像，无需再进行灰度化处理。(2)对灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像。对灰度图像对应的像素矩阵进行极差标准化处理可以在保留像素矩阵中相对关系，同时又可以提高计算速度。

S30：采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像，获取包括手写字的目标图像。

核密度估计算法是一种从数据样本本身出发研究数据分布特征，用于估计概率密度函数的非参数方法。核密度估计算法的具体公式为

表示像素的估计概率密度，K(.)为核函数，h为像素范围，x为要估计概率密度的像素，x _i为h范围内的第i个像素，n为h范围内像素为x的个数。腐蚀方法指对图像进行腐蚀处理的方法，其中，腐蚀指去除图像的不需要的部分，仅保留需要的部分。

本实施例中，采用核密度估计算法的公式对有效图像对应的频率分布直方图进行处理，获取频率分布直方图对应的平滑曲线，根据平滑曲线上的极小值和极大值，获取极小值和极大值对应的像素，然后根据极大值和极小值对应的像素对有效图像进行分层处理，在分层处理后，对分层处理后的图像进行腐蚀处理，去除背景图像，保留手写字部分。最后将经过分层和腐蚀处理的图像进行叠加处理，获取目标图像。其中，叠加处理指将分层后的仅保留有手写字部分的图像叠加成一个图像的处理过程，从而实现获取只包含手写字的目标图像的目的。

S40：采用垂直投影方法对目标图像进行单字体切割，获取单字体图像。

其中，垂直投影方法是指将每一行手写字进行垂直方向的投影，获取垂直投影直方图的方法。垂直投影直方图是指反映目标图像在垂直方向上的像素数量的图，垂直投影直方图的横坐标轴表示目标图像的宽度，纵坐标表示目标图像的像素数量分布情况。

具体地，逐行扫描目标图像中的每一行手写字并获取每一行手写字对应的像素的数量，基于像素和像素的数量形成垂直投影直方图，再根据该垂直投影直方图，按照预先设置的切割阈值对目标图像进行切割，获取单字体图像。单字体图像指单个手写字对应的图像。其中，切割阈值指预先设置好的用于切割目标图像中的手写字，获取单字体的值。当扫描到目标图像对应的垂直投影直方图中的纵坐标上的像素数量小于等于阈值时，则表示对应的横坐标的位置是两个相邻手写字之间的分隔点，在该分隔点对目标图像进行单字体切割。如预先设置的切割阈值为10，当扫描到目标图像对应的垂直投影直方图中像素数量为小于等于10时(0、9和10)，则该像素数量值(0、9和10)对应的横坐标所在的位置是两个相邻手写字之间的分割点，在该分割点对目标图像进行单字体切割，获取该目标图像对应的单字体图像。可以理解地，每一个手写字对应的像素是比较集中的，汉字与汉字之间的间隙对应的像素是比较稀疏的，像素的密集程度反应在对应的垂直投影直方图中，则为有汉字的像素对应的像素数量比较高，没有汉字的像素对应的像素数量比较低，通过垂直投影方法能够有效对目标图像进行单字体切割，获取单字体图像，为后续进行模型识别提供技术支持。

S50：将单字体图像输入到目标手写字识别模型中进行识别，当单字体图像的识别概率大于预设概率时，则获取单字体图像对应的识别结果。

其中，目标手写字识别模型是预先训练好的用于识别手写字的模型。预设概率指预先设置的用于判断识别概率是否满足要求的值。识别结果指识别概率大于预设概率的输出。具体地，将单字体图像输入到目标手写字识别模型中，获取每一单字体图像对应的识别概率，该识别概率是指该单字体图像可能为某一具体汉字的概率。将识别概率和预设概率进行比较，若识别概率大于预设概率，则获取对应的识别结果，有助于提高识别结果的准确性。

如预设概率为85％，将“海”对应的单字体图像输入到目标手写字识别模型中，获取识别概率大于预设概率对应的识别结果，该识别结果可能可能为“诲”或“海”，即“海”对应的单字体图像识别为“诲”或“海”的识别概率均大于85％，因此可能输出两个识别结果“诲”或“海”。

S60：基于识别结果查询语义库，获取单字体图像对应的目标汉字。

其中，语义库是预先设置的用于对识别结果进行语义分析的知识库。语义分析是对识别结果进行上下文有关性质的分析。语义库是由大量的中文句子组成。目标汉字是查询语义库后符合语义的单字体图像所对应的汉字。

具体地，在获取识别结果后，还需要根据语义库进一步确定目标汉字，如“海”“枯”、“石”以及“烂”这四个单字体图像对应的识别结果为“诲”或“海”、“枯”、“石”以及“烂”或“栏”，为了进一步确定存在两个或两个以上识别结果对应的单字体图像的目标汉字，因此需查询语义库，根据语义库中收录的中文句子判断更加准确的识别结果。通过查询语义库“海枯石烂”符合语义，则确定每一单字体图像对应的目标汉字为“海”“枯”“石”“烂”，根据语义库确定目标汉字，可以提高对单字体图像识别的准确率。

S70：将单字体图像和对应的目标汉字关联，获取手写字训练样本。

其中，手写字训练样本是用于进行其他模型训练的训练样本。具体地，步骤S60获取的目标汉字后，将目标汉字与单字体图像关联，并作为手写字训练样本存储在数据库中，以便其他模型直接调用数据库中的手写字训练样本进行训练，提高模型训练的效率。

本申请实施例所提供的手写字训练样本获取方法中，通过对原始图像进行预处理，获取有效图像，并采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像部分，保留仅含有手写字的目标图像，为后续进行单字体切割提供数据来源。采用垂直投影方法对目标图像进行单字体切割，获取单字体图像，将获取的单字体图像输入到目标手写字识别模型中识别，基于单字体图像对应的识别概率值，获取识别结果。基于识别结果查询语义库，根据语义库中存储的中文句子获取单字体图像对应的目标汉字，将获取的目标汉字和单字体图像关联起来作为训练样本并存储在数据库中，方便后续模型训练时直接调用数据库中的手写字训练样本进行训练，提高模型训练的效率。

在一实施例中，如图3所示，步骤S20，对原始图像进行预处理，获取有效图像，具体包括如下步骤：

S21：对原始图像进行放大和灰度化处理，获取灰度图像。

由于在原始图像中，手写字本身的尺寸相对于背景图像而言较小，在对原始图像进行灰度化处理时，手写字容易被误处理掉，因此，为了保证手写字不会再灰度化处理时被误清除，需要对原始图像对应的每个像素进行放大处理，如原始图像中第n个像素的大小为x _n，对原始图像中的像素进行幂次放大处理，使得x _n变为

本实施例中，将原始图像中的像素进行放大处理，可以有效避免在对原始图像进行灰度化处理时，手写字被误处理掉。

在原始图像进行放大处理后，若原始图像不是灰度图像而是彩色图像时，则需要对原始图像进行灰度化处理，获取灰度图像。可以理解地，若原始图像为灰度图像，则不需要进行灰度化处理。当原始图像为彩色图像时，对原始图像进行灰度化处理的具体步骤为：采用公式Y＝0.299R+0.587G+0.114B对原始图像中的每个像素进行处理，获取每个像素对应的采样像素，依据该采样像素形成灰度图像；其中，R(红色)、G(绿色)和B(蓝色)是原始图像中的三个分量，采样像素是灰度图像中用于替换彩色图像中R、G和B三个分量对应的像素。

对原始图像为彩色图像进行灰度化处理，有效减少了后续步骤获取有效图像时需要处理的数据量和计算的复杂度。

S22：对灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像，其中，极差标准化处理的公式为

x是标准化前有效图像的像素，x'是标准化后有效图像的像素， M _min是灰度图像对应的像素矩阵M中最小的像素，M _max是灰度图像对应的像素矩阵M中最大的像素。

其中，极差标准化处理是对数据进行处理，使数据压缩在(0，1)范围内的处理方法。对灰度图像对应的像素矩阵进行价差标准化处理并乘上255，可以方便对像素矩阵中的数据进行处理，同时保留像素矩阵中各像素的相互关系。灰度图像中，背景图像和每个手写字都有各自对应的像素矩阵。在获取灰度图像中的背景图像和每个手写字对应的像素矩阵后，对像素矩阵进行极差标准化处理，获取极差标准化处理后的像素矩阵对应的有效图像。对像素矩阵进行极差标准化处理，能够提高获取目标图像的处理速度。

在一实施例中，如图4所示，步骤S30，采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像，获取包括手写字的目标图像，具体包括如下步骤：

S31：对有效图像中的像素出现的次数进行统计，获取有效图像对应的频率分布直方图。

其中，频率分布直方图的横轴表示样本数据的连续值，横轴上的每个小区间对应一个组的组距，作为小矩形的底边；纵轴表示频率与组距的比值，并用该比值作为小矩形的高，以多个小矩形构成的一组图称为频率直方图。具体地，获取有效图像后，在频率直方图的横轴表示像素为(0，255)之间的连续值，横轴上每个小矩形对应的组距为1，纵轴表示小矩形对应的像素出现的频率与组距的比值，该比值即为对应的小矩形的高。该频率分布直方图可以形象地将有效图像中的像素出现的次数展示出来，使得数据的分布情况一目了然地反映出来。

S32：采用高斯核密度估算方法对频率分布直方图进行处理，获取频率分布直方图对应的频率极大值和频率极小值，并根据频率极大值和频率极小值获取对应的像素。

高斯核密度估算方法指核函数为高斯核的核密度估算方法。其中，高斯核对应的函数为

其中，K _(x)指像素(自变量)为x的高斯核函数，x指像素，e和π为常数。频率极大值指在频率分布直方图中，频率值大小为极大值的频率值；频率极小值指在频率分布直方图中，频率值大小为极小值的频率值。具体地，采用高斯核密度函数估算方法对获取的有效图像对应的频率分布直方图进行高斯平滑处理，获取该频率分布直方图对应的高斯平滑曲线。基于该高斯平滑曲线上的频率极大值和频率极小值，获取频率极大值和频率极小值对应横轴上的像素。本实施例中，获取频率极大值和频率极小值对应的像素，便于后续对有效图像进行分层区分，获取分层图像。

S33：基于频率极大值和频率极小值对应的像素对有效图像进行分层处理，获取分层图像。

分层图像指基于频率极大值和频率极小值对有效图像进行分层处理得到的图像。获取频率极大值和频率极小值对应的像素，根据频率极大值对应的像素对有效图像进行分层处理，有效图像中有多少个频率极大值，对应的有效图像的像素就被聚类为多少类，该有效图像就会被分为几层。然后以频率极小值对应的像素作为类之间的边界值,根据类之间的边界则可以每一层分层图像对应的像素。

如有效图像中的频率极大值对应的像素分别为12、54、97、113、159、172，频率极小值对应的像素分别为26、69、104、139和163，根据有效图像中的频率极大值的个数可以确定该有效图像的像素可以被分为6类，该有效图像可以被分为6层，频率极小值对应的像素作为类之间的边界值，由于最小的像素为0，最大的像素为255，因此，根据类之间的边界值则可以确定以像素为12的分层图像，该分层图像对应的像素范围为[0,26)；以像素为54的分层图像，该分层图像对应的像素范围为[26,69)；以像素为97的分层图像，该分层图像对应的像素范围为[69,104)；以像素为113的分层图像，该分层图像对应的像素范围为[104,139)；以像素为159的分层图像，该分层图像对应的像素范围为[139,163)；以像素为172的分层图像，该分层图像对应的像素范围为[163,255]。

S34：对分层图像进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

获取分层图像后，对分层图像进行二值化处理。其中，二值化处理是指将图像上的像素设置为0(黑色)或1(白色)，将整个图像呈现出明显的黑白效果的处理。对分层图像进行二值化处理后，对二值化处理后的分层图像进行腐蚀处理，去除背景图像部分，保留分层图像上的手写字部分。其中，腐蚀处理是用于形态学中去除图像的某部分的内容的操作。由于每个分层图像上的像素是属于不同范围的像素，因此，对分层图像进行腐蚀处理后，还需要将每个分层图像叠加，生成仅含有手写字的目标图像。

本申请实施例所提供的手写字训练样本获取方法中，对原始图像进行放大处理，可以防止由于手写字本身的尺寸过小被误处理掉的情况发生，然后进行灰度化处理，获取灰度图像，可以减少后续步骤获取有效图像时需要处理的数据量。然后对灰度图像对应的像素矩阵进行极差标准化处理，压缩像素矩阵的范围，提高获取有效图像的处理速度。然后根据有效图像获取对应的频率分布直方图，并根据频率分布直方图获取频率极大值和频率极小值对应的像素，从而获取分层图像。最后对分层图像进行二值化、腐蚀和叠加处理，完成对原始图像中手写字和背景图像的识别，去除背景图像，获取包括手写字的目标图像。

在一实施例中，如图5所示，步骤S34中，对分层图像进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像，具体包括如下步骤：

S341：对分层图像进行二值化处理，获取分层二值化图像。

分层二值化图像指对分层图像进行二值化处理获取的图像。具体地，获取分层图像后，基于分层图像的采样像素和预先选取的阈值进行比较，将采样大于等于阈值的像素设置为1，小于阈值的像素设置为0的过程。本实施例中，0代表背景像素，1代表目标像素(手写字像素)。该阈值可以通过计算分层图像的类间方差获取，也可以根据经验值获取。阈值的大小会影响分层图像二值化处理的效果，若阈值选取合适，则对分层图像进行二值化处理的效果就比较好，相应地，若阈值选取不合适，则影响分层图像二值化处理的效果。为了方便操作，简化计算过程，本实施例中的阈值根据经验值确定。

S342：对分层二值化图像中的像素进行检测标记，获取分层二值化图像对应的连通区域。

其中，连通区域是指某一特定像素周围的邻接像素所围成的区域。如某特定像素为0，其周围的邻接像素为1，则将邻接像素所围成的区域作为连通区域。

获取每个分层图像对应的分层二值化图像后，对分层二值化图像对应的像素矩阵进行逐行扫描，将符合连通规则(4邻域连通或者8邻域连通)的像素向相同的标号标记出来。4邻域连通指一个特定像素与上、下、左、右四个方向相邻的像素相同的情况；8邻域连通指一个特定像素上、下、左、右、左上、左下、右上、右下八个方向相邻的像素相同的情况。

具体地，像素矩阵包括行和列。对二值化图像中的像素进行检测标记的具体过程为：(1)逐行扫描像素矩阵，把每一行中连续为1的像素(目标像素)组成一个序列，该序列称为团，标记好该团的起点、终点以及所在的行号。团的起点指团的第一个像素，团的终点指团的最后一个像素。(2)对像素矩阵中除了第一行外的剩余行里的团，比较某一特定剩余行中的团与前一行中的所有团是否有重合区域，若没有重合区域，则给该特定剩余行中的团一个新的标号；如果该特定剩余行中的团仅与上一行中一个团有重合区域，则将上一行的该团的标号赋给它；如果该特定剩余行与上一行中有两个以上的团有重合区域，则给对应的团赋一个相关联团的最小标号，并将上一行的这几个团中的标记写入等价对，说明它们属于一类。其中，相关联团指与特定剩余行的团有重合区域的上一行的团；等价对指相互连通的团上的标号。

例如，一像素矩阵中的特定剩余行为第三行，该第三行中有两个团(A,B)，其中A团与第二行中的两个团(该两个团的标号为1，2)有重合区域，则将第二行中的两个团的最小标号1赋给该A团，A团的标号为1，并将A团、1团和2团对应的标号记为等价对，即将(1，2)记为等价对。标号为1和标号为2的团则称为一个连通区域。

S343：对分层二值化图像对应的连通区域进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

采用MATLAB中的imerode函数或者Open CV中的cvErode函数对分层二值化图像的连通区域进行腐蚀处理。具体地，选取一个结构像素，本实施例是以像素矩阵中某个特征像素相邻的8个像素值作为该特征像素的连通区域的，因此，选取的结构像素3×3的像素矩阵。使用结构像素对分层二值化图像的像素矩阵进行扫描，比较分层二值化图像中的像素矩阵与结构像素是否完全一致，若完全一致时，则像素矩阵中对应的9个像素为都变为1；若不完全一致，则像素矩阵中对应的9个像素都变为0，其中，0(黑色)则为分层二值化图像被腐蚀的部分。

基于预先设置的手写字区域抗腐蚀能力范围对分层二值化图像进行筛选，对于不在手写字区域抗腐蚀能力范围内的分层二值化图像部分删除，获取分层二值化图像中在手写字区域抗腐蚀能力范围内的部分。对筛选出的符合手写字区域抗腐蚀能力范围的每个分层二值化图像部分对应的像素矩阵进行叠加，就可以获取到仅含有手写字的目标图像。其中，手写字区域抗腐蚀能力可以采用公式：

计算，s ₁表示分层二值化图像中被腐蚀后的总面积，s ₂表示分层二值化图像中被腐蚀前的总面积。

如预先设置的手写字区域抗腐蚀能力范围为[0.05,0.8]，根据公式

计算每个分层二值化图像被腐蚀后的总面积和分层二值化图像被腐蚀前的总面积的比值。通过计算，分层二值化图像中某区域腐蚀后的总面积和腐蚀前的总面积的比值不在预先设置的手写字区域抗腐蚀能力范围内，则表示该区域的分层二值化图像是手写字，需要保留。分层二值化图像中的某区域腐蚀后的总面积和腐蚀前的总面积的比值在[0.05,0.8]范围内，则表示该区域的分层二值化图像是手写字，需要保留。对每个分层二值化图像对应的像素矩阵进行叠加，则可以获取含有手写字的目标图像。

对分层图像进行二值化处理，获取分层二值化图像，然后对分层二值化图像中的像素进行检测标记，获取分层二值化图像对应的像素矩阵中每个像素的连通区域，采用结构像素对每个像素的连通区域进行检测，对与结构像素不完全一致的像素矩阵中的像素都变为0，像素为0的分层二值化图像为黑色，该黑色部分则是分层二值化图像被腐蚀的部分，通过计算分层二值化图像被腐蚀后的总面积和分层二值化图像被腐蚀前的总面积的比值，判断该比值是否在预先设置的手写字区域抗腐蚀能力范围，去除背景图像，保留手写字，达到获取目标图像的目的。

在一实施例中，将单字体图像输入到目标手写字识别模型中进行识别，首先需要预先训练好目标手写自识别模型，如图6所示，该手写字训练样本获取方法还包括：训练目标手写字识别模型，其中，训练目标手写字识别模型，具体包括如下步骤：

S71：初始化卷积神经网络模型的权值和偏置。

卷积神经网络的输入层和隐藏层之间存在对应的权值和偏置，隐藏层和输出层之间存在有对应的权值和偏置，在模型训练时，首先需要对卷积神经网络模型中的权值和偏置进行初始化设置，即给卷积神经网络中的输入层与隐藏层之间的权值和偏置设置初始值，并给隐藏层和输出层之间的权值和偏置设置初始值。初始化卷积神经网络模型的权值和偏置是进行模型训练的一个必要步骤，对卷积神经网络模型的权值和偏置进行合理的初始化设置，有利于提高模型训练速度。

S72：获取字体图像训练样本，采用中文二级字库对字体图像训练样本进行标注，并按预设分配规则将字体图像训练样本分为训练集图像和测试集图像。

字体图像训练样本指预先获取的携带有手写字的图像形成的训练样本。该字体图像训练样本是预先收集的不同人写的手写字，通过拍照上传给服务器作为训练样本的图像。

获取字体图像训练样本后，采用中文二级字库对字体图像训练样本中的每个手写字进行标注。如获取400个不同人写的字体图像训练样本，每个字体图像训练样本都写有“忍饥挨饿”，用中文二级字库中的标准字体分别对400个字体图像训练样本中的“忍”“饥”“挨”“饿”进行标注，使得每个字体图像训练样本中的每个手写字都有对应的标签。标准字体是指中文二级字库中收集的不同字体，如宋体、楷体、微软雅黑或仿宋等字体。

对字体图像训练样本中的每个手写字标注完成后，按照预设分配规则将字体图像训练样本分为训练集图像和测试集图像。其中，预设分配规则指预先设置好的用于分配字体图像训练样本的规则，训练集图像指用于对卷积神经网络模型进行训练的单字体图像，测试集图像指用于对训练好的卷积神经网络模型进行测试的单字体图像。如预设分配规则为将字体图像训练样本中的80％作为训练集图像用于对卷积神经网络模型进行训练，20％作为测试集图像用于对训练好的卷积神经网络模型进行测试。

对字体图像训练样本进行标注便于在模型输出训练结果时，和输出结果进行比较，构建损失函数。将字体图像训练样本分为训练集图像和测试集图像可以避免采用训练集图像对模型进行验证时出现过拟合情况，提高模型的准确性。

S73：基于训练集图像，对卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型。

其中，初始手写字识别模型指通过训练集图像训练，用于识别手写字的卷积神经网络模型。具体地，卷积神经网络模型包括多层卷积层和池化层。服务器在获取训练集图像后，将该训练集图像输入卷积神经网络模型中进行训练，通过每一层卷积层的计算，获取每一层的卷积层的输出，然后在卷积层采用最大池化下样采样对卷积层的输出进行降维处理，具体公式为a ^l＝pool(a ^l-1)，其中，a ^l表示第l层输出层的输出，a ^l-1表示l-1层卷积层的输出(即上一层的输出)，pool指下采样计算，该下采样计算可以选择最大池化的方法，最大池化实际上就是在n*n的样本中取最大值。最后将降维处理后的卷积层的输出输入到输出层通过公式T＝σ'(a ^l)，进行计算，获取对应的卷积神经网络模型的前向输出。其中，T表示输出层的输出，σ表示输出层的激活函数，一般为softmax函数。根据卷积神经网络模型的前向输出和手写字携带的标签构建损失函数，通过损失函数更新卷积神经网络模型中的权值和偏置，获取初始手写字识别模型。

S74：基于测试集图像，获取初始手写字识别模型对应的识别准确率，若识别准确率大于预设准确率，则获取目标手写字识别模型。

预设准确率值预先设置的用于判断初始手写字识别模型对手写字识别的准确性是否满足要求的值。获取初始手写字识别模型后，为了验证初始手写字识别模型的对手写字识别的准确性，需要通过测试集图像进行验证。具体验证过程为：将单字体的测试集图像输入到初始手写字识别模型中进行识别，获取初始手写字识别模型的识别准确率，若识别准确率大与预设准确率，则表示该初始手写字识别模型的准确性满足要求，该初始手写字识别模型可以确定为目标手写字识别模型。该目标手写字识别模型可以直接用于识别手写字。

步骤S71-S74，通过将字体图像训练样本按照预设分配规则分为训练集图像和测试集图像，将训练集图像输入到卷积神经网络模型进行训练，调整卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，用于识别单字体图像。然后将测试集图像输入到初始手写字识别模型进行识别，确定初始手写字识别模型的识别准确率是否满足要求，若满足要求，则表示初始手写字识别模型已经训练完成，可以用于识别手写字，该初始手写字识别模型可以确定为目标手写字识别模型。使用目标手写字识别模型识别手写字可以有效提高识别准确率。训练集图像是指获取初始手写字识别模型使用的含有手写字的图像。测试集图像是指获取目标手写字识别模型使用的含有手写字的图像。单字体图像指使用目标手写字识别模型进行识别时的含有手写字的图像。

在一实施例中，如图7所示，步骤S73，基于训练集图像，对卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型，具体包括如下步骤：

S731：将训练集图像输入到卷积神经网络模型中，获取卷积神经网络模型的前向输出，卷积神经网络模型的前向输出的计算公式为a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)和T＝σ'(a ^l)，其中，a ^l表示第l层卷积层的输出，z ^l表示未采用激活函数处理前的输出，a ^l-1表示第l-1层卷积层的输出，σ表示激活函数，W ^l表示第l层卷积层的权值，b ^l表示第l层卷积层的偏置，T表示输出层的输出，σ′表示输出层的激活函数。

将训练集图像输入到卷积神经网络模型中，根据公式a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)对训练集图像进行处理，获取卷积层的输出，然后通过公式a ^l＝pool(a ^l-1)在池化层对卷积层的输出进行降维处理，获取池化层的输出，最后通过公式T＝σ'(a ^l)获取输出层的卷积神经网络模型的前向输出。

S732：根据卷积神经网络模型的前向输出构建损失函数，并对损失函数求偏导，反向更新卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，其中，对卷积神经网络模型中的权值求偏导的公式为

对卷积神经网络模型中的偏置求偏导的公式为

具体地，根据卷积神经网络模型的前向输出和单字体的测试集图像携带的标签构建损失函数，该损失函数具体表示为

其中，J _(θ)为损失函数，n表示训练样本的个数，x _i表示第i个训练集图像输入卷积神经网络模型的值，h _θ表示卷积神经网络模型的权值和偏置对第i个训练集图像处理的参数，h _θx _i表示第i个训练集图像经过卷积神经网络模型处理的卷积神经网络模型的前向输出，y _i表示与x _i相对应的第i个训练样本的标签，θ表示权值和偏置的集合(w,b)。

具体地，对损失函数求偏导，反向更新卷积神经网络模型中的权值和偏置具体包括如下步骤：基于损失函数，分别对卷积神经网络模型中的权值和偏置求偏导，更新卷积神经网络模型的权值和偏置。具体地，根据

对卷积神经网络模型中的偏置求偏导，根据

对卷积神经网络模型中的权值求偏导。

步骤S731-S732通过卷积神经网络模型的前向输出构建损失函数，然后通过损失函数求偏导，反向更新卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，完成训练过程。

该方法通过对原始图像进行放大和灰度化处理，获取灰度图像，然后对灰度图像进行价差标准化处理，获取有效图像。方便后续步骤采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像部分，保留只含有手写字的目标图像。采用垂直投影方法对目标图像进行单字体切割，获取单字体图像，将获取的单字体图像输入到目标手写字识别模型中识别，基于单字体图像对应的识别概率值，获取识别结果。基于识别结果查询语义库，根据语义库中存储的中文句子获取单字体图像对应的目标汉字，将获取的目标汉字和单字体图像关联起来作为训练样本并存储在数据库中，方便后续模型训练时直接调用数据库中的手写字训练样本进行训练，提高模型训练的效率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种手写字训练样本获取装置，该手写字训练样本获取装置与上述实施例中手写字训练样本获取方法一一对应。如图8所示，该手写字训练样本获取装置包括原始图像获取模块10、有效图像获取模块20、目标图像获取模块30、单字体图像获取模块40、识别结果获取模块50、目标汉字确认模块60和手写字训练样本获取模块70。各功能模块详细说明如下：

原始图像获取模块10，用于获取原始图像，原始图像包括手写字和背景图像。

有效图像获取模块20，用于对原始图像进行预处理，获取有效图像。

目标图像获取模块30，用于采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像，获取包括手写字的目标图像。

单字体图像获取模块40，用于采用垂直投影方法对目标图像进行单字体切割，获取单字体图像。

识别结果获取模块50，用于将单字体图像输入到目标手写字识别模型中进行识别，当单字体图像的识别概率大于预设概率时，则获取单字体图像对应的识别结果。

目标汉字确认模块60，用于基于识别结果查询语义库，获取单字体图像对应的目标汉字。

手写字训练样本获取模块70，用于将单字体图像和对应的目标汉字关联，获取手写字训练样本。

具体地，有效图像获取模块20包括灰度图像获取单元21和极差标准化处理单元22。

灰度图像获取单元21，用于对原始图像进行放大和灰度化处理，获取灰度图像。

极差标准化处理单元22，用于对灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像，其中，极差标准化处理的公式为

x是标准化前有效图像的像素，x'是标准化后有效图像的像素，M _min是灰度图像对应的像素矩阵M中最小的像素，M _max是灰度图像对应的像素矩阵M中最大的像素。

具体地，目标图像获取模块30包括第一处理单元31、第二处理单元32、分层图像获取单元33和腐蚀和叠加处理单元34。

第一处理单元31，用于对有效图像中的像素出现的次数进行统计，获取有效图像对应的频率分布直方图。

第二处理单元32，用于采用高斯核密度估算方法对频率分布直方图进行处理，获取频率分布直方图对应的频率极大值和频率极小值，并根据频率极大值和频率极小值获取对应的像素。

分层图像获取单元33，用于基于频率极大值和频率极小值对应的像素对有效图像进行分层处理，获取分层图像。

腐蚀和叠加处理单元34，用于对分层图像进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

具体地，腐蚀和叠加处理单元34包括二值化处理单元341、连通区域获取单元342和连通区域处理单元343。

二值化处理单元341，用于对分层图像进行二值化处理，获取分层二值化图像。

连通区域获取单元342，用于对分层二值化图像中的像素进行检测标记，获取分层二值化图像对应的连通区域。

连通区域处理单元343，用于对分层二值化图像对应的连通区域进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

具体地，手写字训练样本获取装置还包括模型初始化单元71、训练样本获取和处理单元72、初始手写字识别模型73和目标手写字识别模型单元74。

模型初始化单元71，用于初始化卷积神经网络模型的权值和偏置。

训练样本获取和处理单元72，用于获取字体图像训练样本，采用中文二级字库对字体图像训练样本进行标注，并按预设分配规则将字体图像训练样本分为训练集图像和测试集图像。

初始手写字识别模型73，用于基于训练集图像，对卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型。

目标手写字识别模型单元74，用于基于测试集图像，获取初始手写字识别模型对应的识别准确率，若识别准确率大于预设准确率，则获取目标手写字识别模型。

具体地，初始手写字识别模型73包括前向输出获取单元731和权值和偏置更新单元732。

前向输出获取单元731，用于将训练集图像输入到卷积神经网络模型中，获取卷积神经网络模型的前向输出，卷积神经网络模型的前向输出的计算公式为a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)和T＝σ'(a ^l)，其中，a ^l表示第l层卷积层的输出，z ^l表示未采用激活函数处理前的输出，a ^l-1表示第 l-1层卷积层的输出，σ表示激活函数，W ^l表示第l层卷积层的权值，b ^l表示第l层卷积层的偏置，T表示输出层的输出，σ′表示输出层的激活函数。

权值和偏置更新单元732，用于根据卷积神经网络模型的前向输出构建损失函数，并对损失函数求偏导，反向更新卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，其中，对卷积神经网络模型中的权值求偏导的公式为

对卷积神经网络模型中的偏置求偏导的公式为

在一实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储获取的手写字训练样本。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种手写字训练样本获取方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现以下步骤：获取原始图像，原始图像包括手写字和背景图像；对原始图像进行预处理，获取有效图像；采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像，获取包括手写字的目标图像；采用垂直投影方法对目标图像进行单字体切割，获取单字体图像；将单字体图像输入到目标手写字识别模型中进行识别，当单字体图像的识别概率大于预设概率时，则获取单字体图像对应的识别结果；基于识别结果查询语义库，获取单字体图像对应的目标汉字；将单字体图像和对应的目标汉字关联，获取手写字训练样本。

在一实施例中，处理器执行计算机可读指令时还实现以下步骤：对原始图像进行放大和灰度化处理，获取灰度图像；对灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像，其中，极差标准化处理的公式为

在一实施例中，处理器执行计算机可读指令时还实现以下步骤：对有效图像中的像素出现的次数进行统计，获取有效图像对应的频率分布直方图；采用高斯核密度估算方法对频率分布直方图进行处理，获取频率分布直方图对应的频率极大值和频率极小值，并根据频率极大值和频率极小值获取对应的像素；基于频率极大值和频率极小值对应的像素对有效图像进行分层处理，获取分层图像；对分层图像进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

在一实施例中，处理器执行计算机可读指令时还实现以下步骤：对分层图像进行二值化处理，获取分层二值化图像；对分层二值化图像中的像素进行检测标记，获取分层二值化图像对应的连通区域；对分层二值化图像对应的连通区域进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

在一实施例中，处理器执行计算机可读指令时还实现以下步骤：初始化卷积神经网络模型的权值和偏置；获取字体图像训练样本，采用中文二级字库对字体图像训练样本进行标注，并按预设分配规则将字体图像训练样本分为训练集图像和测试集图像；基于训练集图像，对卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型；基于测试集图像，获取初始手写字识别模型对应的识别准确率，若识别准确率大于预设准确率，则获取目标手写字识别模型。

在一实施例中，处理器执行计算机可读指令时还实现以下步骤：将训练集图像输入到卷积神经网络模型中，获取卷积神经网络模型的前向输出，卷积神经网络模型的前向输出的计算公式为a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)和T＝σ'(a ^l)，其中，a ^l表示第l层卷积层的输出，z ^l表示未采用激活函数处理前的输出，a ^l-1表示第l-1层卷积层的输出，σ表示激活函数，W ^l表示第l层卷积层的权值，b ^l表示第l层卷积层的偏置，T表示输出层的输出，σ′表示输出层的激活函数；根据卷积神经网络模型的前向输出构建损失函数，并对损失函数求偏导，反向更新卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，其中，对卷积神经网络模型中的权值求偏导的公式为

对卷积神经网络模型中的偏置求偏导的公式为

在一个实施例中，提供了一个或多个存储有计算机可读指令的非易失性可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器实现如下步骤：：获取原始图像，原始图像包括手写字和背景图像；对原始图像进行预处理，获取有效图像；采用核密度估计算法和腐蚀方法对有效图像进行处理，去除背景图像，获取包括手写字的目标图像；采用垂直投影方法对目标图像进行单字体切割，获取单字体图像；将单字体图像输入到目标手写字识别模型中进行识别，当单字体图像的识别概率大于预设概率时，则获取单字体图像对应的识别结果；基于识别结果查询语义库，获取单字体图像对应的目标汉字；将单字体图像和对应的目标汉字关联，获取手写字训练样本。

在一实施例中，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器还实现以下步骤：对原始图像进行放大和灰度化处理，获取灰度图像；对灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像，其中，极差标准化处理的公式为

在一实施例中，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器还实现以下步骤：对有效图像中的像素出现的次数进行统计，获取有效图像对应的频率分布直方图；采用高斯核密度估算方法对频率分布直方图进行处理，获取频率分布直方图对应的频率极大值和频率极小值，并根据频率极大值和频率极小值获取对应的像素；基于频率极大值和频率极小值对应的像素对有效图像进行分层处理，获取分层图像；对分层图像进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

在一实施例中，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器还实现以下步骤：对分层图像进行二值化处理，获取分层二值化图像；对分层二值化图像中的像素进行检测标记，获取分层二值化图像对应的连通区域；对分层二值化图像对应的连通区域进行腐蚀和叠加处理，去除背景图像，获取包括手写字的目标图像。

在一实施例中，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器还实现以下步骤：初始化卷积神经网络模型的权值和偏置；获取字体图像训练样本，采用中文二级字库对字体图像训练样本进行标注，并按预设分配规则将字体图像训练样本分为训练集图像和测试集图像；基于训练集图像，对卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型；基于测试集图像，获取初始手写字识别模型对应的识别准确率，若识别准确率大于预设准确率，则获取目标手写字识别模型。

在一实施例中，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器还实现以下步骤：将训练集图像输入到卷积神经网络模型中，获取卷积神经网络模型的前向输出，卷积神经网络模型的前向输出的计算公式为a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)和T＝σ'(a ^l)，其中，a ^l表示第l层卷积层的输出，z ^l表示未采用激活函数处理前的输出，a ^l-1表示第l-1层卷积层的输出，σ表示激活函数，W ^l表示第l层卷积层的权值，b ^l表示第l层卷积层的偏置，T表示输出层的输出，σ′表示输出层的激活函数；根据卷积神经网络模型的前向输出构建损失函数，并对损失函数求偏导，反向更新卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，其中，对卷积神经网络模型中的权值求偏导的公式为

对卷积神经网络模型中的偏置求偏导的公式为

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种手写字训练样本获取方法，其特征在于，包括：

获取原始图像，所述原始图像包括手写字和背景图像；

对所述原始图像进行预处理，获取有效图像；

采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像；

采用垂直投影方法对所述目标图像进行单字体切割，获取单字体图像；

将所述单字体图像输入到目标手写字识别模型中进行识别，当所述单字体图像的识别概率大于预设概率时，则获取所述单字体图像对应的识别结果；

基于所述识别结果查询语义库，获取所述单字体图像对应的目标汉字；

将所述单字体图像和对应的目标汉字关联，获取手写字训练样本。
如权利要求1所述的手写字训练样本获取方法，其特征在于，所述对所述原始图像进行预处理，获取有效图像，包括：

对所述原始图像进行放大和灰度化处理，获取灰度图像；

对所述灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像，其中，所述极差标准化处理的公式为
x是标准化前有效图像的像素，x'是标准化后有效图像的像素，M _min是所述灰度图像对应的像素矩阵M中最小的像素，M _max是所述灰度图像对应的像素矩阵M中最大的像素。
如权利要求1所述的手写字训练样本获取方法，其特征在于，所述采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像，包括：

对所述有效图像中的像素出现的次数进行统计，获取所述有效图像对应的频率分布直方图；

采用高斯核密度估算方法对所述频率分布直方图进行处理，获取所述频率分布直方图对应的频率极大值和频率极小值，并根据所述频率极大值和频率极小值获取对应的像素；

基于所述频率极大值和频率极小值对应的像素对有效图像进行分层处理，获取分层图像；

对所述分层图像进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像。
如权利要求3所述的手写字训练样本获取方法，其特征在于，所述对所述分层图像进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像，包括：

对所述分层图像进行二值化处理，获取分层二值化图像；

对所述分层二值化图像中的像素进行检测标记，获取所述分层二值化图像对应的连通区域；

对所述分层二值化图像对应的连通区域进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像。
如权利要求1所述的手写字训练样本获取方法，其特征在于，所述手写字训练样本获取方法还包括：

初始化卷积神经网络模型的权值和偏置；

获取字体图像训练样本，采用中文二级字库对所述字体图像训练样本进行标注，并按预设分配规则将所述字体图像训练样本分为训练集图像和测试集图像；

基于所述训练集图像，对所述卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型；

基于所述测试集图像，获取所述初始手写字识别模型对应的识别准确率，若所述识别准确率大于预设准确率，则获取目标手写字识别模型。
如权利要求5所述的手写字训练样本获取方法，其特征在于，所述基于所述训练集图像，对所述卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型，包括：

将所述训练集图像输入到所述卷积神经网络模型中，获取所述卷积神经网络模型的前向输出，所述卷积神经网络模型的前向输出的计算公式为a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)和T＝σ'(a ^l)，其中，a ^l表示第l层卷积层的输出，z ^l表示未采用激活函数处理前的输出，a ^l-1表示第l-1层卷积层的输出，σ表示激活函数，W ^l表示第l层卷积层的权值，b ^l表示第l层卷积层的偏置，T表示输出层的输出，σ′表示输出层的激活函数；

根据所述卷积神经网络模型的前向输出构建损失函数，并对损失函数求偏导，反向更新所述卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，其中，对所述卷积神经网络模型中的权值求偏导的公式为
对所述卷积神经网络模型中的偏置求偏导的公式为
一种手写字训练样本获取装置，其特征在于，包括：

原始图像获取模块，用于获取原始图像，所述原始图像包括手写字和背景图像；

有效图像获取模块，用于对所述原始图像进行预处理，获取有效图像；

目标图像获取模块，用于采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像；

单字体图像获取模块，用于采用垂直投影方法对所述目标图像进行单字体切割，获取单字体图像；

识别结果获取模块，用于将所述单字体图像输入到目标手写字识别模型中进行识别，当所述单字体图像的识别概率大于预设概率时，则获取所述单字体图像对应的识别结果；

目标汉字确认模块，用于基于所述识别结果查询语义库，获取所述单字体图像对应的目标汉字；

手写字训练样本获取模块，用于将所述单字体图像和对应的目标汉字关联，获取手写字训练样本。
如权利要求7所述的手写字训练样本获取装置，其特征在于，所述手写字训练样本获取装置还包括：

模型初始化单元，用于初始化卷积神经网络模型的权值和偏置；

训练样本获取和处理单元，用于获取字体图像训练样本，采用中文二级字库对所述字体图像训练样本进行标注，并按预设分配规则将所述字体图像训练样本分为训练集图像和测试集图像；

初始手写字识别模型，用于基于所述训练集图像，对所述卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型；

目标手写字识别模型单元，用于基于所述测试集图像，获取所述初始手写字识别模型对应的识别准确率，若所述识别准确率大于预设概率，则获取目标手写字识别模型。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如下步骤：

获取原始图像，所述原始图像包括手写字和背景图像；

对所述原始图像进行预处理，获取有效图像；

采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像；

采用垂直投影方法对所述目标图像进行单字体切割，获取单字体图像；

将所述单字体图像输入到目标手写字识别模型中进行识别，当所述单字体图像的识别概率大于预设概率时，则获取所述单字体图像对应的识别结果；

基于所述识别结果查询语义库，获取所述单字体图像对应的目标汉字；

将所述单字体图像和对应的目标汉字关联，获取手写字训练样本。
如权利要求9所述的计算机设备，其特征在于，所述对所述原始图像进行预处理，获取有效图像，包括：

对所述原始图像进行放大和灰度化处理，获取灰度图像；

对所述灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像，其中，所述极差标准化处理的公式为
x是标准化前有效图像的像素，x′是标准化后有效图像的像素，M _min是所述灰度图像对应的像素矩阵M中最小的像素，M _max是所述灰度图像对应的像素矩阵M中最大的像素。
如权利要求9所述的计算机设备，其特征在于，所述采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像，包括：

对所述有效图像中的像素出现的次数进行统计，获取所述有效图像对应的频率分布直方图；

采用高斯核密度估算方法对所述频率分布直方图进行处理，获取所述频率分布直方图对应的频率极大值和频率极小值，并根据所述频率极大值和频率极小值获取对应的像素；

基于所述频率极大值和频率极小值对应的像素对有效图像进行分层处理，获取分层图像；

对所述分层图像进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像。
如权利要求11所述的计算机设备，其特征在于，所述对所述分层图像进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像，包括：

对所述分层图像进行二值化处理，获取分层二值化图像；

对所述分层二值化图像中的像素进行检测标记，获取所述分层二值化图像对应的连通区域；

对所述分层二值化图像对应的连通区域进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像。
如权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还实现如下步骤：

初始化卷积神经网络模型的权值和偏置；

获取字体图像训练样本，采用中文二级字库对所述字体图像训练样本进行标注，并按预设分配规则将所述字体图像训练样本分为训练集图像和测试集图像；

基于所述训练集图像，对所述卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型；

基于所述测试集图像，获取所述初始手写字识别模型对应的识别准确率，若所述识别准确率大于预设准确率，则获取目标手写字识别模型。
如权利要求13所述的计算机设备，其特征在于，所述基于所述训练集图像，对所述卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型，包括：

将所述训练集图像输入到所述卷积神经网络模型中，获取所述卷积神经网络模型的前向输出，所述卷积神经网络模型的前向输出的计算公式为a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)和T＝σ'(a ^l)，其中，a ^l表示第l层卷积层的输出，z ^l表示未采用激活函数处理前的输出，a ^l-1表示第l-1层卷积层的输出，σ表示激活函数，W ^l表示第l层卷积层的权值，b ^l表示第l层卷积层的偏置，T表示输出层的输出，σ′表示输出层的激活函数；

根据所述卷积神经网络模型的前向输出构建损失函数，并对损失函数求偏导，反向更新所述卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，其中，对所述卷积神经网络模型中的权值求偏导的公式为
对所述卷积神经网络模型中的偏置求偏导的公式为
一个或多个存储有计算机可读指令的非易失性可读存储介质，其特征在于，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器实现如下步骤：

获取原始图像，所述原始图像包括手写字和背景图像；

对所述原始图像进行预处理，获取有效图像；

采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像；

采用垂直投影方法对所述目标图像进行单字体切割，获取单字体图像；

将所述单字体图像输入到目标手写字识别模型中进行识别，当所述单字体图像的识别概率大于预设概率时，则获取所述单字体图像对应的识别结果；

基于所述识别结果查询语义库，获取所述单字体图像对应的目标汉字；

将所述单字体图像和对应的目标汉字关联，获取手写字训练样本。
如权利要求15所述的非易失性可读存储介质，其特征在于，所述对所述原始图像进行预处理，获取有效图像，包括：

对所述原始图像进行放大和灰度化处理，获取灰度图像；

对所述灰度图像对应的像素矩阵进行极差标准化处理，获取有效图像，其中，所述极差标准化处理的公式为
x是标准化前有效图像的像素，x'是标准化后有效图像的像素，M _min是所述灰度图像对应的像素矩阵M中最小的像素，M _max是所述灰度图像对应的像素矩阵M中最大的像素。
如权利要求15所述的非易失性可读存储介质，其特征在于，所述采用核密度估计算法和腐蚀方法对所述有效图像进行处理，去除背景图像，获取包括所述手写字的目标图像，包括：

对所述有效图像中的像素出现的次数进行统计，获取所述有效图像对应的频率分布直方图；

采用高斯核密度估算方法对所述频率分布直方图进行处理，获取所述频率分布直方图对应的频率极大值和频率极小值，并根据所述频率极大值和频率极小值获取对应的像素；

基于所述频率极大值和频率极小值对应的像素对有效图像进行分层处理，获取分层图像；

对所述分层图像进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像。
如权利要求17所述的非易失性可读存储介质，其特征在于，所述对所述分层图像进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像，包括：

对所述分层图像进行二值化处理，获取分层二值化图像；

对所述分层二值化图像中的像素进行检测标记，获取所述分层二值化图像对应的连通区域；

对所述分层二值化图像对应的连通区域进行腐蚀和叠加处理，去除背景图像，获取包括所述手写字的目标图像。
如权利要求15所述的非易失性可读存储介质，其特征在于，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还实现如下步骤：

初始化卷积神经网络模型的权值和偏置；

获取字体图像训练样本，采用中文二级字库对所述字体图像训练样本进行标注，并按预设分配规则将所述字体图像训练样本分为训练集图像和测试集图像；

基于所述训练集图像，对所述卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型；

基于所述测试集图像，获取所述初始手写字识别模型对应的识别准确率，若所述识别准确率大于预设准确率，则获取目标手写字识别模型。
如权利要求19所述的非易失性可读存储介质，其特征在于，所述基于所述训练集图像，对所述卷积神经网络模型中的权值和偏置进行调整，获取初始手写字识别模型，包括：

将所述训练集图像输入到所述卷积神经网络模型中，获取所述卷积神经网络模型的前向输出，所述卷积神经网络模型的前向输出的计算公式为a ^l＝σ(z ^l)＝σ(a ^l-1*W ^l+b ^l)和T＝σ'(a ^l)，其中，a ^l表示第l层卷积层的输出，z ^l表示未采用激活函数处理前的输出，a ^l-1表示第l-1层卷积层的输出，σ表示激活函数，W ^l表示第l层卷积层的权值，b ^l表示第l层卷积层的偏置，T表示输出层的输出，σ′表示输出层的激活函数；

根据所述卷积神经网络模型的前向输出构建损失函数，并对损失函数求偏导，反向更新所述卷积神经网络模型中的权值和偏置，获取初始手写字识别模型，其中，对所述卷积神经网络模型中的权值求偏导的公式为
对所述卷积神经网络模型中的偏置求偏导的公式为