CN114529910B - 手写文字识别方法、装置、存储介质及电子设备 - Google Patents
手写文字识别方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN114529910B CN114529910B CN202210101139.XA CN202210101139A CN114529910B CN 114529910 B CN114529910 B CN 114529910B CN 202210101139 A CN202210101139 A CN 202210101139A CN 114529910 B CN114529910 B CN 114529910B
- Authority
- CN
- China
- Prior art keywords
- pen
- point
- strokes
- stroke
- pen point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000013528 artificial neural network Methods 0.000 claims description 40
- 230000002457 bidirectional effect Effects 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 6
- 238000013145 classification model Methods 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000007667 floating Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
本公开涉及一种手写文字识别方法、装置、存储介质及电子设备,包括:获取待识别手写文字;将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;将所述识别结果进行展示。文字识别模型是根据样本文字的笔点特征以及样本文字中每两个笔画之间的连笔概率训练得到的,进而通过对待识别书写文字进行连笔书写预测可以提高手写文字识别的准确性。
Description
技术领域
本公开涉及文字识别技术领域,具体地,涉及一种手写文字识别方法、装置、存储介质及电子设备。
背景技术
在线识别手写文字时,不仅需要快速识别还需要准确识别,然而由于每个人书写习惯的不同,手写的连笔情况以及手写笔画顺序存在差异,仅仅依赖训练样本训练得到识别模型,进而根据识别模型识别文字导致准确性较低。并且,通常在手写完成后对手写文字进行识别,导致手写文字识别速度较慢。
发明内容
本公开的目的是提供一种手写文字识别方法、装置、存储介质及电子设备,以至少部分地解决上述技术问题。
为了实现上述目的,本公开第一方面,提供一种手写文字识别方法,所述方法包括:
获取待识别手写文字;
将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;
将所述识别结果进行展示。
可选地,所述笔点特征是通过以下方式确定的:
对降采样后的样本文字进行坐标归一化,得到备用样本文字;
根据所述备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征;
其中,所述笔点类型包括起笔点、行笔点和收笔点。
可选地,所述连笔概率是通过以下方式确定的:
从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;
根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率。
可选地,所述根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率,包括:
根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;
根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;
基于最小二乘法,根据所述先写笔画的收笔点的笔点特征以及所述收笔点之前的多个行笔点的笔点特征拟合得到第一直线,并根据所述后写笔画的起笔点的笔点特征以及所述起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括所述收笔点之前的多个行笔点以及所述起笔点之后的多个行笔点;
根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角;
根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率;
其中,所述距离阈值是根据所述样本文字的文字宽度确定的。
可选地,所述根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率,包括:
在所述起收笔点距离小于所述距离阈值,和/或,所述直线夹角小于所述预设角度阈值的情况下,将预设连笔概率作为所述两个笔画的连笔概率;
在所述起收笔点距离大于等于所述距离阈值,且所述直线夹角大于等于所述预设角度阈值的情况下,确定所述两个笔画的连笔概率为0。
可选地,所述样本文字的降采样包括:
针对所述样本文字中的每一笔画,确定相邻行笔点坐标的欧式距离;
将欧式距离小于距离阈值的行笔点剔除,得到有效行笔点;
根据所述有效行笔点、该笔画的起笔点以及收笔点,得到降采样后的样本文字。
可选地,所述对降采样后的样本文字进行坐标归一化,得到备用样本文字,包括:
根据降采样后的样本文字中各笔点的笔点坐标,计算所述笔点坐标的均值和方差;
根据所述均值以及所述方差,对降采样后的样本文字进行坐标归一化,得到所述备用样本文字。
可选地,所述文字识别模型是通过如下方式训练得到的:
将所述样本文字的笔点特征输入到双向神经网络层中,所述双向神经网络层的第1层神经网络层中的隐含层的维度为96维,第2层神经网络层中的隐含层的维度为64维;
将所述双向神经网络层的输出作为均值池化层的输入,得到维度降低的笔点特征;
按照预设随机概率将所述每两个笔画之间的连接概率置0;
根据所述维度降低的笔点特征以及随机置0后的连接概率,通过全连接层中26维的编码层进行编码;
将编码后的笔点特征输入到分类模型中进行分类,得到所述全连接层输出的文字参数量,直到所述文字参数量满足预设文字分类的参数量,训练得到所述文字识别模型。
本公开第二方面,提供一种手写文字识别装置,所述装置包括:
获取模块,被配置为用于获取待识别手写文字;
输入模块,被配置为用于将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;
展示模块,被配置为用于将所述识别结果进行展示。
可选地,所述装置还包括:
降采样模块,被配置为用于对降采样后的样本文字进行坐标归一化,得到备用样本文字;
第一确定模块,被配置为用于根据所述备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征;
其中,所述笔点类型包括起笔点、行笔点和收笔点。
可选地,所述装置还包括:
第二确定模块,被配置为用于从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;
概率确定模块,被配置为用于根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率。
可选地,所述概率确定模块,包括:
第一确定子模块,被配置为用于根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;
距离确定子模块,被配置为用于根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;
直线拟合子模块,被配置为用于基于最小二乘法,根据所述先写笔画的收笔点的笔点特征以及所述收笔点之前的多个行笔点的笔点特征拟合得到第一直线,并根据所述后写笔画的起笔点的笔点特征以及所述起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括所述收笔点之前的多个行笔点以及所述起笔点之后的多个行笔点;
第二确定子模块,被配置为用于根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角;
第三确定子模块,被配置为用于根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率;
其中,所述距离阈值是根据所述样本文字的文字宽度确定的。
可选地,所述第三确定子模块,包括:
第一概率确定单元,被配置为用于在所述起收笔点距离小于所述距离阈值,和/或,所述直线夹角小于所述预设角度阈值的情况下,将预设连笔概率作为所述两个笔画的连笔概率;
第二概率确定单元,被配置为用于在所述起收笔点距离大于等于所述距离阈值,且所述直线夹角大于等于所述预设角度阈值的情况下,确定所述两个笔画的连笔概率为0。
可选地,所述降采样模块,被配置为用于:
针对所述样本文字中的每一笔画,确定相邻行笔点坐标的欧式距离;
将欧式距离小于距离阈值的行笔点剔除,得到有效行笔点;
根据所述有效行笔点、该笔画的起笔点以及收笔点,得到降采样后的样本文字。
可选地,所述降采样模块,被配置为用于:
根据降采样后的样本文字中各笔点的笔点坐标,计算所述笔点坐标的均值和方差;
根据所述均值以及所述方差,对降采样后的样本文字进行坐标归一化,得到所述备用样本文字。
可选地,所述文字识别模型包括:
样本输入模块,被配置为用于将所述样本文字的笔点特征输入到双向神经网络层中,所述双向神经网络层的第1层神经网络层中的隐含层的维度为96维,第2层神经网络层中的隐含层的维度为64维;
均值池化模块,被配置为用于将所述双向神经网络层的输出作为均值池化层的输入,得到维度降低的笔点特征;
执行模块,被配置为用于按照预设随机概率将所述每两个笔画之间的连接概率置0;
编码模块,被配置为用于根据所述维度降低的笔点特征以及随机置0后的连接概率,通过全连接层中26维的编码层进行编码;
分类模块,被配置为用于将编码后的笔点特征输入到分类模型中进行分类,得到所述全连接层输出的文字参数量,直到所述文字参数量满足预设文字分类的参数量,训练得到所述文字识别模型。
本公开第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一项所述方法的步骤。
本公开第四方面,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面任一项所述方法的步骤。
通过上述技术方案,至少可以达到以下技术效果:
通过获取待识别手写文字;将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;将所述识别结果进行展示。文字识别模型是根据样本文字的笔点特征以及样本文字中每两个笔画之间的连笔概率训练得到的,进而通过对待识别书写文字进行连笔书写预测可以提高手写文字识别的准确性。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1根据一示例性实施例示出的一种手写文字识别方法的流程图。
图2根据一示例性实施例示出的一种文字识别模型训练的流程图。
图3是根据一示例性实施例示出的一种模型网络结构的示意图。
图4是根据一示例性实施例示出的一种自编码器结构的示意图。
图5是根据一示例性实施例示出的一种识别结果展示的示意图。
图6根据一示例性实施例示出的一种笔点特征确定方法的流程图。
图7是根据一示例性实施例示出的一种降采样前后样本文字的对比图。
图8根据一示例性实施例示出的一种连笔概率确定方法的流程图。
图9根据一示例性实施例示出的一种实现图8中步骤S82的流程图。
图10是根据一示例性实施例示出的一种构建每两个笔画之间直线夹角的示意图。
图11是根据一示例性实施例示出的一种手写文字识别装置的框图。
图12是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
图1根据一示例性实施例示出的一种手写文字识别方法的流程图,应用于终端设备,例如,终端设备可以是手机、平板电脑、电子黑板等,如图1所示,所述方法包括以下步骤。
在步骤S11中,获取待识别手写文字。
其中,可以从移动终端的手写输入界面获取待识别手写文字。
在步骤S12中,将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;
其中,文字识别模型可以是基于CASIA单字手写数据集进行训练。样本文字可以为收集的手写文字,也可以为GB2312中的一级汉字和二级汉字,通过国标汉字训练文字识别模型,可以丰富训练样本,避免手写文字样本量较小,导致文字识别模型不准确。
在一种实施方式中,图2根据一示例性实施例示出的一种文字识别模型训练的流程图,参见图2所示,所述方法包括以下步骤:
在步骤S21中,将所述样本文字的笔点特征输入到双向神经网络层中。
其中,所述双向神经网络层的第1层神经网络层中的隐含层的维度为96维,第2层神经网络层中的隐含层的维度为64维。
其中,按时序将样本文字的笔点特征输入到双向神经网络层中,参见图3所示,双向神经网络层可以是LSTM(Long Short Term Memory Network,长短时记忆网络),或者GRU(Gate Recurrent Unit,门控循环单元)。
其中,一般双向神经网络层隐含层的维度默认为1024维或者128维,经实验,将第1层神经网络层中的隐含层的维度搭建为96维,第2层神经网络层中的隐含层的维度搭建为64维,可以有效较低参数量,进而兼顾了识别精度和参数量的大小。
在步骤S22中,将所述双向神经网络层的输出作为均值池化层的输入,得到维度降低的笔点特征。
通常可以将双向神经网络层的输出的维度减半。
在步骤S23中,按照预设随机概率将每两个笔画之间的连接概率置0。
其中,以GB2312中的3755类汉字为样本文字为例,全连接层的维度可以是3755维,产生的参数量的个数为100*64/2*3755+3755=12019755。而若考虑GB2312中一级、二级汉字,再加上常用符号,将包括7356类汉字,参数量的个数将两千万以上,容易造成全连接层过拟合。而dropout机制可以有效防止全连接层过拟合。
其中,按照预设随机概率0.6将每两个笔画之间的连接概率置0,可以防止全连接层过拟合,而又不会降低文字识别模型的准确性。
在步骤S24中,根据所述维度降低的笔点特征以及随机置0后的连接概率,通过全连接层中26维的编码层进行编码。
其中,针对7356类汉字,以二进制进行编码,即log27356=12.84,则至少需要13维的编码层方能够满足7356类文字编码需求,为保证模型编码的速度和精度,选择编码层的维度为二进制编码的2倍,即全连接层中编码层为26维。
继续参见图3所示,将第一个笔点特征和对应的连笔概率作为输入特征,输入到双向神经网络层的第1,第一个神经元的输出特征不仅横向作为第二个神经元的其中一个输入特征,还纵向输入后一层级的神经元中,以此类推,上一个神经元的输出特征需要横向作为下一个神经元的输入特征的一部分,还纵向输入后一层级的神经元中。在该子层级神经元训练完成后,该子层级的最后一个神经元的输出特征反向作为上一个输入特征的神经元的输入特征的一部分,以此类推,该子层级的下一个神经元的输出特征反向作为上一个神经元的输入特征的一部分。
进而将双向神经网络层的所有输出输入到均值池化层(mean pooling anddropout),均值池化层为避免过拟合,可以随机对神经元进行丢失,均值池化层的输出特征输入到全连接层(full layer and dropout),经过逻辑回归分类(logistic regression)过程,输出3755个特征。
其中,由于编码层的维度较小,网络训练困难,需要预先单独训练自编码器。参见图4所示的自编码器结构,以第2层神经网络层层的输出维度为6400维为例,将6400维的浮点数输入特征输入到第1层神经网络层层,当模型稳定后,通过26维的编码层将6400维的特征进行编码,以将高维特征进行降维。进一步地,通过26维的编码层对编码后的特征进行解码,将输入特征还原,得到自编码器的编码参数,并将该编码参数作为初始化数值放到神经网络中,以对文字识别模型进行训练。
在步骤S25中,将编码后的笔点特征输入到分类模型中进行分类,得到所述全连接层输出的文字参数量,直到所述文字参数量满足预设文字分类的参数量,训练得到所述文字识别模型。
示例地,参见表1所示的文字识别模型的网络结构:
表1
其中,bidirectional_1为双向神经网络层的第1层神经网络层,维度为96维,输出参数量为59328,bidirectional_2为双向神经网络层的第2层神经网络层,维度为64维,输出参数量为61824,flatten_1是将双向神经网络层展开,无输出参数量,dropout_1用于在模型训练时按照预设概率将每两个笔画的连接概率置0,无输出参数量,decode_1是全连接层中的编码层,维度为26维,输出参数量为166426,dense_1是分类层,可以通过softmax模型,得到7356类的识别结果,输出参数量为198312。
示例地,可以以32位浮点数的形式对模型参数和文字参数量进行保存,经实验,最终文字参数量的大小为59328+61824+166426+198612=486190,而针对48万级的文字参数量进行保存,文字识别模型的文件大小不到2M。
采用上述技术方案,文字识别模型的模型参数量较小,训练得到的文字参数量也较小,进而保存的模型文件较小,便于文字识别模型在终端设备上应用。
在步骤S13中,将所述识别结果进行展示。
示例地,参见图5所示,可以在手写界面的底部横向展示识别结果。
在一种实施方式中,待识别手写文字可以是未完整书写的文字,参见图5所示,在用户手写过程中,获取用户每一笔画手写的文字,不仅可以通过文字识别模型对已经手写的文字进行识别,还可以针对最后一笔手写的笔画预测未手写出的部分,得到待识别文字的识别结果,并在手写过程中实时展示识别结果。这样,可以提高手写文字识别的速度。
沿用图5的实施例进行说明,在手写完“快”的前6画的情况下,可以对前6画手写的文字进行识别,并对第7画及之后的笔画进行预测。又例如,在书写完“乐”的前3画的情况下,由于出现连笔书写,因此“乐”本身的第3画以及第4画作为书写过程中的第3画,可以根据前3画手写的文字进行识别,并对第4画及之后的笔画进行预测。
经实验,文字识别模型的准确率可以达到95%,并且在用户手写过程中,基于未完整手写的文字进行文字识别,单字识别时长仅为21ms,可以减少输入笔画,有效地提高了手写文字识别的速度。
上述技术方案通过获取待识别手写文字;将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;将所述识别结果进行展示。文字识别模型是根据样本文字的笔点特征以及样本文字中每两个笔画之间的连笔概率训练得到的,进而通过对待识别书写文字进行连笔书写预测可以提高手写文字识别的准确性。
在上述实施例的基础上,图6根据一示例性实施例示出的一种笔点特征确定方法的流程图,参见图6所示,所述方法包括以下步骤。
在步骤S61中,对降采样后的样本文字进行坐标归一化,得到备用样本文字。
其中,所述样本文字的降采样包括:
针对样本文字中的每一笔画,确定相邻行笔点坐标的欧式距离。
示例地,首先计算起笔点与起笔点之后的第一个行笔点的欧式距离,再确定起笔点之后的第一个行笔点与起笔点之后的第二个行笔点的欧式距离,以此类推,直到确定收笔点与收笔点之前的第一个行笔点的欧式距离。
其中,起笔点为该笔画开始书写时落笔的笔点,收笔点为该笔画停止书写时的笔点,行笔点为起笔点与收笔点之间的笔点。
将欧式距离小于距离阈值的行笔点剔除,得到有效行笔点。
示例地,可以取样本文字的文字宽度的十五分之一到二十分之一作为距离阈值。例如,根据X轴方向上样本文字中各笔点坐标,X轴方向上最大笔点坐标减去最小笔点坐标得到坐标差值,取距离阈值Tdist为:
其中,ΔT为样本文字X轴方向上最大笔点坐标减去最小笔点坐标得到坐标差值。
例如通过如下公式将欧式距离小于距离阈值的行笔点剔除:
其中,xi为第i个笔点的横坐标,xi-1为第i-1个笔点的横坐标,yi为第i个笔点的纵坐标,yi-1为第i-1个笔点的纵坐标。
根据所述有效行笔点、该笔画的起笔点以及收笔点,得到降采样后的样本文字。
参见图7所示,左边为降采样前的样本文字,右边为降采样后的样本文字。
可选地,在步骤S61中,所述对降采样后的样本文字进行坐标归一化,得到备用样本文字,包括:
根据降采样后的样本文字中各笔点的笔点坐标,计算所述笔点坐标的均值和方差。
示例地,根据各笔点的横坐标计算降采样后的样本文字的横坐标均值,同理,根据各笔点的纵坐标计算降采样后的样本文字的纵坐标均值;根据各笔点的横坐标以及横坐标均值计算降采样后的样本文字的横坐标方差,同理,根据各笔点的纵坐标以及纵坐标均值计算降采样后的样本文字的纵坐标方差。
根据所述均值以及所述方差,对降采样后的样本文字进行坐标归一化,得到所述备用样本文字。
示例地,针对每一笔点,通过如下公式计算归一化后的笔点坐标xnew:
Xnew=(Xj-μa)/δa
其中,Xj为降采样后的样本文字中第j个的笔点坐标,μa为降采样后的样本文字的均值,δa为降采样后的样本文字的方差。
在步骤S62中,根据备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征。
其中,所述笔点类型包括起笔点、行笔点和收笔点。
示例地,笔点的笔点特征可以表示为(xi,yi,ti,si),其中,xi为第i个笔点归一化后的横坐标,yi为第i个笔点归一化后的纵坐标,ti为第i个笔点的采集时间戳,si为第i个笔点的笔点类型。
其中,s=0表示该笔点为行笔点,s=1表示该笔点为起笔点,s=2表示该笔点为收笔点。
上述技术方案可以对样本文字中多余的笔点进行剔除,降低设备采样率对文字识别的影响,并将笔点坐标进行归一化,降低文字大小对文字识别的影响,提高了文字识别模型的识别速度。
在上述实施例的基础上,图8根据一示例性实施例示出的一种连笔概率确定方法的流程图,参见图8所示,所述方法包括以下步骤。
在步骤S81中,从备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点。
在步骤S82中,根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率。
在上述实施例的基础上,图9根据一示例性实施例示出的一种实现图8中步骤S82的流程图,参见图9所示,在步骤S82中,所述根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率,包括:
在步骤S821中,根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画。
可以理解的是,采集时间戳在前的为先写笔画,采集时间戳在后的为后写笔画。其中,先写笔画和后写笔画的目标笔点不同,先写笔点的目标笔点为收笔点以及收笔点之前的多个行笔点,后写笔点的目标笔点为起笔点以及起笔点之后的多个行笔点。
在步骤S822中,根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点。
示例地,根据笔点特征中的笔点坐标,计算每两个笔画的收笔点与起笔点之间的欧氏距离。
在步骤S823中,基于最小二乘法,根据先写笔画的收笔点的笔点特征以及收笔点之前的多个行笔点的笔点特征拟合得到第一直线,并根据后写笔画的起笔点的笔点特征以及起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括收笔点之前的多个行笔点以及起笔点之后的多个行笔点。
参见图10所示,a1、a2、a3分别为先写笔画的收笔点以及所述收笔点之前的2个行笔点,l1为基于最小二乘法,根据a1、a2、a3的笔点坐标拟合得到的第一直线,即l1为到a1、a2、a3距离最小的有方向直线;同理,b1、b2、b3分别为后写笔画的起笔点以及起笔点之后的2个行笔点,l2为基于最小二乘法,根据b1、b2、b3的笔点坐标拟合得到的第二直线,即l2为到b1、b2、b3距离最小的有方向直线。
在步骤S824中,根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角。
沿用上述实施例进行说明,做l1的平行线l′1,并且该平行线l′1与l2相交,l′1与l2的夹角θ即为两个笔画对应的第一直线与第二直线的直线夹角。
在步骤S825中,根据每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及每两个笔画的直线夹角与预设角度阈值的大小关系,确定备用样本文字中每两个笔画的连笔概率。
其中,所述距离阈值是根据所述样本文字的文字宽度确定的。
同前述,可以取样本文字的文字宽度的十五分之一到二十分之一作为距离阈值。
其中,手写过程中,钝角连笔往往存在于距离较小的两个笔画之间,而在两个笔画距离较大的情况下,出现连笔的情况两个笔画之间多为锐角,因而预设角度阈值可以为30°到60°,优选45°作为预设角度阈值。
在上述实施例的基础上,在步骤S725中,所述根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率,包括:
在所述起收笔点距离小于所述距离阈值,和/或,所述直线夹角小于所述预设角度阈值的情况下,将预设连笔概率作为所述两个笔画的连笔概率。
示例地,在起收笔点距离小于所述距离阈值,和/或,直线夹角小于预设角度阈值的情况下,将预设连笔概率0.5作为两个笔画的连笔概率。
在所述起收笔点距离大于等于所述距离阈值,且所述直线夹角大于等于所述预设角度阈值的情况下,确定所述两个笔画的连笔概率为0。
经实验,根据样本文字的连笔概率对文字识别进行训练,可以提高0.8个百分点的文字识别模型识别率,且不会对用户输入造成干扰。
基于相同的构思,本公开还提供一种手写文字识别装置,用于执行上述实施例提供的手写文字识别方法的步骤,该装置可以以软件、硬件或者两者相结合的方式实现手写文字识别方法。图11是根据一示例性实施例示出的一种手写文字识别装置1100的框图,如图11所示,所述装置1100包括:获取模块1110、输入模块1120和展示模块1130。
其中,获取模块1110,被配置为用于获取待识别手写文字;
输入模块1120,被配置为用于将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;
展示模块1130,被配置为用于将所述识别结果进行展示。
上述装置中文字识别模型是根据样本文字的笔点特征以及样本文字中每两个笔画之间的连笔概率训练得到的,进而通过对待识别书写文字进行连笔书写预测可以提高手写文字识别的准确性。
可选地,所述装置1100还包括:
降采样模块,被配置为用于对降采样后的样本文字进行坐标归一化,得到备用样本文字;
第一确定模块,被配置为用于根据所述备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征;
其中,所述笔点类型包括起笔点、行笔点和收笔点。
可选地,所述装置1100还包括:
第二确定模块,被配置为用于从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;
概率确定模块,被配置为用于根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率。
可选地,所述概率确定模块,包括:
第一确定子模块,被配置为用于根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;
距离确定子模块,被配置为用于根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;
直线拟合子模块,被配置为用于基于最小二乘法,根据所述先写笔画的收笔点的笔点特征以及所述收笔点之前的多个行笔点的笔点特征拟合得到第一直线,并根据所述后写笔画的起笔点的笔点特征以及所述起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括所述收笔点之前的多个行笔点以及所述起笔点之后的多个行笔点;
第二确定子模块,被配置为用于根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角;
第三确定子模块,被配置为用于根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率;
其中,所述距离阈值是根据所述样本文字的文字宽度确定的。
可选地,所述第三确定子模块,包括:
第一概率确定单元,被配置为用于在所述起收笔点距离小于所述距离阈值,和/或,所述直线夹角小于所述预设角度阈值的情况下,将预设连笔概率作为所述两个笔画的连笔概率;
第二概率确定单元,被配置为用于在所述起收笔点距离大于等于所述距离阈值,且所述直线夹角大于等于所述预设角度阈值的情况下,确定所述两个笔画的连笔概率为0。
可选地,所述降采样模块,被配置为用于:
针对所述样本文字中的每一笔画,确定相邻行笔点坐标的欧式距离;
将欧式距离小于距离阈值的行笔点剔除,得到有效行笔点;
根据所述有效行笔点、该笔画的起笔点以及收笔点,得到降采样后的样本文字。
可选地,所述降采样模块,被配置为用于:
根据降采样后的样本文字中各笔点的笔点坐标,计算所述笔点坐标的均值和方差;
根据所述均值以及所述方差,对降采样后的样本文字进行坐标归一化,得到所述备用样本文字。
可选地,所述文字识别模型包括:
样本输入模块,被配置为用于将所述样本文字的笔点特征输入到双向神经网络层中,所述双向神经网络层的第1层神经网络层中的隐含层的维度为96维,第2层神经网络层中的隐含层的维度为64维;
均值池化模块,被配置为用于将所述双向神经网络层的输出作为均值池化层的输入,得到维度降低的笔点特征;
执行模块,被配置为用于按照预设随机概率将所述每两个笔画之间的连接概率置0;
编码模块,被配置为用于根据所述维度降低的笔点特征以及随机置0后的连接概率,通过全连接层中26维的编码层进行编码;
分类模块,被配置为用于将编码后的笔点特征输入到分类模型中进行分类,得到所述全连接层输出的文字参数量,直到所述文字参数量满足预设文字分类的参数量,训练得到所述文字识别模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
此外值得说明的是,为描述的方便和简洁,说明书中所描述的实施例均属于优选实施例,其所涉及的部分并不一定是本发明所必须的,例如,输入模块1120和展示模块1130,在具体实施时可以是相互独立的装置也可以是同一个装置,本公开对此不作限定。
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现手写文字识别方法中任一项所述方法的步骤。
本公开实施例还提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现手写文字识别方法中任一项所述方法的步骤。
图12是根据一示例性实施例示出的一种电子设备1200的框图。该电子设备1200可以被配置为一教学终端,以执行上述手写文字识别方法。如图11所示,该电子设备1200可以包括:处理器1201,存储器1202。该电子设备1200还可以包括多媒体组件1203,输入/输出(I/O)接口1204,以及通信组件1205中的一者或多者。
其中,处理器1201用于控制该电子设备1200的整体操作,以完成上述的手写文字识别方法中的全部或部分步骤。存储器1202用于存储各种类型的数据以支持在该电子设备1200的操作,这些数据例如可以包括用于在该电子设备1200上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如学校数据、课程数据、班级数据、教师以及教室数据等等。该存储器1202可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件1203可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1202或通过通信组件1205发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口1204为处理器1201和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件1205用于该电子设备1200与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙等等。因此相应的该通信组件1205可以包括:Wi-Fi模块,蓝牙模块等等。
在一示例性实施例中,电子设备1200可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的手写文字识别方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的手写文字识别方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器1202,上述程序指令可由电子设备1200的处理器1201执行以完成上述的手写文字识别方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (9)
1.一种手写文字识别方法,其特征在于,包括:
获取待识别手写文字;
将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别手写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;
将所述识别结果进行展示;
其中,所述连笔概率是通过以下方式确定的:
对降采样后的样本文字进行坐标归一化,得到备用样本文字;
从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;
根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率;
其中,所述根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率,包括:
根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;
根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;
基于最小二乘法,根据所述先写笔画的收笔点的笔点特征以及所述收笔点之前的多个行笔点的笔点特征拟合得到第一直线,并根据所述后写笔画的起笔点的笔点特征以及所述起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括所述收笔点之前的多个行笔点以及所述起笔点之后的多个行笔点;
根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角;
根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率;
其中,所述距离阈值是根据所述样本文字的文字宽度确定的。
2.根据权利要求1所述的方法,其特征在于,所述笔点特征是通过以下方式确定的:
根据所述备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征;
其中,所述笔点类型包括起笔点、行笔点和收笔点。
3.根据权利要求1所述的方法,其特征在于,所述根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率,包括:
在所述起收笔点距离小于所述距离阈值,和/或,所述直线夹角小于所述预设角度阈值的情况下,将预设连笔概率作为所述两个笔画的连笔概率;
在所述起收笔点距离大于等于所述距离阈值,且所述直线夹角大于等于所述预设角度阈值的情况下,确定所述两个笔画的连笔概率为0。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述样本文字的降采样包括:
针对所述样本文字中的每一笔画,确定相邻行笔点坐标的欧式距离;
将欧式距离小于距离阈值的行笔点剔除,得到有效行笔点;
根据所述有效行笔点、该笔画的起笔点以及收笔点,得到降采样后的样本文字。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述对降采样后的样本文字进行坐标归一化,得到备用样本文字,包括:
根据降采样后的样本文字中各笔点的笔点坐标,计算所述笔点坐标的均值和方差;
根据所述均值以及所述方差,对降采样后的样本文字进行坐标归一化,得到所述备用样本文字。
6.根据权利要求1所述的方法,其特征在于,所述文字识别模型是通过如下方式训练得到的:
将所述样本文字的笔点特征输入到双向神经网络层中,所述双向神经网络层的第1层神经网络层中的隐含层的维度为96维,第2层神经网络层中的隐含层的维度为64维;
将所述双向神经网络层的输出作为均值池化层的输入,得到维度降低的笔点特征;
按照预设随机概率将所述每两个笔画之间的连接概率置0;
根据所述维度降低的笔点特征以及随机置0后的连接概率,通过全连接层中26维的编码层进行编码;
将编码后的笔点特征输入到分类模型中进行分类,得到所述全连接层输出的文字参数量,直到所述文字参数量满足预设文字分类的参数量,训练得到所述文字识别模型。
7.一种手写文字识别装置,其特征在于,所述装置包括:
获取模块,被配置为用于获取待识别手写文字;
输入模块,被配置为用于将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别手写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;
展示模块,被配置为用于将所述识别结果进行展示;
降采样模块,被配置为用于对降采样后的样本文字进行坐标归一化,得到备用样本文字;
第二确定模块,被配置为用于从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;
概率确定模块,被配置为用于根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率;
其中,所述概率确定模块,包括:
第一确定子模块,被配置为用于根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;
距离确定子模块,被配置为用于根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;
直线拟合子模块,被配置为用于基于最小二乘法,根据所述先写笔画的收笔点的笔点特征以及所述收笔点之前的多个行笔点的笔点特征拟合得到第一直线,并根据所述后写笔画的起笔点的笔点特征以及所述起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括所述收笔点之前的多个行笔点以及所述起笔点之后的多个行笔点;
第二确定子模块,被配置为用于根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角;
第三确定子模块,被配置为用于根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率;
其中,所述距离阈值是根据所述样本文字的文字宽度确定的。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
9.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210101139.XA CN114529910B (zh) | 2022-01-27 | 2022-01-27 | 手写文字识别方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210101139.XA CN114529910B (zh) | 2022-01-27 | 2022-01-27 | 手写文字识别方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114529910A CN114529910A (zh) | 2022-05-24 |
CN114529910B true CN114529910B (zh) | 2024-09-06 |
Family
ID=81621923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210101139.XA Active CN114529910B (zh) | 2022-01-27 | 2022-01-27 | 手写文字识别方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114529910B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115344893B (zh) * | 2022-08-30 | 2023-03-28 | 深圳市创富金科技有限公司 | 基于文字特征识别的交易方法、装置及设备 |
CN117519515B (zh) * | 2024-01-05 | 2024-05-28 | 深圳市方成教学设备有限公司 | 一种用于记忆黑板的文字识别方法、装置和记忆黑板 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853126A (zh) * | 2010-05-12 | 2010-10-06 | 中国科学院自动化研究所 | 一种联机手写句子实时识别方法 |
CN113095171A (zh) * | 2021-03-29 | 2021-07-09 | Oppo广东移动通信有限公司 | 书写字符识别方法及装置、电子设备、存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516674B (zh) * | 2019-09-04 | 2023-04-18 | 中国地质调查局西安地质调查中心 | 一种文本图像的手写汉字分割方法及系统 |
CN111310543B (zh) * | 2019-12-04 | 2023-05-30 | 湖北工业大学 | 在线笔迹认证中笔画提连笔特征的提取及认证方法 |
CN111738167A (zh) * | 2020-06-24 | 2020-10-02 | 华南理工大学 | 一种无约束手写文本图像的识别方法 |
CN112232195B (zh) * | 2020-10-15 | 2024-02-20 | 北京临近空间飞行器系统工程研究所 | 一种手写汉字识别方法、装置及存储介质 |
-
2022
- 2022-01-27 CN CN202210101139.XA patent/CN114529910B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853126A (zh) * | 2010-05-12 | 2010-10-06 | 中国科学院自动化研究所 | 一种联机手写句子实时识别方法 |
CN113095171A (zh) * | 2021-03-29 | 2021-07-09 | Oppo广东移动通信有限公司 | 书写字符识别方法及装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114529910A (zh) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114529910B (zh) | 手写文字识别方法、装置、存储介质及电子设备 | |
KR101354663B1 (ko) | 수기 기호 인지 방법 및 장치 | |
CN107423278B (zh) | 评价要素的识别方法、装置及系统 | |
CN110929477B (zh) | 关键词变体的确定方法和装置 | |
CN107341143B (zh) | 一种句子连贯性判断方法及装置和电子设备 | |
EP3215981B1 (en) | Nonparametric model for detection of spatially diverse temporal patterns | |
US20220083742A1 (en) | Man-machine dialogue method and system, computer device and medium | |
CN102750552B (zh) | 一种手写识别方法、系统及手写识别终端 | |
CN112528637A (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
WO2006061852A1 (en) | System, method, and apparatus for triggering recognition of a handwritten shape | |
Ruan et al. | Dynamic gesture recognition based on improved DTW algorithm | |
CN110795935A (zh) | 文字词向量模型的训练方法、装置、终端及存储介质 | |
CN110866499B (zh) | 手写文本识别方法、系统、设备及介质 | |
CN111625636B (zh) | 一种人机对话的拒绝识别方法、装置、设备、介质 | |
CN110968697A (zh) | 文本分类方法、装置、设备及可读存储介质 | |
CN113590078A (zh) | 虚拟形象合成方法、装置、计算设备及存储介质 | |
CN110414622B (zh) | 基于半监督学习的分类器训练方法及装置 | |
Ren et al. | Recognition of online handwriting with variability on smart devices | |
CN111859948B (zh) | 语言识别、语言模型训练、字符预测方法及装置 | |
CN111079433A (zh) | 一种事件抽取方法、装置及电子设备 | |
CN116306612A (zh) | 一种词句生成方法及相关设备 | |
CN115346223A (zh) | 书写信息的评测方法和装置、电子设备和存储介质 | |
JP4958236B2 (ja) | 手書きパターンを認識するための方法及び装置 | |
CN110889290B (zh) | 文本编码方法和设备、文本编码有效性检验方法和设备 | |
CN104850819B (zh) | 信息处理方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |