CN112733816A - 一种手写轨迹识别方法、装置、设备及介质 - Google Patents

一种手写轨迹识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN112733816A
CN112733816A CN202110336981.7A CN202110336981A CN112733816A CN 112733816 A CN112733816 A CN 112733816A CN 202110336981 A CN202110336981 A CN 202110336981A CN 112733816 A CN112733816 A CN 112733816A
Authority
CN
China
Prior art keywords
track
coordinate points
track data
data
trajectory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110336981.7A
Other languages
English (en)
Inventor
张子浩
杨家博
李兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN202110336981.7A priority Critical patent/CN112733816A/zh
Publication of CN112733816A publication Critical patent/CN112733816A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本公开涉及一种手写轨迹识别方法、装置、设备及介质,通过获取轨迹数据,其中轨迹数据包括多个坐标点,根据轨迹数据得到与轨迹数据中的坐标点对应的序列矩阵,将序列矩阵输入到字符识别模型中,确定轨迹数据对应的字符,本公开将获取的手写轨迹数据转换为序列矩阵进行字符识别,能够确定手写轨迹的方向,保留更多的用户手写特征,近而反映出用户的书写习惯,确保用户的书写规范性。

Description

一种手写轨迹识别方法、装置、设备及介质
技术领域
本公开涉及人工智能技术领域,尤其涉及一种手写轨迹识别方法、装置、设备及介质。
背景技术
随着智能移动设备的快速发展,在移动设备上进行手写轨迹字符识别已广泛应用于生活中,目前,针对手写轨迹进行识别的方法中,大多是采用将移动设备中获取的手写轨迹生成图像的方法,再对图像进行轨迹字符识别。
但是,将手写轨迹生成图片不能确定手写轨迹字符的轨迹方向,例如,在移动设备上手写“1”,可以从上到下,也可以从下到上,根据生成的图片无法确定手写轨迹的方向以及保留更多的用户手写特征,也不便于确定用户的书写规范能力。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种手写轨迹识别方法、装置、设备以及介质。
第一方面,本公开实施例提供了一种手写轨迹识别方法,包括:
获取轨迹数据,所述轨迹数据包括多个坐标点。
可选的,获取轨迹数据之前,所述方法还包括:获取第一轨迹数据样本、所述第一轨迹数据样本中的字符以及所述第一轨迹数据样本中的概率值;构建字符识别网络,根据所述第一轨迹数据样本、所述第一轨迹数据样本中的字符和所述第一轨迹数据样本中的概率值对所述字符识别网络进行训练,得到字符识别模型。
根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵。
可选的,根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵,具体包括:将所述轨迹数据中的坐标点进行预处理;对所述预处理后的轨迹数据进行采样,得到目标轨迹;根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵。
可选的,将所述轨迹数据中的坐标点进行预处理,其中坐标点包括横坐标和纵坐标,具体包括:获取所述轨迹数据中横坐标的最大值和最小值;获取所述轨迹数据中纵坐标的最大值和最小值;根据所述横坐标的最小值和纵坐标的最小值,生成坐标原点;根据所述坐标原点对所述轨迹数据中的坐标点进行数据归一化;根据所述横坐标的最大值和最小值,确定第一边长;根据所述纵坐标的最大值和最小值,确定第二边长;根据所述第一边长、第二边长和预设边长,对所述数据归一化后的轨迹数据中的坐标点进行缩放。
可选的,对所述预处理后的轨迹数据进行采样,得到目标轨迹,具体包括:确定所述预处理后的轨迹数据中坐标点的数量;判断所述坐标点的数量是否大于预设阈值,如果是,则按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹;如果否,则将预设坐标点添加至所述预处理后的轨迹数据中,得到目标轨迹。
可选的,按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,具体包括:根据所述坐标点的数量和所述预设阈值,确定采样频率;按照所述采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹。
可选的,根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵,具体包括:根据所述目标轨迹中坐标点的横坐标和纵坐标,按照所述目标轨迹中每个坐标点生成的时间顺序,得到与所述目标轨迹中坐标点对应的序列矩阵。
将所述序列矩阵输入到预先训练完成的字符识别模型中,确定所述轨迹数据对应的字符。
可选的,所述方法还包括:将所述序列矩阵输入到预先训练完成的字符识别模型中,得到所述轨迹数据对应的概率值。
第二方面,本公开实施例提供了一种手写轨迹识别装置,包括:
获取模块,用于获取轨迹数据,所述轨迹数据包括多个坐标点;
序列矩阵生成模块,用于根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵;
字符识别模块,用于将所述序列矩阵输入到预先训练完成的字符识别模型中,确定所述轨迹数据对应的字符。
第三方面,本公开实施例提供了一种手写轨迹识别设备,包括
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现上述的方法。
第四方面,本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的方法。
本公开实施例提供的一种手写轨迹识别方法,通过获取轨迹数据,其中轨迹数据包括多个坐标点,根据轨迹数据得到与轨迹数据中的坐标点对应的序列矩阵,将序列矩阵输入到字符识别模型中,确定轨迹数据对应的字符,本公开将获取的手写轨迹数据转换为序列矩阵进行字符识别,能够确定手写轨迹的方向,保留更多的用户手写特征,近而反映出用户的书写习惯,便于确保用户的书写规范性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的应用场景的示意图;
图2为本公开实施例提供的一种字符识别模型训练方法的示意图;
图3为本公开实施例提供的手写轨迹示意图;
图4为本公开实施例提供的一种字符识别模型网络结构图;
图5为本公开实施例提供的一种手写轨迹识别方法的流程图;
图6为本公开实施例提供的一种手写轨迹识别方法的流程图;
图7为本公开实施例提供的一种手写轨迹识别方法的流程图;
图8为本公开实施例提供的一种手写轨迹识别方法的流程图;
图9为本公开实施例提供的一种手写轨迹识别装置的结构示意图;
图10为本公开实施例提供的手写轨迹识别设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
目前,针对手写轨迹进行识别的方法中,多是将移动设备中获取的手写轨迹生成图像,在对图像进行轨迹字符识别,但生成的图像无法确定手写轨迹的方法,不便于确保用户的手写规范性。
具体的,手写轨迹识别方法可以由终端或服务器来执行。具体的,终端或服务器可以通过字符识别模型对轨迹数据中的字符进行识别。字符识别模型的训练方法的执行主体和手写轨迹识别方法的执行主体可以相同,也可以不同。
例如,在一种应用场景中,如图1所示,服务器12对字符识别模型进行训练。终端11从服务器12获取训练完成的字符识别模型,终端11通过该训练完成的字符识别模型对轨迹数据中的字符进行识别。该轨迹数据可以是在终端11的屏幕上手写字符获得的。或者,该轨迹数据是终端11从其他设备中获取的,并不对其他设备做具体限定。
在另一种应用场景中,服务器12对字符识别模型进行训练。进一步,服务器12通过训练完成的字符识别模型对轨迹数据中的字符进行识别。服务器12获取轨迹数据的方式可以类似于如上所述的终端11获取轨迹数据的方式,此处不再赘述。
在又一种应用场景中,终端11对字符识别模型进行训练。进一步,终端11通过训练完成的字符识别模型对轨迹数据中的字符进行识别。
可以理解的是,本公开实施例提供的字符识别模型训练方法、手写轨迹识别方法并不限于如上所述的几种可能场景。由于训练完成的字符识别模型可应用在手写轨迹识别方法中,因此,在介绍手写轨迹识别方法之前,下面可以先介绍一下字符识别模型训练方法。
下面以服务器12训练字符识别模型为例,介绍一种字符识别模型训练方法,即字符识别模型的训练过程。可以理解的是,该字符识别模型训练方法同样适用于终端11训练字符识别模型的场景中。
图2为本公开实施例提供的一种字符识别模型训练方法的示意图;图3为本公开实施例提供的手写轨迹的示意图,图3可以通过终端11获得,即在终端11的屏幕上手写字符,终端11屏幕展示的手写轨迹可以为图3所示,可以看到,图3中手写的字符为5.17103,包含8条轨迹,同时每条轨迹均包含多个坐标点,屏幕手写字符可以是数字、文字、字母和符号等,在此不作限定。以图3中手写轨迹的示意图为例,对图2所述字符识别模型训练方法进行说明,具体包括以下步骤:
S210、获取第一轨迹数据样本、所述第一轨迹数据样本中的字符以及所述第一轨迹数据样本中的概率值。
可理解的,获取第一轨迹数据样本、第一轨迹数据样本中包含的字符以及第一轨迹数据样本中手写轨迹的概率值,其中概率值可以是第一轨迹数据样本中包含的每条轨迹的书写是否规范的概率。
可理解的,S210中获取的第一轨迹数据样本可以是在终端屏幕上手写字符生成的,其中轨迹数据可以包含1个或多个轨迹,例如,图3中包括8条轨迹,每个轨迹包括多个坐标点。
S220、构建字符识别网络,根据所述第一轨迹数据样本、所述第一轨迹数据样本中的字符和所述第一轨迹数据样本中的概率值对所述字符识别网络进行训练,得到字符识别模型。
可理解的,根据S210获得第一轨迹数据样本、第一轨迹数据样本中的字符和第一轨迹数据样本中的概率值对字符识别网络进行训练,更新网络参数,得到字符识别模型,其中,根据第一轨迹数据样本,得到与第一轨迹数据样本对应的第一序列矩阵样本,并将第一序列矩阵样本、第一轨迹数据样本中的字符和第一轨迹数据样本中的概率值输入到字符识别网络中进行训练。
示例性的,如图4所示的网络结构图,字符识别模型中包括输入层、4层卷积层C、全连接层F1和输出层,其中4层卷积层C的每一层设置的参数可以不同,第一层卷积层C1采用两个卷积网络,第一个卷积网络采用3*3的卷积核,步长为1,第二个卷积网络采用3*3的卷积核,步长为2;第二层卷积层C2与第一层卷积层的参数设置相同,包括第三个卷积网络和第四个卷积网络;第三层卷积层C3采用三个卷积网络,第五个卷积网络和第六个卷积网络均采用3*3的卷积核,步长为1,第七个卷积网络采用3*3的卷积核,步长为5;第四层卷积层C4包括两个分别与第三层卷积层C3相连的第八个卷积网络和第九个卷积网络,其中第八个卷积网络输出的是字符识别模型预测的第一轨迹数据样本中的概率值所对应的特征,第九个卷积网络输出的是字符识别模型预测的第一轨迹数据样本中的字符所对应的特征。输出层选择sigmod激活函数,将输出值固定在0~1范围内,并将输出值最大的类别确定为轨迹数据对应的字符,即识别结果。
本公开实施例提供的一种字符识别模型训练方法,通过获取第一轨迹数据样本、第一轨迹数据样本中的字符以及第一轨迹数据样本中的概率值,输入到构建的字符识别网络中,对字符识别网络进行训练,得到字符识别模型,能够确定轨迹数据中的字符,且识别的精度比较高,同时输出手写轨迹的概率值,对用户的手写规范性进行评价。
图5为本公开实施例提供的一种手写轨迹识别方法的流程图。例如,手写轨迹识别方法可以由终端11来执行。同理,手写轨迹识别方法也可以由服务器12来执行。具体的,终端11可以从服务器12获取训练完成的字符识别模型,进一步,终端11根据该训练完成的字符识别模型,对轨迹数据中的字符进行识别。具体的,该方法具体步骤如下:
S510、获取轨迹数据,所述轨迹数据包括多个坐标点。
例如,通过终端11的显示屏获取手写字符的轨迹数据,可选的,手写字符可以为数字、文字、字母和符号等同一个类型或不同类型的组合所得到的轨迹数据,其中,轨迹数据包含多个坐标点。
S520、根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵。
可理解的,根据步骤S510获取的轨迹数据,得到与轨迹数据中坐标点对应的序列矩阵,其中,序列矩阵是由轨迹数据中包含的多个坐标点生成的,轨迹数据中包含一个或多个轨迹,将每个轨迹的坐标点整合到同一个序列矩阵中。
S530、将所述序列矩阵输入到预先训练完成的字符识别模型中,确定所述轨迹数据对应的字符。
可理解的,将S520中得到的序列矩阵输入到上述生成的字符识别模型中,确定轨迹数据中包含的字符。
示例性的,以图3中的手写轨迹的示意图为例,在屏幕上手写的轨迹为5.17103,同时包括数字和字符,获取到的轨迹数据中有8条轨迹,根据每条轨迹的坐标点生成序列矩阵,以图3中的“5”为例,包含两条轨迹即书写时需要两笔完成,将序列矩阵中属于“5”的两条轨迹之间用空字符隔开,再利用字符识别模型进行字符识别,识别出两条轨迹代表的字符,再将两条轨迹的识别结果相结合,得到最后的识别结果为“5”。
可选的,上述方法还包括:将所述序列矩阵输入到预先训练完成的字符识别模型中,得到所述轨迹数据对应的概率值。
可理解的,将序列矩阵输入到预先训练完成的字符识别模型中,除了得到字符识别结果,还可以得到轨迹数据对应的概率值,用于确定手写轨迹的规范性。
可选的,判断所述概率值是否大于预设阈值,如果是,则确定所述轨迹数据对应的字符书写规范;如果否,则确定所述轨迹数据对应的字符书写不规范。
示例性的,若获取到的轨迹数据如图3所示,为阿拉伯数字和小数点的组合,那么可将字符识别模型识别的类型确定为12种类别,即1-9的数值、空字符和小数点,其中空字符可以解决未写任何数据的情况。
本公开实施例提供的一种手写轨迹识别方法,通过获取轨迹数据,其中轨迹数据包括多个坐标点,根据轨迹数据得到与轨迹数据中的坐标点对应的序列矩阵,将序列矩阵输入到字符识别模型中,确定轨迹数据对应的字符,本公开将获取的手写轨迹数据转换为序列矩阵进行字符识别,能够确定手写轨迹的方向,保留更多的用户手写特征,近而反映出用户的书写习惯,便于确保用户的书写规范性。
在上述实施例的基础上,可选的,根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵,包括如图6所示的如下几个步骤:
S610、将所述轨迹数据中的坐标点进行预处理。
可理解的,因为不同终端的分辨率不同,用户手写字符的大小不同,得到的坐标点的数量也不同,因此对于获取的轨迹数据进行统一的预处理,将获取的轨迹数据进行归一化并缩放到同一尺度下。
S620、对所述预处理后的轨迹数据进行采样,得到目标轨迹。
可理解的,S610对所述轨迹数据进行预处理后,对所述预处理后的轨迹数据进行采样,得到目标轨迹,其中,对轨迹数据进行预处理后,所有数据均在同一坐标范围内,避免因不同终端的采样频率不同,导致的获取的轨迹数据中的坐标点数量不一致的问题。
S630、根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵。
可理解的,根据S620中所述目标轨迹中的坐标点,每个坐标点包含横坐标和纵坐标,将每个坐标点的横纵坐标转换为序列矩阵,即生成的序列矩阵包含两个维度,例如,根据目标轨迹中包含的轨迹条数、每条轨迹经过采样后包含的坐标点数以及横纵坐标,确定序列矩阵的大小,在序列矩阵中将目标轨迹中有轨迹的数据点填充1,没有轨迹的数据点填充0,优选的,轨迹条数可以为20条。
可选的,根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵,具体包括:根据所述目标轨迹中坐标点的横坐标和纵坐标,按照所述目标轨迹中每个坐标点生成的时间顺序,得到与所述目标轨迹中坐标点对应的序列矩阵。
可理解的,根据所目标轨迹中每个坐标点生成的事件顺序,注意填充上述确定大小的序列矩阵的值,其中,序列矩阵的每一行代表一条轨迹,第一维数据可以存储与目标轨迹中横坐标值对应的值,第二维数据可以存储与目标轨迹中纵坐标值对应的值。
本公开实施例提供的一种手写轨迹识别方法,通过对获取的轨迹数据进行预处理,对所述预处理后的轨迹数据进行采样,得到目标轨迹,解决了不同终端获取到的轨迹数据不一致的情况,将获取的轨迹数据转换为序列矩阵,确定手写轨迹的方向,最大限度的保留了手写轨迹的特征的同时,也减少了数据量。
在上述实施例的基础上,可选的,将所述轨迹数据中的坐标点进行预处理,其中坐标点包括横坐标和纵坐标,包括如图7所示的如下几个步骤:
S710、获取所述轨迹数据中横坐标的最大值和最小值;获取所述轨迹数据中纵坐标的最大值和最小值。
可理解的,统计轨迹数据中包含的所有坐标点中横纵坐标的最大值和最小值。
S720、根据所述横坐标的最小值和纵坐标的最小值,生成坐标原点。
可理解的,将S710统计的横坐标的最小值和纵坐标的最小值作为坐标原点,将S710统计的横坐标的最大值和纵坐标的最大值作为最大坐标点。
S730、根据所述坐标原点对所述轨迹数据中的坐标点进行数据归一化。
可理解的,将轨迹数据中的所有坐标点与S720中得到的坐标远点进行差值运算,即将所有坐标点进行偏移,将所有坐标点映射到统一坐标范围内,完成数据归一化处理。
S740、根据所述横坐标的最大值和最小值,确定第一边长;根据所述纵坐标的最大值和最小值,确定第二边长。
可理解的,根据确定的第一边长和第二边长得到轨迹数据中所有坐标点映射的范围。
S750、根据所述第一边长、第二边长和预设边长,对所述数据归一化后的轨迹数据中的坐标点进行缩放。
可理解的,将第一边长和第二边长范围内的坐标点缩放至预设边长,例如,根据坐标点中横纵坐标的最值确定的第一边长和第二边长分别为200*200,预设边长为100,则将200缩放到100,即将轨迹数据中的所有坐标点缩小2倍。
本公开实施例提供的一种手写轨迹识别方法,对获取到的轨迹数据进行数据归一化和缩放处理,将轨迹数据中的所有坐标点映射到同一坐标范围内,便于后续将轨迹数据转换为序列矩阵。
在上述实施例的基础上,可选的,对所述预处理后的轨迹数据进行采样,得到目标轨迹,包括如图8所示的如下几个步骤:
S810、确定所述预处理后的轨迹数据中坐标点的数量。
可理解的,统计进行数据归一化和缩放后的轨迹数据中包含的所有坐标点的数量。
S820、判断所述坐标点的数量是否大于预设阈值,如果是,则按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹。
可理解的,判断S810统计的坐标点的数量是否大于预设阈值,如果是,则按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹,可选地,预设阈值可以为20,即坐标点的数量若大于20,则按照确定的采样频率对轨迹数据中的坐标点进行采样。
可选的,按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,具体包括:根据所述坐标点的数量和所述预设阈值,确定采样频率;按照所述采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹。
可理解的,将获取的坐标点的数量除以预设阈值,将得到的值向下取整确定为采样频率,根据采样频率对预处理后的轨迹数据的坐标点进行采样,采样数量达到预设阈值时可停止采样,根据采样后的坐标点得到目标轨迹。
示例性的,获取到的坐标点的数量为50,则利用50除以20并向下取整确定采样频率为2,以采样频率2对轨迹数据中的50个坐标点进行采样,直到采样后得到的坐标点数量达到20,即停止采样,将采样的20个坐标点数据作为目标轨迹。
S830、如果否,则将预设坐标点添加至所述预处理后的轨迹数据中,得到目标轨迹。
可理解的,根据S820判断坐标点的数值小于预设阈值,则将预设坐标点添加至轨迹数据中,直至坐标点的数量为预设阈值,则将添加预设坐标点的轨迹数据作为目标轨迹,可选地,预设坐标点可以为(-1,-1),例如统计出的坐标点数量为15,则需要添加5个(-1,-1)的坐标点直至坐标点数量为20,因此,可由轨迹条数、坐标点数以及横纵坐标得到20*20*2的序列矩阵。
本公开实施例提供的一种手写轨迹识别方法,通过统计轨迹数据中包含的坐标点数量,判断与预设阈值的关系,对轨迹数据中的坐标点进行采样,能够最大限度的确保轨迹的走向趋势,同时也能够减少信息冗余。
图9为本公开实施例提供的手写轨迹识别装置的结构示意图。本公开实施例提供的手写轨迹识别装置可以执行手写轨迹识别方法实施例提供的处理流程,如图9所示,手写轨迹识别装置900包括:
获取模块910,用于用于获取轨迹数据,所述轨迹数据包括多个坐标点;
序列矩阵生成模块920,用于根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵;
字符识别模块930,用于将所述序列矩阵输入到预先训练完成的字符识别模型中,确定所述轨迹数据对应的字符。
可选的,获取模块910之前,手写轨迹识别装置900还包括:获取第一轨迹数据样本、所述第一轨迹数据样本中的字符以及所述第一轨迹数据样本中的概率值;构建字符识别网络,根据所述第一轨迹数据样本、所述第一轨迹数据样本中的字符和所述第一轨迹数据样本中的概率值对所述字符识别网络进行训练,得到字符识别模型。
可选的,序列矩阵生成模块920中根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵,具体用于:将所述轨迹数据中的坐标点进行预处理;对所述预处理后的轨迹数据进行采样,得到目标轨迹;根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵。
可选的,将所述轨迹数据中的坐标点进行预处理,其中坐标点包括横坐标和纵坐标,具体用于:获取所述轨迹数据中横坐标的最大值和最小值;获取所述轨迹数据中纵坐标的最大值和最小值;根据所述横坐标的最小值和纵坐标的最小值,生成坐标原点;根据所述坐标原点对所述轨迹数据中的坐标点进行数据归一化;根据所述横坐标的最大值和最小值,确定第一边长;根据所述纵坐标的最大值和最小值,确定第二边长;根据所述第一边长、第二边长和预设边长,对所述数据归一化后的轨迹数据中的坐标点进行缩放。
可选的,对所述预处理后的轨迹数据进行采样,得到目标轨迹,具体用于:确定所述预处理后的轨迹数据中坐标点的数量;判断所述坐标点的数量是否大于预设阈值,如果是,则按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹;如果否,则将预设坐标点添加至所述预处理后的轨迹数据中,得到目标轨迹。
可选的,按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,具体用于:根据所述坐标点的数量和所述预设阈值,确定采样频率;按照所述采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹。
可选的,根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵,具体用于:根据所述目标轨迹中坐标点的横坐标和纵坐标,按照所述目标轨迹中每个坐标点生成的时间顺序,得到与所述目标轨迹中坐标点对应的序列矩阵。
可选的,字符识别模块930还用于:将所述序列矩阵输入到预先训练完成的字符识别模型中,得到所述轨迹数据对应的概率值。
图9所示实施例的手写轨迹识别装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图10为本公开实施例提供的手写轨迹识别设备的结构示意图。该设备可以是如上所述的服务器或终端。本公开实施例提供的手写轨迹识别设备可以执行上述实施例提供的处理流程,如图10所示,手写轨迹识别设备1000包括:处理器1100、通讯接口1200和存储器1300;其中,计算机程序存储在存储器1300中,并被配置为由处理器1100执行如上述的手写轨迹识别方法。
另外,本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的手写轨迹识别方法。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种手写轨迹识别方法,其特征在于,包括:
获取轨迹数据,所述轨迹数据包括多个坐标点;
根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵;
将所述序列矩阵输入到预先训练完成的字符识别模型中,确定所述轨迹数据对应的字符。
2.根据权利要求1所述的方法,其特征在于,所述根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵,包括:
将所述轨迹数据中的坐标点进行预处理;
对所述预处理后的轨迹数据进行采样,得到目标轨迹;
根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵。
3.根据权利要求2所述的方法,其特征在于,所述将所述轨迹数据中的坐标点进行预处理,其中坐标点包括横坐标和纵坐标,所述方法包括:
获取所述轨迹数据中横坐标的最大值和最小值;获取所述轨迹数据中纵坐标的最大值和最小值;
根据所述横坐标的最小值和纵坐标的最小值,生成坐标原点;
根据所述坐标原点对所述轨迹数据中的坐标点进行数据归一化;
根据所述横坐标的最大值和最小值,确定第一边长;根据所述纵坐标的最大值和最小值,确定第二边长;
根据所述第一边长、第二边长和预设边长,对所述数据归一化后的轨迹数据中的坐标点进行缩放。
4.根据权利要求2所述的方法,其特征在于,所述对所述预处理后的轨迹数据进行采样,得到目标轨迹,包括:
确定所述预处理后的轨迹数据中坐标点的数量;
判断所述坐标点的数量是否大于预设阈值,如果是,则按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹;
如果否,则将预设坐标点添加至所述预处理后的轨迹数据中,得到目标轨迹。
5.根据权利要求4所述的方法,其特征在于,所述按照采样频率对所述预处理后的轨迹数据的坐标点进行采样,包括:
根据所述坐标点的数量和所述预设阈值,确定采样频率;
按照所述采样频率对所述预处理后的轨迹数据的坐标点进行采样,得到目标轨迹。
6.根据权利要求2所述的方法,其特征在于,所述根据所述目标轨迹中的坐标点,得到与所述目标轨迹中坐标点对应的序列矩阵,包括:
根据所述目标轨迹中坐标点的横坐标和纵坐标,按照所述目标轨迹中每个坐标点生成的时间顺序,得到与所述目标轨迹中坐标点对应的序列矩阵。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述序列矩阵输入到预先训练完成的字符识别模型中,得到所述轨迹数据对应的概率值。
8.根据权利要求1所述的方法,其特征在于,所述获取轨迹数据之前,所述方法还包括:
获取第一轨迹数据样本、所述第一轨迹数据样本中的字符以及所述第一轨迹数据样本中的概率值;
构建字符识别网络,根据所述第一轨迹数据样本、所述第一轨迹数据样本中的字符和所述第一轨迹数据样本中的概率值对所述字符识别网络进行训练,得到字符识别模型。
9.一种手写轨迹识别装置,其特征在于,包括:
获取模块,用于获取轨迹数据,所述轨迹数据包括多个坐标点;
序列矩阵生成模块,用于根据所述轨迹数据,得到与所述轨迹数据中坐标点对应的序列矩阵;
字符识别模块,用于将所述序列矩阵输入到预先训练完成的字符识别模型中,确定所述轨迹数据对应的字符。
10.一种手写轨迹识别设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-8中任一所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一所述的方法。
CN202110336981.7A 2021-03-30 2021-03-30 一种手写轨迹识别方法、装置、设备及介质 Pending CN112733816A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110336981.7A CN112733816A (zh) 2021-03-30 2021-03-30 一种手写轨迹识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110336981.7A CN112733816A (zh) 2021-03-30 2021-03-30 一种手写轨迹识别方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN112733816A true CN112733816A (zh) 2021-04-30

Family

ID=75596002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110336981.7A Pending CN112733816A (zh) 2021-03-30 2021-03-30 一种手写轨迹识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112733816A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588073A (en) * 1992-02-14 1996-12-24 Goldstar Co., Ltd. Online handwritten character recognizing system and method thereof
CN106354252A (zh) * 2016-08-18 2017-01-25 电子科技大学 一种基于stdw的连续字符手势轨迹识别方法
CN111695527A (zh) * 2020-06-15 2020-09-22 内蒙古大学 一种蒙古文在线手写体识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588073A (en) * 1992-02-14 1996-12-24 Goldstar Co., Ltd. Online handwritten character recognizing system and method thereof
CN106354252A (zh) * 2016-08-18 2017-01-25 电子科技大学 一种基于stdw的连续字符手势轨迹识别方法
CN111695527A (zh) * 2020-06-15 2020-09-22 内蒙古大学 一种蒙古文在线手写体识别方法

Similar Documents

Publication Publication Date Title
CN111401371B (zh) 一种文本检测识别方法、系统及计算机设备
CN108710866B (zh) 汉字模型训练方法、汉字识别方法、装置、设备及介质
CN108182437B (zh) 一种点选验证码识别方法、装置和用户终端
CN109740668B (zh) 深度模型训练方法及装置、电子设备及存储介质
CN110084172B (zh) 文字识别方法、装置和电子设备
CN108664975B (zh) 一种维吾尔文手写字母识别方法、系统及电子设备
CN111414946A (zh) 基于人工智能的医疗影像的噪声数据识别方法和相关装置
CN111428557A (zh) 基于神经网络模型的手写签名的自动校验的方法和装置
CN110414622B (zh) 基于半监督学习的分类器训练方法及装置
CN111666931A (zh) 基于混合卷积文字图像识别方法、装置、设备及存储介质
CN111444906A (zh) 基于人工智能的图像识别方法和相关装置
CN114639096A (zh) 文本识别方法、装置、电子设备和存储介质
CN112835807B (zh) 界面识别方法、装置、电子设备和存储介质
CN113591884B (zh) 字符识别模型的确定方法、装置、设备及存储介质
CN112733816A (zh) 一种手写轨迹识别方法、装置、设备及介质
CN115273103A (zh) 文本识别方法、装置、电子设备及存储介质
CN115294581A (zh) 错误字符的识别方法、装置、电子设备及存储介质
CN115311664A (zh) 图像中文本类别的识别方法、装置、介质及设备
CN110929767B (zh) 一种字形处理方法、系统、设备和介质
CN113128496B (zh) 一种从图像中提取结构化数据的方法、装置和设备
Li et al. A pre-training strategy for convolutional neural network applied to Chinese digital gesture recognition
CN113920291A (zh) 基于图片识别结果的纠错方法、装置、电子设备及介质
CN113591857A (zh) 字符图像处理方法、装置及古代汉籍图像的识别方法
CN116309274B (zh) 图像中小目标检测方法、装置、计算机设备及存储介质
CN113360881B (zh) 基于深度学习的验证码识别方法、系统、电子设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210430

RJ01 Rejection of invention patent application after publication