CN116959000A - 笔迹识别方法、装置、计算机设备及存储介质 - Google Patents
笔迹识别方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116959000A CN116959000A CN202310919082.9A CN202310919082A CN116959000A CN 116959000 A CN116959000 A CN 116959000A CN 202310919082 A CN202310919082 A CN 202310919082A CN 116959000 A CN116959000 A CN 116959000A
- Authority
- CN
- China
- Prior art keywords
- handwriting
- font
- text
- feature
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000000605 extraction Methods 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本申请涉及笔迹识别技术领域,本申请提供一种笔迹识别方法、装置、设备及介质,所述方法通过采集目标用户当前书写文字的书写笔迹,并提取当前书写文字的笔迹特征,然后根据目标用户对应的个性化字体数据库进行笔迹特征的匹配识别,进而实现对当前书写文字的识别,降低了特征识别的数据量,提高了手写字体的识别效率;同时,根据目标用户书写习惯构建的个性化字体数据库,其中的第一字体特征更接近于当前用户书写文字的笔迹特征,特征匹配度更高,提高了手写文字的识别精度。
Description
技术领域
本发明涉及笔迹识别技术领域,尤其涉及一种笔迹识别方法、装置、计算机设备及存储介质。
背景技术
手写识别(HandWriting Recognition)是指将在手写设备上书写时产生的有序轨迹信息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。
目前,对于手写字体的识别通常是图像处理方法和深度神经网络技术等方式实现。但是,不同的人有不同的书写风格,用户的书写方式随意、不规整,且汉字的字符级别比较复杂、极具变化特点,导致手写字体的识别精度较低。
因此,如何解决目前手写字体的识别精度低下成为了亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种笔迹识别方法、装置、设备及计算机可读存储介质,旨在解决目前手写字体的识别精度低下的技术问题。
为实现上述目的,本发明提供一种笔迹识别方法,所述笔迹识别方法包括:
采集目标用户当前书写文字的书写笔迹;
基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征;
基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征;
在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字。
此外,为实现上述目的,本发明还提供一种笔迹识别装置,所述笔迹识别装置包括:
书写笔迹采集模块,用于采集目标用户当前书写文字的书写笔迹;
笔迹特征获得模块,用于基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征;
第一字体特征匹配模块,用于基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征;
目标文字确定模块,用于在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字。
此外,为实现上述目的,本发明还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的笔迹识别程序,其中所述笔迹识别程序被所述处理器执行时,实现如上述的笔迹识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有笔迹识别程序,其中所述笔迹识别程序被处理器执行时,实现如上述的笔迹识别方法的步骤。
本发明提供一种笔迹识别方法,所述方法采集目标用户当前书写文字的书写笔迹;基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征;基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征;在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字。通过上述方式,通过采集目标用户当前书写文字的书写笔迹,并提取当前书写文字的笔迹特征,然后根据目标用户对应的个性化字体数据库进行笔迹特征的匹配识别,进而实现对当前书写文字的识别,降低了特征识别的数据量,提高了手写字体的识别效率;同时,根据目标用户书写习惯构建的个性化字体数据库,其中的第一字体特征更接近于当前用户书写文字的笔迹特征,特征匹配度更高,提高了手写文字的识别精度。
附图说明
图1为本发明实施例方案中涉及的计算机设备的硬件结构示意图;
图2为本发明笔迹识别方法第一实施例的流程示意图;
图3为本发明笔迹识别方法第一实施例中步骤20的细化流程示意图;
图4为本发明笔迹识别方法第二实施例的流程示意图;
图5为本发明笔迹识别方法第三实施例的流程示意图;
图6为本发明实施例提供的手写字体笔迹特征提取及识别的流程示意图;
图7为本发明笔迹识别方法第四实施例的流程示意图;
图8为本发明实施例提供的标准文字笔迹特征提取的流程示意图;
图9为本发明笔迹识别装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的笔迹识别方法主要应用于计算机设备,该计算机设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的计算机设备的硬件结构示意图。本发明实施例中,计算机设备可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及笔迹识别程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的笔迹识别程序,并执行本发明实施例提供的笔迹识别方法。
本发明实施例提供了一种笔迹识别方法。
参照图2,图2为本发明笔迹识别方法第一实施例的流程示意图。
本实施例中,所述笔迹识别方法包括以下步骤:
步骤S10,采集目标用户当前书写文字的书写笔迹;
在一实施例中,用户在书写文字时,使用第三方设备进行笔迹的采集。
在一实施例中,书写笔迹采集是将用户在手写设备上书写时产生的有序轨迹信息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程。
在一实施例中,采集书写笔迹的电子设备可以包括但不限于平板、电磁笔、点阵笔、点读笔等带笔迹还原效果的设备。
步骤S20,基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征;
在一实施例中,笔迹特征是个人书写习惯特征表现在笔迹中的各种征象,包括笔迹的概貌特征、局部安排特征、文字写法特征、错别字特征、搭配特征、比例特征和笔顺特征等。
在一实施例中,特征提取算法可以是书写笔迹的坐标提取算法和笔顺特征提取算法。其中,坐标提取算法可以提取当前书写文字各笔画的起始点坐标,笔顺特征提取算法可以提取当前书写文字各笔画的笔顺信息。
进一步地,如图3所示,所述步骤S20具体包括:
步骤S21、基于所述特征提取算法,提取所述书写笔迹各笔画起笔位置的点坐标以及所述书写笔迹各笔画的笔顺信息;
在一实施例中,采集到的用户手写体笔迹,进行数据导入,导入的数据包括每个书写字体的笔迹时间顺序,因此可以按照每个笔画采集的数据和时间顺序进行排列和还原,然后将字体的每个笔画进行单独数据的排列,带上时间戳的数据,对每笔笔画数据进行还原,按照编号标记其起始点的位置,从而得到各笔画起笔位置的书写顺序,即笔顺信息。
在一实施例中,因为书写笔迹的采集是在电子设备的屏幕范围内,所以用户书写文字的书写区域也即电子设备的屏幕范围。所以,可以将屏幕范围作为一个二维的坐标平面,在进行书写笔迹的采集时,可以采集当前书写文字各笔画在该二维坐标平面中的坐标值。
步骤S22、基于所述书写笔迹各笔画对应的所述点坐标和所述笔顺信息,绘制当前书写文字的特征图形,获得所述当前书写文字的笔迹特征。
在一实施例中,在确定当前书写文字各笔画起笔位置的点坐标以及各点坐标对应的笔顺顺序之后,即可使用直线将各起笔位置的点坐标按照笔顺顺序进行点对点的指向性向量连接。
在一实施例中,因为每个汉字的笔迹各笔画起笔位置的点坐标可能会重复,但是不同的汉字其笔画顺序可能是不同的,因此采用矢量直线进行笔画起始点坐标的连接,使得每个汉字对应的笔迹特征具备方向性,用以区分笔画顺序,进而使得每个汉字的矢量笔迹特征图形得以区分,由此,可以得到各汉字唯一对应的笔迹特征。
步骤S30,基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征;
在一实施例中,个性化字体数据库是根据用户个人书写习惯进行建立的,保存有用户个人书写文字的笔迹特征,属于专属字体数据库。第一字体特征即为个性化字体数据库中保存的目标用户书写的汉字的笔迹特征,因此,采用个性化字体数据库进行目标用户当前书写文字的特征匹配,文字的识别准确率是最高的。
在一实施例中,目标用户的个性化字体数据库中保存的第一字体特征是目标用户书写汉字的矢量笔迹特征图形,所以笔迹特征的匹配,也是矢量笔迹特征图形的匹配,包括笔画起笔点坐标和笔顺信息的匹配等。
在一实施例中,根据笔画起始点坐标以及笔顺信息,还可以根据矢量笔迹特征图像得到笔迹特征中各点的相对位置信息,进而获得汉字布局特征,作为特征匹配的依据。
进一步地,如图4所示,所述步骤S30之前,还包括:
步骤S301、计算所述笔迹特征与所述个性化字体数据库中各所述第一字体特征的特征相似度;
在一实施例中,笔迹特征与第一字体特征的特征相似度计算可以从特征矢量数以及矢量特征进行计算,比如首先确定当前书写文字笔迹特征中的图形适量数,也即当前书写文字的笔画数,缩小匹配范围。然后,从第一笔画起始点开始,依次计算每一笔画对应的矢量方向相似度,从而计算得到笔迹特征与第一字体特征的特征相似度。
步骤S302、在存在至少一个所述特征相似度大于或等于预设的相似度阈值时,确定所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征。
在一实施例中,如果个性化字体数据库中的第一字体特征与当前书写文字的笔迹特征的相似度大于或等于预设的相似度阈值,比如90%,则可以确定个性化字体数据库中存在该当前书写文字的笔迹特征。
在一实施例中,若存在多个第一字体特征与笔迹特征的相似度大于相似度阈值,则取用其中相似度最高的第一字体特征与笔迹特征对应。
步骤S40,在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字。
在一实施例中,当个性化字体数据库中查询到与当前书写文字的笔迹特征相匹配的第一字体特征时,即表示个性化字体数据库中已经收录了当前书写文字的笔迹特征,由此,可以确定第一字体特征对应的文字即为当前书写文字。
进一步地,在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字之后,还包括:基于所述当前书写文字对应的所述笔迹特征,替换所述个性化字体数据库中所述当前书写文字对应的所述第一字体特征,以更新所述个性化字体数据。
在一实施例中,每个人的书写习惯不同,笔迹也会不同,而即便是同一用户在书写同一汉字的时候也会存在差别,同时,用户可以通过练习改善汉字书写能力,或者改变书写字体,比如从楷体变换到宋体,笔迹特征也会存在明显差异。因此,对于个性化字体数据库,需要随着用户的汉字书写习惯同步进行数据更新,以便更准确地识别用户书写文字的笔迹特征。
在一实施例中,在个性化字体数据库匹配到目标用户当前书写文字的笔迹特征对应的第一字体特征时,即笔迹特征与第一字体特征对应同一文字,此时,可以将笔迹特征存储到个性化字体数据库中,替换第一字体特征,完成当前书写文字的个性化笔迹特征的迭代更新。
本实施例提供了一种笔迹识别方法,该方法通过采集目标用户当前书写文字的书写笔迹,并提取当前书写文字的笔迹特征,然后根据目标用户对应的个性化字体数据库进行笔迹特征的匹配识别,进而实现对当前书写文字的识别,降低了特征识别的数据量,提高了手写字体的识别效率;同时,根据目标用户书写习惯构建的个性化字体数据库,其中的第一字体特征更接近于当前用户书写文字的笔迹特征,特征匹配度更高,提高了手写文字的识别精度。
请参照图5,图5为本发明笔迹识别方法第三实施例的流程示意图。
如图5所示,基于上述图2所示实施例,所述步骤S30之后,还包括:
步骤S31、在所述个性化字体数据库中不存在所述笔迹特征对应的所述第一字体特征时,基于标准字体数据库,匹配所述笔迹特征对应的第二字体特征;
在一实施例中,个性化字体数据库是根据采集的用户书写文字的笔迹特征建立的,因为用户不会主动书写所有汉字进行笔迹采集和收录,所以个性化字体数据库存储的用户笔迹特征是实时更新的,即每采集一次用户书写汉字的笔迹特征,个性化字体数据库中的笔迹特征数据同步更新一次。更新的笔迹特征包括已收录文字的笔迹特征,更包括未收录文字的笔迹特征,因此,个性化字体数据库中收录的笔迹特征并不完整,不能涵盖所有汉字。
在一实施例中,由于个性化字体数据库不能涵盖所有文字的笔迹特征,所以,存在无法查询到当前书写文字的笔迹特征对应的第一字体特征的情况,此时,调用标准字体数据库进行当前书写文字的笔迹特征的识别。
在一实施例中,标准字体数据库包括所有汉字的标准字体对应的笔迹特征,在个性化字体数据库中匹配不到当前书写文字的笔迹特征时,则通过标准字体数据库进行特征匹配。
在一实施例中,特征匹配的过程即为当前书写文字的笔迹特征与标准字体数据库中各标准文字对应的第二字体特征相似度计算的过程。若特征相似度大于或等于预设相似度阈值,则确定标准字体数据库中存在当前书写文字的笔迹特征对应的第二字体特征,即可完成当前书写文字的识别。
示例性的,如图6所示,在采集到目标用户的手写字体之后,提取各笔画的起始点,然后根据各笔画的笔画顺序,采用带方向的直线将各笔画的起始点依次连接,获得手写字体对应的笔迹特征图形。然后,将手写字体的笔迹特征图形与标准字体的笔迹特征图形进行比对,计算两个特征图形的相似度。如果相似度大于相似度阈值,则确定该手写字体对应的即为该标准字体。
在一实施例中,标准字体数据库对应的相似度阈值与个性化字体数据库对应的相似度阈值可以不同。因为个性化字体数据库中的字体特征来源于目标用户书写文字的笔迹特征,所以特征相似度阈值可以设置的高一些,比如90%;而标准字体数据库中的字体特征是来自于标准字体的笔迹特征,所以特征相似度阈值可以设置低一些,比如75%。
可以理解地是,特征相似度阈值需要根据实际应用结果进行设置,本申请提供的特征相似度阈值是为了便于本领域技术人员理解所举证的示例,并不作为限定数值。
步骤S32、在所述标准字体数据库中存在所述笔迹特征对应的所述第二字体特征时,确定所述当前书写文字为所述第二字体特征对应的标准文字。
在一实施例中,在当前书写文字的笔迹特征与标准字体数据库中的第二字体特征匹配时,则识别到当前书写文字为第二字体特征对应的文字,完成当前书写文字的识别。
进一步地,在所述标准字体数据库中存在所述笔迹特征对应的所述第二字体特征时,确定所述当前书写文字为所述第二字体特征对应的标准文字之后,还包括:基于所述个性化字体数据库,存储所述当前书写文字对应的所述笔迹特征,以完善所述个性化字体数据库。
可以理解地是,通过标准字体数据库匹配当前书写文字的笔迹特征,表示目标用户的个性化字体数据库中并未收录该文字的笔迹特征,或者是目标用户书写该文字的方式存在较大的变化。
在一实施例中,目标用户的个性化字体数据库中不存在当前书写文字的笔迹特征或者历史存储的当前书写文字的笔迹特征已经失去识别作用时,则将当前书写文字的当前笔迹特征存储到目标用户的个性化字体数据库中,从而完善目标用户的个性化字体数据库,提高个性化字体数据库的文字识别准确性。
进一步地,继续如图5所示,所述步骤S31,还包括:
步骤S33、在所述标准字体数据库中不存在所述笔迹特征对应的所述第二字体特征时,生成提示弹窗,以提醒所述目标用户输入所述当前书写文字的笔迹特征对应的所述标准文字;
在一实施例中,标准字体数据库中存储的笔迹特征为所有汉字标准字体的笔迹特征,包括笔画顺序等特征,但是目标用户在书写汉字时,可能会存在笔画顺序不对的情况,或者存在简写、草写等书写方式,从而导致采集到的笔迹特征无法指向目标文字,个性化字体数据库和标准字体数据库均无法识别。
在一实施例中,在个性化字体数据库和标准字体数据库均无法识别到当前书写文字的笔迹特征时,电子设备生成提醒弹窗,提醒用户当前书写文字识别失败。
在一实施例中,在提醒弹窗中可以为用户提供“重新书写”、“键盘输入”以及“取消”等选项。
在一实施例中,若用户选择“重新书写”,则清除当前书写文字及其笔迹特征,为用户提供空白的书写板,以便于用户重新书写当前书写文字,并重新采集笔迹特征进行比对识别。
在一实施例中,若用户选择“键盘输入”,则在电子设备的显示屏中显示虚拟键盘,以便于用户通过拼音等方式键盘输入当前书写文字对应的标准文字。
在一实施例中,若用户选择“取消”,则终止当前书写文字的识别,清除当前书写文字的笔迹特征等数据。
步骤S34、在确定所述当前书写文字的笔迹特征对应的所述标准文字后,基于所述个性化字体数据库,存储所述当前书写文字的笔迹特征,以完善所述个性化字体数据库。
在一实施例中,在用户选择键盘输入当前书写文字的笔迹特征对应的标准文字后,即完成了当前书写文字的文字识别。此时,将当前书写文字的笔迹特征存储至目标用户的个性化字体数据库中,并且将该笔迹特征与标准文字建立对应关系,完善个性化字体数据库。
请参照图7,图7为本发明笔迹识别方法第四实施例的流程示意图。
如图7所示,本申请提供的笔迹识别方法还包括:
步骤S01、基于所述特征提取算法,提取至少一个标准文字各笔画的笔画顺序以及各笔画的起笔位置坐标;
在一实施例中,因为每种字体的形状特征不一样,因此需要按照字体类别进行相应的建库。在创建标准字体数据库时,需要获得标准汉字及其笔顺信息,然后对每个汉字建立字典键值对,存储每个汉字的特征信息。
在一实施例中,采用特征提取算法,提取标准汉字的笔画顺序以及各笔画起笔位置的坐标。其中,笔顺信息包括每一笔及其前面所有笔画集合的字体形态,一直到形成完整的汉字,因此,在每个笔画的起笔位置“取点”并进行需要标记。其次,将左右的标记点,按照笔顺的顺序,使用直线进行点对点的指向性向量连接,使得标准汉字的各笔画的起始点都具备方向性,进而提高不同汉字笔迹特征的区分度。
步骤S02、基于所述标准文字各笔画的笔画顺序以及各笔画的起笔位置坐标,绘制所述标准文字对应的特征图形,获得所述标准文字对应的笔迹特征;
在一实施例中,根据标准文笔的笔画顺序,用带方向的直线依次连接各笔画的起笔位置点,从而得到各个标准文字的标准笔迹特征。
示例性的,如图8所示,在提取“宇”字的标准笔迹特征时,在导入正楷汉字“宇”字后,同时导入笔顺数据“(上)点、(左)点、横钩、(短)横、(长)横、竖钩”;然后按照笔顺数据将上述各个笔画的起始点进行编号标记,编号按照笔顺顺序编写。对“宇”字进行标准笔迹特征的数据提取,包括将编号的标记点进行向量线性连接后,将形成一个开环的图形,即为笔迹矢量化数据,同时提取出连接后的图形数据,即为实例化图形。
步骤S03、基于各所述标准文字对应的所述笔迹特征,构建标准字体数据库。
在一实施例中,对各个标准汉字进行笔顺和汉字数据的导入,通过特征提取并对笔迹特征进行实例化,获取每个标准汉字的“笔迹矢量化、图形矢量化”数据,从而建立标准字体数据库。
在一实施例中,因为汉字的字体多种多样,同一汉字不同字体的写法不同,对应的笔迹特征也存在差异,所以可以建立对应不同字体的标准字体数据库,比如楷体、宋体、隶书体等不同字体的标准字体数据库。
在一实施例中,若建立不同字体的标准字体数据库,可以将各数据库中对应同一汉字的笔迹特征关联,从而便于手写体汉字的笔迹特征的快速匹配识别。
此外,本发明实施例还提供一种笔迹识别装置。
参照图9,图9为本发明笔迹识别装置第一实施例的功能模块示意图。
本实施例中,所述笔迹识别装置包括:
书写笔迹采集模块10,用于采集目标用户当前书写文字的书写笔迹;
笔迹特征获得模块20,用于基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征;
第一字体特征匹配模块30,用于基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征;
目标文字确定模块40,用于在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字。
在一实施例中,所述笔迹特征获得模块20,包括:
特征提取单元,用于基于所述特征提取算法,提取所述书写笔迹各笔画起笔位置的点坐标以及所述书写笔迹各笔画的笔顺信息;
笔迹特征获得单元,用于基于所述书写笔迹各笔画对应的所述点坐标和所述笔顺信息,绘制当前书写文字的特征图形,获得所述当前书写文字的笔迹特征。
在一实施例中,所述笔迹识别装置还包括第二字体特征匹配模块,所述第二字体特征匹配模块包括:
第二字体特征匹配单元,用于在所述个性化字体数据库中不存在所述笔迹特征对应的所述第一字体特征时,基于标准字体数据库,匹配所述笔迹特征对应的第二字体特征;
标准文字确定单元,用于在所述标准字体数据库中存在所述笔迹特征对应的所述第二字体特征时,确定所述当前书写文字为所述第二字体特征对应的标准文字。
在一实施例中,所述笔迹识别装置还包括数据库完善模块,用于基于所述个性化字体数据库,存储所述当前书写文字对应的所述笔迹特征,以完善所述个性化字体数据库。
在一实施例中,所述笔迹识别装置还包括输入识别模块,所述输入识别模块包括:
弹窗提醒单元,用于在所述标准字体数据库中不存在所述笔迹特征对应的所述第二字体特征时,生成提示弹窗,以提醒所述目标用户输入所述当前书写文字的笔迹特征对应的所述标准文字;
笔迹特征存储单元,用于在确定所述当前书写文字的笔迹特征对应的所述标准文字后,基于所述个性化字体数据库,存储所述当前书写文字的笔迹特征,以完善所述个性化字体数据库。
在一实施例中,所述笔迹识别装置还包括标准数据库建立模块,所述标准数据库建立模块包括:
标准文字特征提取单元,用于基于所述特征提取算法,提取至少一个标准文字各笔画的笔画顺序以及各笔画的起笔位置坐标;
标准文字特征获得单元,用于基于所述标准文字各笔画的笔画顺序以及各笔画的起笔位置坐标,绘制所述标准文字对应的特征图形,获得所述标准文字对应的笔迹特征;
标准字体数据库构建单元,用于基于各所述标准文字对应的所述笔迹特征,构建标准字体数据库。
在一实施例中,所述笔迹识别装置还包括特征相似度计算模块,所述特征相似度计算模块包括:
特征相似度计算单元,用于计算所述笔迹特征与所述个性化字体数据库中各所述第一字体特征的特征相似度;
特征相似度筛选单元,用于在存在至少一个所述特征相似度大于或等于预设的相似度阈值时,确定所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征。
其中,上述笔迹识别装置中各个模块与上述笔迹识别方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有笔迹识别程序,其中所述笔迹识别程序被处理器执行时,实现如上述的笔迹识别方法的步骤。
其中,笔迹识别程序被执行时所实现的方法可参照本发明笔迹识别方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种笔迹识别方法,其特征在于,所述笔迹识别方法包括以下步骤:
采集目标用户当前书写文字的书写笔迹;
基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征;
基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征;
在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字。
2.根据权利要求1所述的笔迹识别方法,其特征在于,所述基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征,包括:
基于所述特征提取算法,提取所述书写笔迹各笔画起笔位置的点坐标以及所述书写笔迹各笔画的笔顺信息;
基于所述书写笔迹各笔画对应的所述点坐标和所述笔顺信息,绘制当前书写文字的特征图形,获得所述当前书写文字的笔迹特征。
3.根据权利要求1所述的笔迹识别方法,其特征在于,所述基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征之后,还包括:
在所述个性化字体数据库中不存在所述笔迹特征对应的所述第一字体特征时,基于标准字体数据库,匹配所述笔迹特征对应的第二字体特征;
在所述标准字体数据库中存在所述笔迹特征对应的所述第二字体特征时,确定所述当前书写文字为所述第二字体特征对应的标准文字。
4.根据权利要求3所述的笔迹识别方法,其特征在于,所述在所述标准字体数据库中存在所述笔迹特征对应的所述第二字体特征时,确定所述当前书写文字为所述第二字体特征对应的标准文字之后,还包括:
基于所述个性化字体数据库,存储所述当前书写文字对应的所述笔迹特征,以完善所述个性化字体数据库。
5.根据权利要求3所述的笔迹识别方法,其特征在于,所述基于标准字体数据库,匹配所述笔迹特征对应的第二字体特征之后,还包括:
在所述标准字体数据库中不存在所述笔迹特征对应的所述第二字体特征时,生成提示弹窗,以提醒所述目标用户输入所述当前书写文字的笔迹特征对应的所述标准文字;
在确定所述当前书写文字的笔迹特征对应的所述标准文字后,基于所述个性化字体数据库,存储所述当前书写文字的笔迹特征,以完善所述个性化字体数据库。
6.根据权利要求1所述的笔迹识别方法,其特征在于,所述采集目标用户当前书写文字的书写笔迹之前,还包括:
基于所述特征提取算法,提取至少一个标准文字各笔画的笔画顺序以及各笔画的起笔位置坐标;
基于所述标准文字各笔画的笔画顺序以及各笔画的起笔位置坐标,绘制所述标准文字对应的特征图形,获得所述标准文字对应的笔迹特征;
基于各所述标准文字对应的所述笔迹特征,构建标准字体数据库。
7.根据权利要求1-6中任一项所述的笔迹识别方法,其特征在于,所述在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字之前,还包括:
计算所述笔迹特征与所述个性化字体数据库中各所述第一字体特征的特征相似度;
在存在至少一个所述特征相似度大于或等于预设的相似度阈值时,确定所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征。
8.一种笔迹识别装置,其特征在于,所述笔迹识别装置包括:
书写笔迹采集模块,用于采集目标用户当前书写文字的书写笔迹;
笔迹特征获得模块,用于基于特征提取算法,提取所述书写笔迹对应的特征,获得所述当前书写文字的笔迹特征;
第一字体特征匹配模块,用于基于所述目标用户对应的个性化字体数据库,匹配所述笔迹特征对应的第一字体特征;
目标文字确定模块,用于在所述个性化字体数据库中存在所述笔迹特征对应的所述第一字体特征时,确定所述当前书写文字为所述第一字体特征对应的目标文字。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的笔迹识别程序,其中所述笔迹识别程序被所述处理器执行时,实现如权利要求1至7中任一项所述的笔迹识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有笔迹识别程序,其中所述笔迹识别程序被处理器执行时,实现如权利要求1至7中任一项所述的笔迹识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310919082.9A CN116959000A (zh) | 2023-07-24 | 2023-07-24 | 笔迹识别方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310919082.9A CN116959000A (zh) | 2023-07-24 | 2023-07-24 | 笔迹识别方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116959000A true CN116959000A (zh) | 2023-10-27 |
Family
ID=88445856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310919082.9A Pending CN116959000A (zh) | 2023-07-24 | 2023-07-24 | 笔迹识别方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116959000A (zh) |
-
2023
- 2023-07-24 CN CN202310919082.9A patent/CN116959000A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7013046B2 (en) | Apparatus, method, and program for handwriting recognition | |
EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
WO1995008158A1 (en) | Universal symbolic handwriting recognition system | |
CN111507330B (zh) | 习题识别方法、装置、电子设备及存储介质 | |
US10013603B2 (en) | System and method for recognizing multiple object structure | |
CN114730241B (zh) | 触摸式用户界面输入中的手势笔画识别 | |
JP4817297B2 (ja) | 文字検索装置 | |
JP2019508770A (ja) | デジタルインクを美しくするためのシステム及び方法 | |
JP3761937B2 (ja) | パターン認識方法及び装置及びコンピュータ制御装置 | |
JP6055065B1 (ja) | 文字認識プログラム、文字認識装置 | |
US6724936B1 (en) | Handwriting input device and method using a single character set | |
CN114937270A (zh) | 古籍文字处理方法、装置及计算机可读存储介质 | |
JP4686502B2 (ja) | オンライン文字認識装置 | |
CN113468972B (zh) | 用于复杂场景手写识别的手写轨迹切分方法及计算机产品 | |
JP6550163B1 (ja) | 文字認識装置、文字認識方法およびプログラム | |
CN116959000A (zh) | 笔迹识别方法、装置、计算机设备及存储介质 | |
CN110414496B (zh) | 相似字识别方法、装置、计算机设备及存储介质 | |
CN112527128A (zh) | 手写输入文本定位方法及装置 | |
CN111459395A (zh) | 手势识别方法、系统、存储介质、人机交互设备 | |
CN112975958B (zh) | 文字的笔顺的路径点生成方法及装置、机械手控制系统 | |
JP2014078168A (ja) | 文字認識装置及びプログラム | |
EP4086744A1 (en) | Gesture stroke recognition in touch-based user interface input | |
JP3221488B2 (ja) | 検証機能付きオンライン文字認識装置 | |
Yang et al. | Generating Chinese characters based on stroke splitting and feature extraction | |
KR100204618B1 (ko) | 문자 또는 도형의 인식 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |