WO2021068364A1

WO2021068364A1 - 笔画骨架信息提取方法、装置、电子设备及存储介质

Info

Publication number: WO2021068364A1
Application number: PCT/CN2019/119898
Authority: WO
Inventors: 蒋建斌; 连宙辉; 肖建国; 张纯; 宛慧军; 唐英敏
Original assignee: 北京方正手迹数字技术有限公司; 北京大学
Priority date: 2019-10-09
Filing date: 2019-11-21
Publication date: 2021-04-15
Also published as: CN112633428A

Abstract

本申请提供一种笔画骨架信息提取方法、装置、电子设备及存储介质。本申请提供的笔画骨架信息提取方法通过获取目标图像，所获取的目标图像中包括目标文字图像，然后根据目标图像确定目标文字图像对应的参考文字，之后，再根据所确定的参考文字以及预设参考数据库确定参考笔画骨架信息，其中，预设参考数据库包括参考文字与参考笔画骨架信息的映射关系，最后根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息，从而，能够实现笔画骨架信息的自动化提取，整个提取过程无需人工干预，降低提取成本的同时还提高了效率以及精确度。

Description

笔画骨架信息提取方法、装置、电子设备及存储介质

技术领域

本申请涉及计算机图形学技术领域，尤其涉及一种笔画骨架信息提取方法、装置、电子设备及存储介质。

背景技术

对于文字字形而言，尤其是像中文、日文以及韩文等，其字形均由笔画构成，笔画是组成文字的基本单位。

笔画骨架提取是字体相关领域重要的技术支撑。能够精确地提取笔画骨架信息，对促进本领域相关技术的发展具有不言而喻的重要性。然而，由于文字结构的复杂性以及多样性，笔画骨架信息的提取一直是本领域的技术难题。尤其针对较为复杂的字形，笔画骨架提取工作多依赖于人工手动进行，需要较多的人力物力成本，提取效率与精确度较低。

可见，亟需一种笔画骨架信息提取方法，以克服现有技术中的各种技术问题。

发明内容

本申请提供一种笔画骨架信息提取方法、装置、电子设备及存储介质，以解决现有技术中笔画骨架信息提取的效率与精确度较低的技术问题。

第一方面，本申请提供一种笔画骨架信息提取方法，包括：

获取目标图像，所述目标图像中包括目标文字图像；

根据所述目标图像以及预设参考数据库确定所述目标文字图像对应的参考文字；

根据所述参考文字以及所述预设参考数据库确定参考笔画骨架信息，所述预设参考数据库包括所述参考文字与所述参考笔画骨架信息的映射关系；

根据所述目标文字图像以及所述参考笔画骨架信息确定目标笔画骨架信息。

在一种可能的设计中，所述根据所述目标文字图像以及所述参考笔画骨架信息确定目标笔画骨架信息，包括：

根据所述目标文字图像以及预设图像处理算法确定第一骨架数据，所述第一骨架数据包括特征点集；

根据所述特征点集确定所述目标文字图像的每个单一笔画骨架点集；

根据所有的所述单一笔画骨架点集确定第二骨架数据；

根据所述第二骨架数据以及预设处理算法确定第三骨架数据；

根据所述第三骨架数据以及所述参考笔画骨架信息确定所述目标笔画骨架信息。

在一种可能的设计中，所述根据所述特征点集确定所述目标文字图像的每个单一笔画骨架点集，包括：

根据所述特征点集以及预设二维卷积算法确定端点子集；

根据所述特征点集以及预设交叉点提取算法确定交叉点子集；

根据随机点子集、关键点子集以及所述参考笔画骨架信息确定目标文字图像骨架点集，所述关键点子集包括所述端点子集与所述交叉点子集，所述特征点集包括所述随机点子集；

将所述目标文字图像骨架点集与所述参考笔画骨架信息进行匹配，以获得所述目标文字图像的每个单一笔画骨架点集。

在一种可能的设计中，所述根据所述第二骨架数据以及预设处理算法确定第三骨架数据，包括：

根据所述第二骨架数据以及预设连接算法确定多个骨架段数据；

根据所有的所述骨架段数据以及预设聚类算法确定第三骨架数据。

在一种可能的设计中，所述获取目标图像，包括：

获取输入图像；

对所述输入图像进行预处理以确定所述目标图像。

第二方面，本申请提供一种笔画骨架信息提取装置，包括：

获取模块，用于获取目标图像，所述目标图像中包括目标文字图像；

第一处理模块，用于根据所述目标图像以及预设参考数据库确定所述目标文字图像对应的参考文字；

第二处理模块，用于根据所述参考文字以及所述预设参考数据库确定参考笔画骨架信息，所述预设参考数据库包括所述参考文字与所述参考笔画骨架信息的映射关系；

第三处理模块，用于根据所述目标文字图像以及所述参考笔画骨架信息确定目标笔画骨架信息。

在一种可能的设计中，所述第三处理模块，具体用于：

根据所有的所述单一笔画骨架点集确定第二骨架数据；

在一种可能的设计中，所述第三处理模块，具体用于：

根据所述特征点集以及预设二维卷积算法确定端点子集；

在一种可能的设计中，所述第三处理模块，具体用于：

在一种可能的设计中，所述获取模块，具体用于：

获取输入图像；

对所述输入图像进行预处理以确定所述目标图像。

第三方面，本申请提供一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面及可选的方案涉及的笔画骨架信息提取方法。

第四方面，本申请提供一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行第一方面及可选的方案涉及的笔画骨架信息提取方法。

本申请提供的笔画骨架信息提取方法、装置、电子设备及存储介质，通过首先获取目标图像，所获取的目标图像中包括目标文字图像，然后根据目标图像确定目标文字图像对应的参考文字，之后，再根据所确定的参考文字以及预设参考数据库确定参考笔画骨架信息，其中，预设参考数据库包括参考文字与参考笔画骨架信息的映射关系，最后根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息，从而，能够实现笔画骨架信息的自动化提取，整个提取过程无需人工干预，降低提取成本的同时还提高了效率以及精确度。

附图说明

图1为本申请实施例提供的笔画骨架信息提取方法的一种应用场景示意图；

图2为本申请实施例提供的一种笔画骨架信息提取方法的流程示意图；

图3为本申请实施例提供的一种参考笔画骨架示意图；

图4为本申请实施例提供的一种确定目标笔画骨架信息的流程示意图；

图5为本申请实施例提供的一种第一骨架数据的示意图；

图6为本申请实施例提供的一种确定单一笔画骨架点集的流程示意图；

图7为本申请实施例提供的一种第二骨架数据的示意图；

图8为本申请实施例提供的一种确定第三骨架数据的流程示意图；

图9为本申请实施例提供的一种提取后的目标笔画骨架示意图；

图10为本申请实施例提供的一种笔画骨架信息提取装置的结构示意图；

图11为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的方法和装置的例子。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

对于文字的字形而言，尤其像中文、日文以及韩文等，其字形均由笔画构成，笔画是组成文字的基本单元，因此，笔画骨架提取是字体相关领域一项重要的技术支撑。然而，由于文字结构的复杂性以及多样性，笔画骨架的提取一直是本领域的技术难题，尤其针对较为复杂的字形，其提取工作多依赖于人工手动进行，需要较大的人力物力成本的同时，提取效率以及精确度还很低。

针对现有技术中的上述问题，本申请提供一种笔画骨架信息提取方法、装置、电子设备及存储介质，通过首先获取目标图像，所获取的目标图像中包括目标文字图像，然后根据目标图像确定目标文字图像对应的参考文字，之后，再根据所确定的参考文字以及预设参考数据库确定参考笔画骨架信息，其中，预设参考数据库包括参考文字与参考笔画骨架信息的映射关系，最后根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息，从而，实现笔画骨架信息的自动化提取，整个提取过程无需人工干预，降低提取成本的同时还提高了效率以及精确度。

下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1为本申请实施例提供的笔画骨架信息提取方法的一种应用场景示意图。如图1所示，本申请提供的笔画骨架信息提取方法由电子设备执行，其中，电子设备可以是手机、计算机、平板电脑等，图1中以计算机1为例示出。通过本申请提供的笔画骨架信息提取方法可以实现对目标图像中包含的文字的笔画骨架信息提取。

首先获取目标图像，该目标图像中包括目标文字图像，参照图1所示，例如目标文字是汉字“事”，获取一张包含有该目标文字图像2的图像，然后根据该目标图像确定目标文字图像2对应的参考文字，例如，在预设参考数据库中确定目标文字图像2对应的参考文字，显然，该参考文字也为汉字“事”，不同的是参考文字的汉字“事”与目标文字的汉字“事”的字体可能不相同。在确定了参考文字之后，根据该参考文字以及预设参考数据库确定参考笔画骨架信息，其中，预设参考数据库包括参考文字与参考笔画骨架信息的映射关系，因此，所确定的参考笔画骨架信息是该参考文字的笔画骨架信息，最后根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息，从而实现目标文字“事”的笔画骨架信息自动提取，在整个提取过程中无需人工干预，降低了提取成本的同时还提高了效率以及精确度。

图2为本申请实施例提供的一种笔画骨架信息提取方法的流程示意图。如图2所示，本实施例提供的笔画骨架信息提取方法可以由电子设备执行，该方法包括：

S21：获取目标图像，目标图像中包括目标文字图像。

获取目标图像，其中，目标图像中包括目标文字图像，例如，目标文字为汉字“事”，可以参考图1中的目标文字图像2，目标文字图像2则是汉字“事”的图像，可以通过对目标文字拍照或扫描获取目标文字图像，包含有目标文字图像的图像则为目标图像。

可选地，获取目标图像包括：

S211：获取输入图像。

输入目标文字，获取包含有输入目标文字的图像，可以理解为对输入目标文字进行拍照或扫描，获取输入图像。

S212：对输入图像进行预处理确定目标图像。

对输入的包含有目标文字的图像进行预处理得到目标图像。预处理可以为图像去噪处理以及图像二值化处理，例如，对所获取的输入图像可以采用高斯平滑操作去除图像中的噪声，之后，运用图像二值化处理对输入图像进行二值化，最终经过预处理之后得到目标图像。其中，图像去噪处理也可以采用其他方法，例如采用领域平均法，凡是能够对图像进行去噪处理以达到目标处理结果的手段均可以采用，对此，本申请实施例不作限定。

S22：根据目标图像以及预设参考数据库确定目标文字图像对应的参考文字。

在获取了目标图像之后，根据所获取的目标图像以及预设参考数据库确定目标文字图像对应的参考字。例如，可以根据目标图像在预设参考数据库中确定目标文字图像对应的参考文字。

具体地，可以是根据目标图像中的目标文字，在预设参考数据库中找出与目标文字字形相似的字形，其中，预设参考数据库中包含有多套不同字体的字形二值图，每个二值图则对应一个文字，可以理解的是，根据目标图像在预设参考数据库中找出与目标文字字形相似的可能为多个文字，多个文字之间具有相同的字形，但字体不相同。若预设参考数据库中与目标文字字形相似的文字为一个，则确定该文字为目标文字图像对应的参考文字；若预设参考数据库中与目标文字字形相似的文字为多个文字，则可以根据目标文字与多个文字之间的字形差异值确定参考文字，最小差异值对应的文字即为参考文字。

值得说明的是，根据目标图像确定目标文字图像对应的参考文字时，是根据同一个文字进行确定，换言之，目标文字与参考文字属于同一个文字，具有相似的字形，不同的字体。

S23：根据参考文字以及预设参考数据库确定参考笔画骨架信息。

其中，预设参考数据库包括参考文字与参考笔画骨架信息的映射关系。

预设参考数据库可以离线进行搭建的，其中可以包含有多套不同字体的字形二值图以及参考文字与参考笔画骨架信息的映射关系。映射关系是指预设参考数据库中的每个文字与各自字形的每个笔画骨架信息之间对应的关系，可以理解的是，当参考文字被确定之后，根据所确定的参考文字和预设参考数据库则可以确定参考笔画骨架信息。值得理解的是，参考笔画骨架信息为参考字的每个笔画骨架信息。

具体地，继续参照图1的目标文字图像2，其中目标文字为“事”，故而，在预设数据库中所确定的参考文字也为“事”。根据参考文字以及预设参考数据库确定参考笔画骨架信息，则为确定参考文字“事”的每个笔画骨架信息，从而确定了参考笔画骨架信息，如图3所示，图3为本申请实施例提供的一种参考笔画骨架示意图。

S24：根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息。

在确定了参考笔画骨架信息之后，根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息，可以理解为，目标文字图像中的目标文字，与参考笔画骨架信息对应的参考文字属于同一个文字，两者具有相似的字形，当参考笔画骨架信息确定的情况下，目标文字字形的每个笔画骨架信息则可以根据参考笔画骨架信息确定，从而确定目标文字的笔画骨架信息，即目标笔画骨架信息，实现目标文字笔画骨架信息的自动提取。

本实施例提供的笔画骨架信息提取方法，通过首先获取目标图像，所获取的目标图像中包括目标文字图像，然后根据目标图像以及预设参考数据库确定目标文字图像对应的参考文字，当确定了参考文字之后，因预设参考数据库中包括参考文字与参考笔画骨架信息的映射关系，则可以确定参考文字的每个笔画骨架信息，即为参考笔画骨架信息，而目标文字图像中的目标文字与参考文字属于同一个文字，故而，在参考笔画骨架信息确定的情况下，根据目标文字图像以及参考笔画骨架信息则能确定目标笔画骨架信息，从而实现目标文字笔画骨架信息的提取。克服了现有技术中需要人工的手动操作增加提取成本，以及提取效率与精确度较低的问题。本实施例提供的笔画骨架信息提取方法在整个过程中无需人工干预，实现自动化提取，降低了提取成本，提高了效率以及精确度。

在图2所示实施例的基础上，步骤S24的一种可能的实现方式如图4所示，图4为本申请实施例提供的一种确定目标笔画骨架信息的流程示意图，该实现方式包括：

S241：根据目标文字图像以及预设图像处理算法确定第一骨架数据。

其中，第一骨架数据包括特征点集。

对目标文字图像采用预设图像处理算法进行处理，以确定目标文字图像中的目标文字的骨架数据，即为第一骨架数据。其中，预设图像处理算法可以为图像细化处理算法，对经过图像二值化处理的目标文字图像采用图像细化处理算法进行处理，则可以得到目标文字的骨架数据。其中，骨架数据可以采用矩阵、图形等各种形式进行呈现，例如，采用图形呈现，可以具象化地将骨架数据进行展示，如图5所示，图5为本申请实施例提供的一种第一骨架数据的示意图，其中目标文字为汉字“事”，目标文字图像为图1中的2，所得到的第一骨架数据为图5所示。本申请实施例对于骨架数据的呈现形式不作限定。

可以理解的是，第一骨架数据包括构成骨架数据的多个数据，若将每个数据称之为特征点，则特征点集构成了第一骨架数据，换言之，第一骨架数据包括特征点集。

S242：根据特征点集确定目标文字图像的每个单一笔画骨架点集。

特征点集构成第一骨架数据，换言之，第一骨架数据包括特征点集。可以理解的是，第一骨架数据所对应的每个单一笔画均是由特征点构成，根据该特征点集则可以确定目标文字图像的每个单一笔画骨架点集，其中，每个单一笔画骨架点集可以理解为构成每个单一笔画骨架点所组成的集合，

一种可能的设计中，根据特征点集确定目标文字图像的每个单一笔画骨架点集可以通过图6所示的步骤实现，图6为本申请实施例提供的一种确定单一笔画骨架点集的流程示意图，该实现步骤包括：

S2421：根据特征点集以及预设二维卷积算法确定端点子集。

第一骨架数据包括特征点集，对第一骨架数据进行预设二维卷积算法运算，可以确定第一骨架数据的多个端点，多个端点所组成的点集合则为端点子集，从而实现根据特征点集以及预设二维卷积算法确定端点子集。

S2422：根据特征点集以及预设交叉点提取算法确定交叉点子集。

与步骤S2421类似，第一骨架数据包括特征点集，对第一骨架数据进行预设交叉点提取算法处理，可以确定第一骨架数据的多个交叉点，多个交叉点所组成的点集合则为交叉点子集，从而实现根据特征点集以及预设交叉点提取算法确定交叉点子集。

S2423：根据随机点子集、关键点子集以及参考笔画骨架信息确定目标文字骨架点集。

其中，关键点子集包括端点子集与交叉点子集，特征点集包括随机采样点子集。

在根据步骤S2421和步骤S2422确定了端点子集与交叉点子集之后，将端点以及交叉点作为第一骨架数据的关键点进行保存，关键点所组成的点集合则为关键点子集。换言之，关键点子集包括端点子集与交叉点子集。

对第一骨架数据包括的特征点集中的特征点进行随机采样，所得到的特征点则为随机点，随机点所组成的点集合即为随机点子集。

对随机点子集与关键点子集采用一致性点集漂移算法(Coherent Point Drift，简称CPD)，以使其与参考笔画骨架信息进行非刚性点集注册，所获得的点集注册结果构成目标文字图像骨架点集。

S2424：将目标文字图像骨架点集与参考笔画骨架信息进行匹配，以获得目标文字图像的每个单一笔画骨架点集。

预设参考数据库包括参考文字与参考笔画骨架信息的映射关系，映射关系是指预设参考数据库中的每个文字与各自字形的每个笔画骨架信息之间对应的关系。换言之，预设参考数据库中每个文字的每个笔画骨架信息是已知的，则可以离线对每个文字的每个笔画骨架信息进行分类，分类可以理解为将属于同一类的参考笔画骨架信息归为一类，例如可以根据笔画骨架的方向、笔画骨架的顺序对预设参考数据库中每个文字的每个笔画骨架信息进行归类。

将目标文字图像骨架点集与已经提前完成归类的参考笔画骨架信息进行匹配，则可以得到目标文字的每个单一笔画骨架点，每个单一笔画骨架点所组成的点集合则为每个单一笔画骨架点集，从而获取目标文字图像的每个单一笔画骨架点集。

可以理解的是，将目标文字图像骨架点集与参考笔画骨架信息进行匹配，选取能够完成匹配的点构成目标文字的每个单一笔画骨架点，剔除不能完成匹配的点。

S243：根据所有的单一笔画骨架点集确定第二骨架数据。

在确定了目标文字图像的每个单一笔画骨架点集之后，通过对所有的单一笔画骨架点集进行文字重现，则可以获得目标文字图像的第二骨架数据，如前所描述，一种具象化地呈现骨架数据的方式为骨架图，如图7所示，图7为本申请实施例提供的一种第二骨架数据的示意图，

可以理解的是，每个单一笔画骨架点集中的点可以重现每个单一笔画，每个单一笔画则可以构成第二骨架数据。

S244：根据第二骨架数据以及预设处理算法确定第三骨架数据。

在确定了目标文字图像的第二骨架数据之后，通过对第二骨架数据进行预设处理算法处理可以确定第三骨架数据。

一种可能的设计中，根据第二骨架数据以及预设处理算法确定第三骨架数据可以通过图8所示的步骤实现，图8为本申请实施例提供的一种确定第三骨架数据的流程示意图，如图8所示，该实现方式包括：

S2441：根据第二骨架数据以及预设连接算法确定多个骨架段数据。

在确定了第二骨架数据之后，对第二骨架数据采用预设连接算法进行连接，可以得到一系列的骨架段数据，即确定了多个骨架段数据。其中，预设连接算法可以是预设边缘连接算法，凡是可以实现骨架点连接得到骨架段数据的算法均可以采用，对此，本申请实施例不作限定。

S2442：根据所有的骨架段数据以及预设聚类算法确定第三骨架数据。

可以理解的是，在确定了多个骨架段数据之后，可以对所有的骨架段数据采用预设聚类算法进行聚类，评价聚类效果，保留聚类效果最优的类别，最优的类别对应的骨架段构成第三骨架数据，从而确定第三骨架数据。

下面对步骤S2441和步骤S2442详细进行说明，为了描述方便，通过第二骨架图呈现第二骨架数据，通过第三骨架图呈现第三骨架数据。

在确定了第二骨架数据之后，即确定了第二骨架图，根据预设边缘连接算法得到一系列骨架段，选取每个骨架段的起点和终点，分别计算两两骨架段之间的起点和终点之间的距离，选取距离最短的骨架段，连接所选取的骨架段，再把连接的骨架段与剩余的骨架段之间的距离进行计算，继续选取距离最短的已连接的骨架段，再一次连接所选取距离最短的已进行过一次连接的骨架段。重复进行该操作，直至建立连通目标文字所有骨架段的边连接图，在所建立的边连接图中，选取最优连接通路，对最优连接通路进行骨架剪枝操作，得到最终的连接通路，最终的连接通路则为最优笔画通路，最优笔画通路构成第三骨架图，第三骨架图对应的数据则为第三骨架数据。

S245：根据第三骨架数据以及参考笔画骨架信息确定目标笔画骨架信息。

在确定了第三骨架数据之后，根据第三骨架数据以及参考笔画骨架信息确定目标笔画骨架信息。

具体地，对构成第三骨架数据的点集再一次采用CPD算法，与其对应的参考笔画骨架信息进行非刚性点集注册，所得到的结果对应的点集构成目标文字图像中目标文字的骨架数据，换言之，确定了目标笔画骨架信息，从而，完成目标笔画骨架信息的提取操作，如图9所示，图9为本申请实施例提供的一种提取后的目标笔画骨架示意图。

本实施例提供的笔画骨架信息提取方法，首先通过根据目标文字图像以及预设图像处理算法确定第一骨架数据，其中，第一骨架数据包括特征点集，然后根据特征点集确定目标文字图像的每个单一笔画骨架点集，当每个单一笔画骨架点集确定之后，根据所确定的所有单一笔画骨架点集则可以确定第二骨架数据，第二骨架数据可以理解为笔画骨架信息的初步提取结果所构成的骨架数据，再根据第二骨架数据以及预设处理算法确定第三骨架数据，最后再根据第三骨架数据以及参考笔画骨架信息确定目标笔画骨架信息，完成笔画骨架信息的提取。克服了现有技术中需要人工的手动操作增加提取的成本，以及提取效率与精确度较低的问题。在整个提取过程中无需人工干预，实现自动化操作，降低了提取成本，提高了效率以及精确度。

图10为本申请实施例提供的一种笔画骨架信息提取装置的结构示意图。本实施例提供的笔画骨架信息提取装置，用于执行上述各实施例提供的笔画骨架信息提取方法。如图10所示，本实施例提供的笔画骨架信息提取装置100，包括：

获取模块101，用于获取目标图像，目标图像中包括目标文字图像。

第一处理模块102，用于根据目标图像以及预设参考数据库确定目标文字图像对应的参考文字。

第二处理模块103，用于根据参考文字以及预设参考数据库确定参考笔画骨架信息，预设参考数据库包括参考文字与参考笔画骨架信息的映射关系。

第三处理模块104，用于根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息。

本实施例提供的笔画骨架信息提取装置与上述图2的方法实施例的实现原理以及效果类似，在此不作赘述。

可选地，获取模块101，具体用于：

获取输入图像；

对输入图像进行预处理以确定目标图像。

本实施例与上述方法实施例中的步骤S211-S212的实现原理以及效果类似，在此不作赘述。

一种可能的设计中，第三处理模块104，具体用于：

根据目标文字图像以及预设图像处理算法确定第一骨架数据，第一骨架数据包括特征点集；

根据特征点集确定目标文字图像的每个单一笔画骨架点集；

根据所有的单一笔画骨架点集确定第二骨架数据；

根据第二骨架数据以及预设处理算法确定第三骨架数据；

根据第三骨架数据以及参考笔画骨架信息确定目标笔画骨架信息。

本实施例与上述图4的方法实施例的实现原理以及效果类似，在此不作赘述。

一种可能的设计中，第三处理模块104，具体用于：

根据特征点集以及预设二维卷积算法确定端点子集；

根据特征点集以及预设交叉点提取算法确定交叉点子集；

根据随机点子集、关键点子集以及参考笔画骨架信息确定目标文字图像骨架点集，关键点子集包括端点子集与交叉点子集，特征点集包括随机点子集；

将目标文字图像骨架点集与参考笔画骨架信息进行匹配，以获得目标文字图像的每个单一笔画骨架点集。

本实施例与上述图6的方法实施例的实现原理以及效果类似，在此不作赘述。

一种可能的设计中，第三处理模块104，具体用于：

根据第二骨架数据以及预设连接算法确定多个骨架段数据；

根据所有的骨架段数据以及预设聚类算法确定第三骨架数据。

本实施例与上述图8的方法实施例的实现原理以及效果类似，在此不作赘述。

图11为本申请实施例提供的一种电子设备的结构示意图。如图11所示，本实施例提供的电子设备800包括：

至少一个处理器801；以及

与至少一个处理器801通信连接的存储器802；其中，

存储器802存储有可被至少一个处理器801执行的指令，该指令被至少一个处理器801执行，以使至少一个处理器801能够执行上述的笔画骨架信息提取方法的各个步骤，具体可以参加前述方法实施例中的相关描述。

在示例性实施例中，本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行上述各实施例中笔画骨架信息提取方法的各个步骤。例如，可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求书指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims

一种笔画骨架信息提取方法，其特征在于，包括：

获取目标图像，所述目标图像中包括目标文字图像；

根据所述目标图像以及预设参考数据库确定所述目标文字图像对应的参考文字；

根据所述参考文字以及所述预设参考数据库确定参考笔画骨架信息，所述预设参考数据库包括所述参考文字与所述参考笔画骨架信息的映射关系；

根据所述目标文字图像以及所述参考笔画骨架信息确定目标笔画骨架信息。
根据权利要求1所述的笔画骨架信息提取方法，其特征在于，所述根据所述目标文字图像以及所述参考笔画骨架信息确定目标笔画骨架信息，包括：

根据所述目标文字图像以及预设图像处理算法确定第一骨架数据，所述第一骨架数据包括特征点集；

根据所述特征点集确定所述目标文字图像的每个单一笔画骨架点集；

根据所有的所述单一笔画骨架点集确定第二骨架数据；

根据所述第二骨架数据以及预设处理算法确定第三骨架数据；

根据所述第三骨架数据以及所述参考笔画骨架信息确定所述目标笔画骨架信息。
根据权利要求2所述的笔画骨架信息提取方法，其特征在于，所述根据所述特征点集确定所述目标文字图像的每个单一笔画骨架点集，包括：

根据所述特征点集以及预设二维卷积算法确定端点子集；

根据所述特征点集以及预设交叉点提取算法确定交叉点子集；

根据随机点子集、关键点子集以及所述参考笔画骨架信息确定目标文字图像骨架点集，所述关键点子集包括所述端点子集与所述交叉点子集，所述特征点集包括所述随机点子集；

将所述目标文字图像骨架点集与所述参考笔画骨架信息进行匹配，以获得所述目标文字图像的每个单一笔画骨架点集。
根据权利要求2所述的笔画骨架信息提取方法，其特征在于，所述根据所述第二骨架数据以及预设处理算法确定第三骨架数据，包括：

根据所述第二骨架数据以及预设连接算法确定多个骨架段数据；

根据所有的所述骨架段数据以及预设聚类算法确定第三骨架数据。
根据权利要求1-4中任意一项所述的笔画骨架信息提取方法，其特征在于，所述获取目标图像，包括：

获取输入图像；

对所述输入图像进行预处理以确定所述目标图像。
一种笔画骨架信息提取装置，其特征在于，包括：

获取模块，用于获取目标图像，所述目标图像中包括目标文字图像；

第一处理模块，用于根据所述目标图像以及预设参考数据库确定所述目标文字图像对应的参考文字；

第二处理模块，用于根据所述参考文字以及所述预设参考数据库确定参考笔画骨架信息，所述预设参考数据库包括所述参考文字与所述参考笔画骨架信息的映射关系；

第三处理模块，用于根据所述目标文字图像以及所述参考笔画骨架信息确定目标笔画骨架信息。
根据权利要求6所述的笔画骨架信息提取装置，其特征在于，所述第三处理模块，具体用于：

根据所述目标文字图像以及预设图像处理算法确定第一骨架数据，所述第一骨架数据包括特征点集；

根据所述特征点集确定所述目标文字图像的每个单一笔画骨架点集；

根据所有的所述单一笔画骨架点集确定第二骨架数据；

根据所述第二骨架数据以及预设处理算法确定第三骨架数据；

根据所述第三骨架数据以及所述参考笔画骨架信息确定所述目标笔画骨架信息。
根据权利要求6所述的笔画骨架信息提取装置，其特征在于，所述第三处理模块，具体用于：

根据所述特征点集以及预设二维卷积算法确定端点子集；

根据所述特征点集以及预设交叉点提取算法确定交叉点子集；

根据随机点子集、关键点子集以及所述参考笔画骨架信息确定目标文字图像骨架点集，所述关键点子集包括所述端点子集与所述交叉点子集，所述特征点集包括所述随机点子集；

将所述目标文字图像骨架点集与所述参考笔画骨架信息进行匹配，以获得所述目标文字图像的每个单一笔画骨架点集。
一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-5中任一项所述的笔画骨架信息提取方法。
一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的笔画骨架信息提取方法。