CN113657404B - 一种东巴象形文字的图像处理方法 - Google Patents

一种东巴象形文字的图像处理方法 Download PDF

Info

Publication number
CN113657404B
CN113657404B CN202111212848.7A CN202111212848A CN113657404B CN 113657404 B CN113657404 B CN 113657404B CN 202111212848 A CN202111212848 A CN 202111212848A CN 113657404 B CN113657404 B CN 113657404B
Authority
CN
China
Prior art keywords
image
pixel
processed
target
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111212848.7A
Other languages
English (en)
Other versions
CN113657404A (zh
Inventor
毕晓君
骆彦龙
翁彧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minzu University of China
Original Assignee
Minzu University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minzu University of China filed Critical Minzu University of China
Priority to CN202111212848.7A priority Critical patent/CN113657404B/zh
Publication of CN113657404A publication Critical patent/CN113657404A/zh
Application granted granted Critical
Publication of CN113657404B publication Critical patent/CN113657404B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明实施例公开了一种东巴象形文字的图像处理方法,该方法包括:获取待处理东巴象形文字数据集,其中,待处理东巴象形文字数据集包括至少一个待处理文字图像;针对每个待处理文字图像,根据待处理文字图像的分辨率结合预确定的目标分辨率对待处理文字图像进行分块划分,得到至少一个分块图像以及各分块图像对应的像素系数矩阵;根据各分块图像和对应的像素系数矩阵确定目标文字图像,并根据各目标文字图像形成目标东巴象形文字数据集。本发明能有效建立大规模、高质量的东巴象形文字数据集,可用于实现东巴文字的高精度识别,也是实现东巴经典机器翻译的基础,有助于东巴文化的传承和保护。

Description

一种东巴象形文字的图像处理方法
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种东巴象形文字的图像处理方法。
背景技术
东巴象形文字由纳西族祖先创造,至今已有两千多年的历史。2003年,东巴经典被联合国教科文组织列为“世界记忆遗产”名录,成为人类共同拥有的宝贵财富。目前流传于世的东巴经典多达三万余卷,但是这些珍贵的经典大部分还无法破译,被人们称为“沉睡的宝藏”。东巴经典自古以来都采用口传心授的形式进行传承,目前能够释读东巴经典的人只有几位大东巴,人类这一文化瑰宝即将面临无人释读的濒危状况。
东巴象形文字具有书写随意性大、部分文字相似度高、异体字多等特点,对其进行识别研究有很大的难度。深度学习模型是目前公认的识别效果最好的方法,在深度学习模型训练过程中,对训练所用图像的分辨率大小有着一定的要求,而且图像分辨率大小对计算机的显存、模型训练速度有较大的影响。因此,在确保应用效果不变的前提下,如何对图像进行处理,得到分辨率符合训练要求的图像成为有待解决的问题。
发明内容
本发明提供一种东巴象形文字的图像处理方法,以实现对图像分辨率的有效处理,满足深度学习模型的训练要求,以实现对东巴象形文字图像的准确识别。
第一方面,本发明实施例提供了一种东巴象形文字的图像处理方法,所述方法包括:
获取待处理东巴象形文字数据集,其中,所述待处理东巴象形文字数据集包括至少一个待处理文字图像;
针对每个待处理文字图像,根据所述待处理文字图像的分辨率结合预确定的目标分辨率对所述待处理文字图像进行分块划分,得到至少一个分块图像以及各所述分块图像对应的像素系数矩阵;
根据各所述分块图像和对应的像素系数矩阵确定目标文字图像,并根据各所述目标文字图像形成目标东巴象形文字数据集。
第二方面,本发明实施例还提供了一种东巴象形文字的图像处理装置,该装置包括:
待处理数据集获取模块,用于获取待处理东巴象形文字数据集,其中,所述待处理东巴象形文字数据集包括至少一个待处理文字图像;
分块模块,用于针对每个待处理文字图像,根据所述待处理文字图像的分辨率结合预确定的目标分辨率对所述待处理文字图像进行分块划分,得到至少一个分块图像以及各所述分块图像对应的像素系数矩阵;
目标图像确定模块,用于根据各所述分块图像和对应的像素系数矩阵确定目标文字图像,并根据各所述目标文字图像形成目标东巴象形文字数据集。
第三方面,本发明实施例还提供了一种计算机设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一项所述的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一项所述的方法。
本发明实施例提供了一种东巴象形文字的图像处理方法,首先获取待处理东巴象形文字数据集,其中,待处理东巴象形文字数据集包括至少一个待处理文字图像;然后针对每个待处理文字图像,根据待处理文字图像的分辨率结合预确定的目标分辨率对待处理文字图像进行分块划分,得到至少一个分块图像以及各分块图像对应的像素系数矩阵;最后根据各分块图像和对应的像素系数矩阵确定目标文字图像,并根据各目标文字图像形成目标东巴象形文字数据集。得到分辨率大小为目标分辨率的目标文字图像。根据各目标文字图像形成的目标东巴象形文字数据集可用于深度学习模型训练,提高了模型训练速度和精度,进而实现对东巴象形文字的准确识别。得到的目标东巴象形文字数据集有利于现存东巴经典的机器翻译研究,极大丰富了自然语言处理技术的应用与发展。为其他象形文字如甲骨文、古埃及文字数据集的建立提供了一个很好的思路。
附图说明
图1是本发明实施例一中的一种东巴象形文字的图像处理方法的流程图;
图2是本发明实施例二中的一种东巴象形文字的图像处理方法的流程图;
图3是本发明实施例二中的一种确定目标文字图像的原理示例图;
图4是本发明实施例三中的一种东巴象形文字的图像处理装置的结构示意图;
图5是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
实施例一
图1给出了本申请实施例一提供的一种东巴象形文字的图像处理方法的流程图,该方法适用于对东巴象形文字图像进行处理得到目标分辨率图像的情况。该方法可以由计算机设备执行,该计算机设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。一般而言,计算机设备可以是笔记本、台式计算机以及智能平板等。
如图1所示,本实施例一提供的一种东巴象形文字的图像处理方法,具体包括如下步骤:
S101、获取待处理东巴象形文字数据集,其中,待处理东巴象形文字数据集包括至少一个待处理文字图像。
在本实施例中,待处理文字图像具体可以理解为具有调整分辨率需求的东巴象形文字图像。待处理东巴象形文字数据集具体可以理解为存储一个或多个图像的数据集,用于存储待处理文字图像。
具体的,在对图像的分辨率进行调整前,预先获取包含东巴象形文字的图像,可以直接将包含东巴象形文字的图像作为待处理文字图像,或者对包含东巴象形文字的图像进行处理,例如,灰度处理、裁剪等,将处理后的图像作为待处理文字图像。根据各待处理文字图像形成待处理东巴象形文字数据集,并进行相应的存储,存储空间可以是云端也可以是本地存储。在进行图像处理时,从存储空间获取待处理东巴象形文字数据集。
S102、针对每个待处理文字图像,根据待处理文字图像的分辨率结合预确定的目标分辨率对待处理文字图像进行分块划分,得到至少一个分块图像以及各分块图像对应的像素系数矩阵。
在本实施例中,目标分辨率具体可以理解为经处理后最终得到的图像的分辨率,目标分辨率可以根据对分辨率的要求自行设置。分块图像具体可以理解为分块处理后得到的图像,分块图像相比于待处理文字图像,像素点减少,但是像素值相较于分块前在待处理文字图像中所在位置的像素值保持不变。像素系数矩阵具体可以理解为对各像素点的像素值进行加权的权重系数所构成的矩阵。
具体的,对于每个待处理文字图像均采用相同的方式进行图像处理,得到分辨率符合要求的图像。确定待处理文字图像的分辨率以及目标分辨率,根据待处理文字图像的分辨率与目标分辨率的比值确定划分比例,对待处理文字图像进行分块划分,得到分块图像,通过根据比值确定分块图像中各像素点在待处理文字图像中所占的区域比例,确定像素系数矩阵。
S103、根据各分块图像和对应的像素系数矩阵确定目标文字图像,并根据各目标文字图像形成目标东巴象形文字数据集。
在本实施例中,目标文字图像具体可以理解为经过图像处理后得到的最终图像,目标文字图像的分辨率为目标分辨率。
具体的,针对每个分块图像,通过对应的像素系数矩阵对分块图像中的各像素值进行加权计算,得到加权后的像素值构成的矩阵。对于加权后得到的矩阵,根据各像素值总和或者各像素值的最大值、最小值、平均值、中位数等等,计算得到一个像素值,作为此矩阵的最终像素值,即分块图像最终像素值。根据各分块图像所在的位置对像素值进行排列(即确定各像素值所在的位置),得到目标文字图像。各目标文字图像可以直接构成目标东巴象形文字数据集,也可以对目标文字图像进行标注,确定其代表的含义,根据标注后的目标文字图像形成目标东巴象形文字数据集。
本发明实施例提供了一种东巴象形文字的图像处理方法,首先获取待处理东巴象形文字数据集,其中,待处理东巴象形文字数据集包括至少一个待处理文字图像;然后针对每个待处理文字图像,根据待处理文字图像的分辨率结合预确定的目标分辨率对待处理文字图像进行分块划分,得到至少一个分块图像以及各分块图像对应的像素系数矩阵;最后根据各分块图像和对应的像素系数矩阵确定目标文字图像,并根据各目标文字图像形成目标东巴象形文字数据集。得到分辨率大小为目标分辨率的目标文字图像。根据各目标文字图像形成的目标东巴象形文字数据集可用于深度学习模型训练,目标分辨率大小的目标文字图像可以提高深度学习模型训练速度和精度,进而实现对东巴象形文字的高精度识别,实现东巴经典机器翻译的基础,有助于东巴文化的传承和保护。
实施例二
图2为本发明实施例二提供的一种东巴象形文字的图像处理方法的流程图。本实施例的技术方案在上述技术方案的基础上进一步细化,具体主要包括如下步骤:
S201、获取初始东巴象形文字数据集,其中,初始东巴象形文字数据集包括至少一个初始文字图像,初始文字图像通过采集用户根据标准字典进行文字仿写的图像得到。
在本实施例中,初始文字图像具体可以理解为未进行过图像处理的文字图像,初始文字图像中包含东巴象形文字。初始东巴象形文字数据集具体可以理解为包含了一个或者多个初始文字图像的数据集。标准字典可以是《纳西族象形标音文字字典》、《纳西象形文字谱》等权威字典,全面覆盖包括异体字在内的3200个东巴象形文字。
具体的,每个东巴象形文字不少于x个人仿写,且每人每字仿写y次。优选的,x大于或等于40,y大于或等于5。经拍照后筛选图像,保证每个东巴象形文字可获得多张不同的图像,从而使得数据集图像数量充分多,且具有丰富的多样性。鉴于现存的东巴经典都是人工书写的形式,采取人工仿写的方式具有可行性;且通过人工仿写的方式可以有效增加图像的多样性,在文字识别和机器翻译研究时可以有更好的应用效果。用户根据标准字典中的东巴象形文字作为参照,进行仿写,对用户仿写得到的包含东巴象形文字的图像进行采集,得到初始文字图像。根据各初始文字图像形成东巴象形文字数据集,并进行相应存储。在进行后续图像处理时,可直接从存储空间中获取初始东巴象形文字数据集。
S202、对各初始文字图像进行二值化处理,得到二值图像。
初始文字图像中包含了图像的颜色信息,对各初始文字图像进行灰度化处理,去除图像的颜色信息,将三通道的彩色图像转换成单通道的灰度图像,进一步地对灰度图像进行二值化处理得到二值图像。
作为本实施例的一个可选实施例,本可选实施例进一步将对各初始文字图像进行二值化处理,得到二值图像优化为:
A1、根据加权平均值法对各初始文字图像进行灰度化处理,得到灰度化图像。
在本实施例中,灰度化图像具体可以理解为进行灰度化处理后得到的单通道的图像,本申请中的灰度化图像的像素值在0-255之间。
由于人眼对绿色最为敏感,对蓝色的敏感度最低,因此本申请采用加权平均值法对各初始文字图像进行灰度化处理时,绿色像素值系数应最大,蓝色像素值系数应最小。优选的,红、绿、蓝三种颜色分量像素系数分别取0.299,0.587,0.114,此时东巴象形文字具有最好的灰度化效果,可以将灰度化以后的图像在(i,j)处的像素值Grayij表示如下:Grayij=0.299Rij+0.587Gij+0.114Bij,式中,Rij、Gij、Bij代表初始文字图像Y在(i,j)处的红、绿、蓝三种颜色分量像素值。通过对初始文字图像进行灰度化处理,得到灰度化图像,减少图像信息量。
A2、根据初始阈值参数结合灰度化图像中像素点的像素值确定阈值计算参数。
在本实施例中,初始阈值参数具体可以理解为对各像素值进行划分时所使用的边界值,可以预先设置。阈值计算参数具体可以理解为进行二值化时计算阈值所需要的参数。阈值计算参数可以是像素值的平均值、标准差等。
通过初始阈值参数对灰度化图像中的各像素点进行划分,将各像素点根据像素值分为前景和背景,前景表示此像素点为东巴象形文字,背景表示此像素点为背景图像。对于划分完前景和背景的像素点,分别计算像素点出现的概率、像素值的平均值、标准差等参数,得到阈值计算参数。
作为本实施例的一个可选实施例,本可选实施例进一步将根据初始阈值参数结合灰度化图像中像素点的像素值确定阈值计算参数优化为:
A21、根据初始阈值参数以及灰度化图像中像素点的像素值确定各像素点所属的类型,类型为前景或背景。
具体的,将灰度化图像中像素值小于初始阈值参数的像素点的类型确定为前景,像素值大于或等于初始阈值参数的像素点的类型确定为背景。优选的,初始阈值参数设置为125。
A22、计算类型为前景的像素点对应的前景像素数量、前景像素平均值、前景像素标准差。
在本实施例中,前景像素数量具体可以理解为属于前景的像素点的总数量;前景像素平均值具体可以理解为属于前景的像素点的像素值平均值;前景像素标准差具体可以理解为属于前景的像素点的像素值标准差。
具体的,统计类型为前景的像素点的总数量,确定前景像素数量。计算类型为前景的像素点的像素值的平均值,得到前景像素平均值;根据类型为前景的各像素点的像素值,计算像素值的标准差,得到前景像素标准差。
A23、计算类型为背景的像素点对应的背景像素数量、背景像素平均值、背景像素标准差。
在本实施例中,背景像素数量具体可以理解为属于背景的像素点的总数量;背景像素平均值具体可以理解为属于背景的像素点的像素值平均值;背景像素标准差具体可以理解为属于背景的像素点的像素值标准差。
具体的,统计类型为背景的像素点的总数量,确定背景像素数量。计算类型为背景的像素点的像素值的平均值,得到背景像素平均值;根据类型为背景的各像素点的像素值,计算像素值的标准差,得到背景像素标准差。
A24、根据前景像素数量和背景像素数量确定前景概率和背景概率。
在本实施例中,前景概率具体可以理解为类型为前景的像素点出现的概率;背景概率具体可以理解为类型为背景的像素点出现的概率。
具体的,前景像素数量与背景像素数量的总和为像素点的数量总和,将前景像素数量与数量总和的比值确定为前景概率;将背景像素数量与数量总和的比值确定为背景概率。
A25、将前景概率、前景像素平均值、前景像素标准差、背景概率、背景像素平均值和背景像素标准差确定为阈值计算参数。
将计算得到的前景概率、前景像素平均值、前景像素标准差、背景像素平均值、背景像素标准差和背景概率分别作为阈值计算参数。
A3、基于各阈值计算参数结合预确定的阈值计算公式确定至少一个目标阈值。
在本实施例中,阈值计算公式预先确定,用于计算像素值阈值。目标阈值具体可以理解为通过数学计算方式得到的像素值阈值。
示例性的,本申请提供一种阈值计算公式:
Figure 985917DEST_PATH_IMAGE001
其中,T为目标阈值;
Figure 464303DEST_PATH_IMAGE002
为前景像素标准差;
Figure 294725DEST_PATH_IMAGE003
为背景像素标准差;μ1为前景像素 平均值;μ2为背景像素平均值;P1为前景概率;P2为背景概率。由上述计算公式可以知道,在 计算目标阈值时得到的目标阈值的数量可能不止一个。
A4、从各目标阈值中筛选出最优阈值。
在本实施例中,最优阈值具体可以理解为二值化效果最好的像素值阈值。筛选可以是选择目标阈值中的任意一个作为最优阈值,也可以通过试验的方式选择二值化效果最好的阈值作为最优阈值。
A5、根据最优阈值对灰度化图像进行二值化处理,得到二值图像。
比较最优阈值与灰度化图像中各像素点的像素值大小,将像素值大于或等于最优阈值的像素点的像素值确定为0;将像素值小于最优阈值的像素点的像素值确定为255。经过二值化后的图像,东巴文字区域像素值为255,背景区域像素值为0,将所有像素值作为矩阵元素组合,即可得到二值化后的二值图像。
S203、对各二值图像进行位置归一化及裁剪处理,得到候选文字图像。
在本实施例中,候选文字图像具体可以理解为可以用来形成待处理文字图像的图像。
各二值图像中包含了东巴象形文字以及无用的背景图像,而在实际应用中仅需要包含东巴象形文字的部分。所以需要对二值图像进行裁剪处理,去掉多余的背景图像。而二值图像中东巴象形文字的位置可能存在不在图像正中间位置的情况,所以在裁剪时首先将二值图像进行位置归一化处理。根据二值图像的中心(或质心)坐标对东巴象形文字进行移动,使东巴象形文字移动到图像的中心区域,然后对图像的中心位置进行裁剪,得到候选文字图像,减少背景区域比例,实现对无用信息的过滤。
作为本实施例的一个可选实施例,本可选实施例进一步将对各二值图像进行位置归一化及裁剪处理,得到候选文字图像优化为:
B1、针对每个二值图像,根据各像素点的水平坐标以及像素值确定水平质心,并根据各像素点的垂直坐标以及像素值确定垂直质心。
对于每个二值图像,确定二值图像中的各像素点的水平坐标、垂直坐标以及像素值。通过计算像素坐标的加权值,确定水平质心和垂直质心。
示例性的,水平质心的计算公式可以是:
Figure 833153DEST_PATH_IMAGE004
其中,GI为水平质心,i为图像在(i,j)处的水平坐标;j为图像在(i,j)处的垂直坐 标;bij为二值图像在(i,j)处的像素值。
Figure 765337DEST_PATH_IMAGE005
为对i和j进行二阶累加,以i=0, …,n,j=0, …,m为例,由于i=0时,i与任何数相乘均为0,因此可直接计算i=1。确定i=1时,j从0到m对应 的b1j,计算1×(b1j÷255),j取值从0到m时的累加值;确定i=2时,j从0到m对应的b2j,计算2 ×(b2j÷255),j取值从0到m时的累加值,重复计算,直到i=n,然后把得到的i在各取值下对 应的累加值进行累加,得到
Figure 562261DEST_PATH_IMAGE006
Figure 529080DEST_PATH_IMAGE007
的计算原理与上述计算原理 相同,在此不进行赘述。
垂直质心的计算公式可以是:
Figure 769568DEST_PATH_IMAGE008
其中,GJ为垂直质心,计算原理与水平质心计算原理相同,在此不进行赘述。
B2、根据水平质心和垂直质心对二值图像中的各像素点进行位置归一化,得到中心区域图像。
在本实施例中,中心区域图像具体可以理解为东巴象形文字在图像中心区域的图像。将图像在(i,j)处的像素值通过水平质心和垂直质心与图像水平中心和垂直中心的差值进行移动,移到(i’,j’)处,即可将东巴文字移到整个图像的中心区域。示例性的,本申请提供一种像素点的移动后坐标确定公式:
Figure 189048DEST_PATH_IMAGE009
其中CI和CJ分别表示二值图像在水平方向和垂直方向的中心坐标,通过上述公式可得到位置归一化后的各像素点的坐标和像素值,得到中心区域图像。
B3、对中心区域图像进行分块划分,得到分块矩阵,分块矩阵包含预设数量的像素矩阵。
在本实施例中,分块矩阵具体可以理解为中心区域图像的像素值所构成的矩阵,分块矩阵由预设数量的像素矩阵构成。像素矩阵具体可以理解为各像素点的像素值所构成的矩阵。
对中心区域图像中的各像素点进行分块划分,预设数量可以根据需求设置,为了获得中心位置处的图像,优选的,预设数量设置为9,相应的,分块矩阵X可以为:
Figure 789663DEST_PATH_IMAGE010
其中,X1-X9为像素矩阵。分块矩阵X中各行的行数相同,列数可以不同,例如,X1、X2、X3与的行数相同,列数不同;各列的列数相同,行数可以不同,例如,X1、X4、X7的列数相同,行数不同。
B4、将分块矩阵与预确定的裁剪矩阵进行相乘,得到中心位置处的像素矩阵。
在本实施例中,裁剪矩阵具体可以理解为对分块矩阵进行裁剪的矩阵,裁剪矩阵由0矩阵和单位矩阵E构成。示例性的,本申请实施例提供一种中心位置处的像素矩阵的计算公式:
Figure 610988DEST_PATH_IMAGE011
其中,Z为中心位置处的像素矩阵,[0 E 0]和[O E 0]T为裁剪矩阵。
B5、根据中心位置处的像素矩阵确定候选文字图像。
中心位置处的像素矩阵所构成的图像即为候选文字图像。
图像四周的背景区域所占比例太大,导致东巴文字相对较小,影响识别效果,经过位置归一化后的东巴文字都在图像的中间区域,因此将中心区域图像进行中心裁剪,仅保留图像中间区域的东巴象形文字,有助于生成高质量的图像,提升数据集在进行识别时的准确率。
S204、根据各候选文字图像进行数据扩增,获得待处理文字图像。
由于在深度学习模型训练时,训练所用的数据量较大,因此候选文字图像的数量可能不满足模型训练对数据量的要求,因此对各候选文字图像进行数据扩增,数据扩增的方式可以是图像旋转、图像拉伸、切向变换(透视变换)等,得到待处理文字图像。
作为本实施例的一个可选实施例,本可选实施例进一步将根据各候选文字图像进行数据扩增,获得待处理文字图像优化为:
C1、针对候选文字图像中的每个像素点,确定像素点的原始空间坐标。
在本实施例中,原始空间坐标具体可以理解为图像变换前的原始坐标,即像素点在候选文字图像中的坐标。对于每个像素点,采用相同的方式进行变换。候选文字图像中每个像素点(i,j)通过齐次坐标的方式,将原始空间坐标记为(i,j,1)。
C2、对原始空间坐标构成的矩阵进行转置处理,得到转置矩阵。
在本实施例中,转置矩阵具体可以理解为原始空间坐标构成的矩阵进行转置所得到的矩阵。转置矩阵为[i j 1]T
C3、将预确定的变换矩阵与转置矩阵进行相乘,根据乘积确定变换坐标。
在本实施例中,变换矩阵具体可以理解为数据扩增时,使转置矩阵各像素点位置发生改变所采用的矩阵。变换坐标具体可以理解为变换后像素点的坐标。变换矩阵可以根据数据扩增方式的不同进行设置。将变换矩阵与转置矩阵进行相乘,得到各像素点的变换坐标,即两个矩阵相乘后得到的矩阵均为一个像素点的变换坐标。
当所做数据扩增方式为图像旋转时,变换矩阵T可表示如下:
Figure 22378DEST_PATH_IMAGE012
其中,γ为对图像旋转的角度,当顺时针旋转图像时,γ取值为正,逆时针旋转图像时,γ取值为负,同时为了避免旋转角度过大导致东巴文字变成其它相似文字,γ取值范围可以优选为γ∈[-π/6,-π/18]∪[π/18,π/6]。
当所做数据扩增方式为图像拉伸时,变换矩阵T可表示如下:
Figure 667771DEST_PATH_IMAGE013
其中,L为拉伸系数,L大于1时水平方向放大而垂直方向缩小,L小于1时水平方向缩小而垂直方向放大。
当所做数据扩增方式为切向变换时,变换矩阵T可表示如下:
Figure 557230DEST_PATH_IMAGE014
其中,Ji和Jj分别代表水平和垂直切向变换系数。
C4、将原始空间坐标所对应像素点的像素值确定为变换坐标所对应的像素值,并将原始空间坐标所对应像素点的像素值设置为0。
具体的,将原始空间坐标所对应像素点的像素值确定为变换坐标所对应的像素值,若原始空间坐标所对应像素点的像素值为0,则变换坐标多对应的像素值也为0,若原始空间坐标所对应像素点的像素值为255,则变换坐标多对应的像素值也为255。将原始空间坐标所对应像素点的像素值设置为0,即相当于原始空间坐标所对应的像素点被移动,因此,将此像素点的像素值设置为0(被移动走后即变为背景)。
C5、根据各变换坐标及对应的像素值形成待处理文字图像。
各变换坐标对应的像素值构成的图像作为一个待处理文字图像。
S205、根据各待处理文字图像形成待处理东巴象形文字数据集。
在进行数据扩增时,其实质是对候选文字图像进行处理,处理后得到的文字图像作为待处理文字图像,处理前的候选文字图像也作为待处理文字图像,两种图像数据共同形成待处理东巴象形文字数据集。
S206、获取待处理东巴象形文字数据集。
S207、针对每个待处理文字图像,将待处理文字图像的分辨率中的水平像素点数量与预确定的目标分辨率中的目标水平像素点数量的比值作为垂直划分距离。
在本实施例中,以待处理文字图像的分辨率为1000×900为例,其中,1000为水平像素点数量。目标分辨率以64×128为例,目标水平像素点数量为64。垂直划分距离具体可以理解为待处理文字图像在垂直方向进行划分时的分段距离。
计算待处理文字图像的分辨率中的水平像素点数量与目标分辨率中的目标水平像素点数量的比值,将比值作为垂直划分距离。
S208、将待处理文字图像的分辨率中的垂直像素点数量与预确定的目标分辨率中的目标垂直像素点数量的比值作为水平划分距离。
以上述示例为例,900为垂直像素点数量,目标垂直像素点数量为128。水平划分距离具体可以理解为待处理文字图像在水平方向进行划分时的分段距离。计算待处理文字图像的分辨率中的垂直像素点数量与目标分辨率中的目标垂直像素点数量的比值,将比值作为水平划分距离。
S209、根据垂直划分距离与水平划分距离对待处理文字图像进行分块划分,得到至少一个分块图像。
根据垂直划分距离对待处理文字图像的水平长度进行划分,根据水平划分距离对待处理文字图像的垂直长度进行划分,得到至少一个分块图像。
S210、针对每个分块图像,根据垂直划分距离与水平划分距离确定分块图像中每个像素点在待处理文字图像中对应的比例。
在对待处理文字图像进行划分时,由于存在垂直划分距离和水平划分距离不是整数的情况,此时一个像素点会同时出现在多个分块图像中,即一个像素点被多次划分。以一个像素点为一个1×1的正方形为例,各像素点在待处理文字图像的面积为1×1=1,根据垂直划分距离与水平划分距离对待处理文字图像进行划分后,计算分块图像中的各像素点的面积,此面积除以1即为像素点在待处理文字图像中所占的比例。
S211、将各像素点的比例确定为权重。
各像素点的比例即为加权系数,直接将像素点的比例确定为此像素点的权重。
S212、根据各权重以及各权重对应的位置形成像素系数矩阵。
各权重与像素点对应,像素点的位置即为权重的位置,将各权重按照对应的位置排序,形成像素系数矩阵。
S213、针对每个分块图像,将分块图像与对应的像素系数矩阵相乘,得到像素加权矩阵。
在本实施例中,像素加权矩阵具体可以理解为对分块图像进行加权后得到像素值构成的矩阵。分块图像由各像素点的像素值构成,其可以通过像素值矩阵进行表示,将分块图像对应的像素值矩阵和像素系数矩阵进行相乘,得到像素加权矩阵。
S214、计算像素加权矩阵中像素值的像素和,以及像素系数矩阵中权重的权重和。
将像素加权矩阵中各像素值进行相加求和,得到像素和。将像素系数矩阵中各权重进行相加求和,得到像素和。
S215、将像素和与权重和的比值确定为目标像素值。
在本实施例中,目标像素值具体可以理解为目标文字图像的像素值。计算像素和与权重和的比值,将比值作为目标像素值。
S216、根据各目标像素值及对应的位置确定目标文字图像。
目标像素值的位置与其对应的分块图像的位置对应,即分块图像的位置即为目标像素值的位置,将目标像素值按照位置进行排序,得到相应的矩阵,此矩阵即为目标文字图像。目标文字图像既保留了完整图像信息,又将原始的待处理文字图像分辨率调整到目标分辨率,通常情况下目标分辨率小于待处理文字图像的分辨率,可以最为完整的保留待处理文字图像的纹理信息,最大程度的缩减待处理文字图像分辨率,减少了存储空间和模型训练时间。
示例性的,图3为本申请实施例提供的一种确定目标文字图像的原理示例图。为方便展示,以待处理文字图像的分辨率为5×5,目标文字图像的分辨率为2×2为例,此时垂直划分距离和水平划分距离均为2.5。图3中,Y1-Y4为分块图像,β14为像素系数矩阵,A1-A4为像素加权矩阵,f1-f4为目标像素值在目标文字图像中对应的位置,f1-f4构成的图像即为目标文字图像。图3以分块图像的像素值不是二值化后的像素值为例,若目标文字图像在进行尺寸归一化之前执行过灰度二值化操作,此时Y1-Y4为分块图像中的各像素值的取值仅为0或255。在计算过程中若出现像素值不为整数的情况,可进行取整处理,例如根据四舍五入原则对不为整数的像素值进行取整。图3中,在计算完目标文字图像的像素值后,可对像素值进行二值化处理。也可以将分块图像像素值先进行二值化,再进行尺寸归一化,尺寸归一化的过程可能出现乘以权重后,像素值不是0或255,在尺寸归一化后可再次进行二值化。尺寸归一化与灰度二值化在执行上,无论先后顺序如何,其原理是相同的,本领域技术人员可以知晓。
以Y3为例,分块图像Y3对应的像素值分别为9、114、187、3、101、198、7、111和219。其中,像素值9、114、198和219在待处理文字图像中对应的比例均为0.5;3、101、7和111在待处理文字图像中对应的比例均为1;187在待处理文字图像中对应的比例为0.25。因此得到对应的β3,如图3中所示。Y3与β3相乘,得到对应的像素加权矩阵A3,A3中像素值的像素和为540,β3中权重的权重和为6.25,540与6.25的比值为86.4,取整得到目标像素值86。采用相同的方式计算得到f1为94,f2为91,f4为87,f1-f4按照对应的位置形成目标文字图像。
S217、对各目标文字图像进行标注,确定各目标文字图像对应的标注信息。
在本实施例中,标注信息具体可以理解用于标注目标文字图像含义的信息,可以是计算机可直接识别的二进制数,也可以是阿拉伯数字或文字等类型的信息。
根据目标文字图像的实际含义,对目标文字图像进行标注,生成各目标文字图像的标注信息,实现对目标文字图像的标注。
S218、根据各目标文字图像和对应的标注信息形成目标东巴象形文字数据集。
将每个目标文字图像和对应的标注信息进行对应存储,根据各目标文字图像及其对应的标注信息形成目标东巴象形文字数据集。
示例性的,以目标东巴象形文字数据集包括训练集和测试集为例,说明目标东巴象形文字数据集的形成过程:建立三个分别命名为total、train和test的文件夹,每个文件夹内都有命名为i的文件夹,i∈[0,3199],建立train.txt和test.txt文件,上述三个文件夹和两个文件均放置在同一目录下。将目标文字图像按3200个不同的东巴象形文字分别放到total文件夹下命名为i的文件夹中,采用留出法将每个total中命名为i的文件夹中的图像随机按照8:2比例,放到train和test文件夹下相同命名为i的文件夹中用作训练集和测试集。将train文件夹下命名为i的文件夹中图像的绝对地址和i的数值写入train.txt文件中,将test文件夹下命名为i的子文件夹中图像的绝对地址和i的数值写入test.txt文件中,通过这样的方式将训练集与测试集图像和其类别编码相互对应,完成数据编码标注,每个数据编码具有对应的标注信息,据此形成目标东巴象形文字数据集。
本申请实施例所得到的目标东巴象形文字数据集,在应用于深度学习网络模型对东巴象形文字图像识别时,可以为模型训练提供大量以及标准的东巴象形文字图像,提高东巴文字识别和机器翻译准确率。本申请实施例所提供的图像处理方法也可以建立其它象形文字如甲骨文、古埃及文字数据集。
本发明实施例提供了一种东巴象形文字的图像处理方法,本实施例对步骤进行细化的同时,还提供了待处理东巴象形文字数据集的确定步骤,包括灰度处理、位置归一化、裁剪处理以及数据扩增。通过采集用户根据标准字典进行文字仿写的图像得到初始东巴象形文字数据集,将人工仿写和图像处理技术相结合,可建立包括异体字在内的东巴象形文字数据集,数据集图像质量高、数量大、多样性丰富。对初始文字图像进行灰度处理减少图像信息,降低数据处理复杂度。通过对图像进行位置归一化处理得到文字位置处于图像正中间的中心区域图像,通过裁剪处理得到背景信息较少的候选文字图像,通过不同的数据扩增方式对候选文字图像进行数据扩增,得到待处理文字图像。通过待处理文字图像的分辨率结合目标分辨率对图像进行分块划分,并计算像素系数矩阵,根据像素系数矩阵对分块图像进行加权处理,得到分辨率大小为目标分辨率的目标文字图像。根据各目标文字图像形成的目标东巴象形文字数据集可用于模型训练,提高了模型训练速度和精度,进而实现对东巴象形文字的准确识别。有利于现存东巴经典的机器翻译研究,极大丰富了自然语言处理技术的应用与发展。
实施例三
图4为本发明实施例三提供的一种东巴象形文字的图像处理装置的结构示意图,该装置包括:待处理数据集获取模块31、分块模块32和目标图像确定模块33。
其中,待处理数据集获取模块31,用于获取待处理东巴象形文字数据集,其中,所述待处理东巴象形文字数据集包括至少一个待处理文字图像;
分块模块32,用于针对每个待处理文字图像,根据所述待处理文字图像的分辨率结合预确定的目标分辨率对所述待处理文字图像进行分块划分,得到至少一个分块图像以及各所述分块图像对应的像素系数矩阵;
目标图像确定模块33,用于根据各所述分块图像和对应的像素系数矩阵确定目标文字图像,并根据各所述目标文字图像形成目标东巴象形文字数据集。
本发明实施例提供了一种东巴象形文字的图像处理装置,通过获取待处理东巴象形文字数据集,其中,待处理东巴象形文字数据集包括至少一个待处理文字图像;针对每个待处理文字图像,根据待处理文字图像的分辨率结合预确定的目标分辨率对待处理文字图像进行分块划分,得到分块图像以及各分块图像对应的像素系数矩阵;根据各分块图像和对应的像素系数矩阵确定目标文字图像,并根据各目标文字图像形成目标东巴象形文字数据集。根据各目标文字图像形成的目标东巴象形文字数据集可用于模型训练,提高了模型训练速度和精度,进而实现对东巴象形文字的准确识别。
进一步地,该装置还包括:
初始数据集获取模块,用于获取初始东巴象形文字数据集,其中,所述初始东巴象形文字数据集包括至少一个初始文字图像,所述初始文字图像通过采集用户根据标准字典进行文字仿写的图像得到;
二值处理模块,用于对各所述初始文字图像进行二值化处理,得到二值图像;
候选图像确定模块,用于对各所述二值图像进行位置归一化及裁剪处理,得到候选文字图像;
数据扩增模块,用于根据各所述候选文字图像进行数据扩增,获得待处理文字图像;
待处理数据集形成模块,用于根据各所述待处理文字图像形成待处理东巴象形文字数据集。
进一步地,二值处理模块,包括:
灰度化单元,用于根据加权平均值法对各所述初始文字图像进行灰度化处理,得到灰度化图像;
参数确定单元,用于根据初始阈值参数结合灰度化图像中像素点的像素值确定阈值计算参数;
目标阈值确定单元,用于基于各所述阈值计算参数结合预确定的阈值计算公式确定至少一个目标阈值;
最优阈值确定单元,用于从各所述目标阈值中筛选出最优阈值;
二值化单元,用于根据所述最优阈值对所述灰度化图像进行二值化处理,得到二值图像。
进一步地,参数确定单元,具体用于:根据初始阈值参数以及灰度化图像中像素点的像素值确定各所述像素点所属的类型,所述类型为前景或背景;计算类型为前景的像素点对应的前景像素数量、前景像素平均值、前景像素标准差;计算类型为背景的像素点对应的背景像素数量、背景像素平均值、背景像素标准差;根据所述前景像素数量和背景像素数量确定前景概率和背景概率;将所述前景概率、前景像素平均值、前景像素标准差、背景概率、背景像素平均值和背景像素标准差确定为阈值计算参数。
进一步地,候选图像确定模块,包括:
质心确定单元,用于针对每个二值图像,根据各像素点的水平坐标以及像素值确定水平质心,并根据各像素点的垂直坐标以及像素值确定垂直质心;
位置归一化单元,用于根据所述水平质心和垂直质心对所述二值图像中的各像素点进行位置归一化,得到中心区域图像;
分块矩阵确定单元,用于对所述中心区域图像进行分块划分,得到分块矩阵,所述分块矩阵包含预设数量的像素矩阵;
中心矩阵确定单元,用于将所述分块矩阵与预确定的裁剪矩阵进行相乘,得到中心位置处的像素矩阵;
候选图像确定单元,用于根据中心位置处的像素矩阵确定候选文字图像。
进一步地,数据扩增模块,包括:
原始空间坐标确定单元,用于针对所述候选文字图像中的每个像素点,确定所述像素点的原始空间坐标;
转置处理单元,用于对所述原始空间坐标构成的矩阵进行转置处理,得到转置矩阵;
变换坐标确定单元,用于将预确定的变换矩阵与所述转置矩阵进行相乘,根据乘积确定变换坐标;
像素值确定单元,用于将所述原始空间坐标所对应像素点的像素值确定为所述变换坐标所对应的像素值,并将所述原始空间坐标所对应像素点的像素值设置为0;
待处理图像确定单元,用于根据各所述变换坐标及对应的像素值形成待处理文字图像。
进一步地,分块模块32,包括:
垂直划分距离确定单元,用于将所述待处理文字图像的分辨率中的水平像素点数量与预确定的目标分辨率中的目标水平像素点数量的比值作为垂直划分距离;
水平划分距离确定单元,用于将所述待处理文字图像的分辨率中的垂直像素点数量与预确定的目标分辨率中的目标垂直像素点数量的比值作为水平划分距离;
分块划分单元,用于根据所述垂直划分距离与水平划分距离对所述待处理文字图像进行分块划分,得到各分块图像。
进一步地,分块模块32,还包括:
比例确定单元,用于针对每个分块图像,根据所述垂直划分距离与水平划分距离确定所述分块图像中每个像素点在所述待处理文字图像中对应的比例;
权重确定单元,用于将各像素点的比例确定为权重;
系数矩阵确定单元,用于根据各所述权重以及各所述权重对应的位置形成像素系数矩阵。
进一步地,目标图像确定模块33,包括:
加权矩阵确定单元,用于针对每个分块图像,将所述分块图像与对应的像素系数矩阵相乘,得到像素加权矩阵;
求和单元,用于计算所述像素加权矩阵中像素值的像素和,以及所述像素系数矩阵中权重的权重和;
目标像素值确定单元,用于将所述像素和与权重和的比值确定为目标像素值;
目标图像确定单元,用于根据各所述目标像素值及对应的位置确定目标文字图像。
进一步地,目标图像确定模块33,还包括:
标注单元,用于对各所述目标文字图像进行标注,确定各所述目标文字图像对应的标注信息;
数据集形成单元,用于根据各所述目标文字图像和对应的标注信息形成目标东巴象形文字数据集。
本发明实施例所提供的东巴象形文字的图像处理装置可执行本发明任意实施例所提供的东巴象形文字的图像处理方法,具备执行方法相应的功能模块和有益效果。
实施例四
图5为本发明实施例四提供的一种计算机设备的结构示意图,如图5所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图5中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的东巴象形文字的图像处理方法对应的程序指令/模块。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的东巴象形文字的图像处理方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种东巴象形文字的图像处理方法,该方法包括;
获取待处理东巴象形文字数据集,其中,所述待处理东巴象形文字数据集包括至少一个待处理文字图像;
针对每个待处理文字图像,根据所述待处理文字图像的分辨率结合预确定的目标分辨率对所述待处理文字图像进行分块划分,得到至少一个分块图像以及各所述分块图像对应的像素系数矩阵;
根据各所述分块图像和对应的像素系数矩阵确定目标文字图像,并根据各所述目标文字图像形成目标东巴象形文字数据集。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的东巴象形文字的图像处理方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(RandomAccess Memory, RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述东巴象形文字的图像处理装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种东巴象形文字的图像处理方法,其特征在于,包括:
获取待处理东巴象形文字数据集,其中,所述待处理东巴象形文字数据集包括至少一个待处理文字图像;
针对每个待处理文字图像,根据所述待处理文字图像的分辨率结合预确定的目标分辨率对所述待处理文字图像进行分块划分,得到至少一个分块图像以及各所述分块图像对应的像素系数矩阵;
根据各所述分块图像和对应的像素系数矩阵确定目标文字图像,并根据各所述目标文字图像形成目标东巴象形文字数据集;
所述根据所述待处理文字图像的分辨率结合预确定的目标分辨率对所述待处理文字图像进行分块划分,得到至少一个分块图像,包括:
将所述待处理文字图像的分辨率中的水平像素点数量与预确定的目标分辨率中的目标水平像素点数量的比值作为垂直划分距离;
将所述待处理文字图像的分辨率中的垂直像素点数量与预确定的目标分辨率中的目标垂直像素点数量的比值作为水平划分距离;
根据所述垂直划分距离与水平划分距离对所述待处理文字图像进行分块划分,得到至少一个分块图像;
根据所述待处理文字图像的分辨率结合预确定的目标分辨率对图像进行分块划分,得到各分块图像对应的像素系数矩阵,包括:
针对每个分块图像,根据所述垂直划分距离与水平划分距离确定所述分块图像中每个像素点在所述待处理文字图像中对应的比例;
将各像素点的比例确定为权重;
根据各所述权重以及各所述权重对应的位置形成像素系数矩阵。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取初始东巴象形文字数据集,其中,所述初始东巴象形文字数据集包括至少一个初始文字图像,所述初始文字图像通过采集用户根据标准字典进行文字仿写的图像得到;
对各所述初始文字图像进行二值化处理,得到二值图像;
对各所述二值图像进行位置归一化及裁剪处理,得到候选文字图像;
根据各所述候选文字图像进行数据扩增,获得待处理文字图像;
根据各所述待处理文字图像形成待处理东巴象形文字数据集。
3.根据权利要求2所述的方法,其特征在于,所述对各所述初始文字图像进行二值化处理,得到二值图像,包括:
根据加权平均值法对各所述初始文字图像进行灰度化处理,得到灰度化图像;
根据初始阈值参数结合灰度化图像中像素点的像素值确定阈值计算参数;
基于各所述阈值计算参数结合预确定的阈值计算公式确定至少一个目标阈值;
从各所述目标阈值中筛选出最优阈值;
根据所述最优阈值对所述灰度化图像进行二值化处理,得到二值图像。
4.根据权利要求3所述的方法,其特征在于,所述根据初始阈值参数结合灰度化图像中像素点的像素值确定阈值计算参数,包括:
根据初始阈值参数以及灰度化图像中像素点的像素值确定各所述像素点所属的类型,所述类型为前景或背景;
计算类型为前景的像素点对应的前景像素数量、前景像素平均值、前景像素标准差;
计算类型为背景的像素点对应的背景像素数量、背景像素平均值、背景像素标准差;
根据所述前景像素数量和背景像素数量确定前景概率和背景概率;
将所述前景概率、前景像素平均值、前景像素标准差、背景概率、背景像素平均值和背景像素标准差确定为阈值计算参数。
5.根据权利要求2所述的方法,其特征在于,所述对各所述二值图像进行位置归一化及裁剪处理,得到候选文字图像,包括:
针对每个二值图像,根据各像素点的水平坐标以及像素值确定水平质心,并根据各像素点的垂直坐标以及像素值确定垂直质心;
根据所述水平质心和垂直质心对所述二值图像中的各像素点进行位置归一化,得到中心区域图像;
对所述中心区域图像进行分块划分,得到分块矩阵,所述分块矩阵包含预设数量的像素矩阵;
将所述分块矩阵与预确定的裁剪矩阵进行相乘,得到中心位置处的像素矩阵;
根据中心位置处的像素矩阵确定候选文字图像。
6.根据权利要求2所述的方法,其特征在于,所述根据各所述候选文字图像进行数据扩增,获得待处理文字图像,包括:
针对所述候选文字图像中的每个像素点,确定所述像素点的原始空间坐标;
对所述原始空间坐标构成的矩阵进行转置处理,得到转置矩阵;
将预确定的变换矩阵与所述转置矩阵进行相乘,根据乘积确定变换坐标;
将所述原始空间坐标所对应像素点的像素值确定为所述变换坐标所对应的像素值,并将所述原始空间坐标所对应像素点的像素值设置为0;
根据各所述变换坐标及对应的像素值形成待处理文字图像。
7.根据权利要求1所述的方法,其特征在于,所述根据各所述分块图像和对应的像素系数矩阵确定目标文字图像,包括:
针对每个分块图像,将所述分块图像与对应的像素系数矩阵相乘,得到像素加权矩阵;
计算所述像素加权矩阵中像素值的像素和,以及所述像素系数矩阵中权重的权重和;
将所述像素和与权重和的比值确定为目标像素值;
根据各所述目标像素值及对应的位置确定目标文字图像。
8.根据权利要求1所述的方法,其特征在于,所述根据各所述目标文字图像形成目标东巴象形文字数据集,包括:
对各所述目标文字图像进行标注,确定各所述目标文字图像对应的标注信息;
根据各所述目标文字图像和对应的标注信息形成目标东巴象形文字数据集。
9.一种东巴象形文字的图像处理装置,其特征在于,包括:
待处理数据集获取模块,用于获取待处理东巴象形文字数据集,其中,所述待处理东巴象形文字数据集包括至少一个待处理文字图像;
分块模块,用于针对每个待处理文字图像,根据所述待处理文字图像的分辨率结合预确定的目标分辨率对所述待处理文字图像进行分块划分,得到至少一个分块图像以及各所述分块图像对应的像素系数矩阵;
目标图像确定模块,用于根据各所述分块图像和对应的像素系数矩阵确定目标文字图像,并根据各所述目标文字图像形成目标东巴象形文字数据集;
所述分块模块,包括:
垂直划分距离确定单元,用于将所述待处理文字图像的分辨率中的水平像素点数量与预确定的目标分辨率中的目标水平像素点数量的比值作为垂直划分距离;
水平划分距离确定单元,用于将所述待处理文字图像的分辨率中的垂直像素点数量与预确定的目标分辨率中的目标垂直像素点数量的比值作为水平划分距离;
分块划分单元,用于根据所述垂直划分距离与水平划分距离对所述待处理文字图像进行分块划分,得到各分块图像;
比例确定单元,用于针对每个分块图像,根据所述垂直划分距离与水平划分距离确定所述分块图像中每个像素点在所述待处理文字图像中对应的比例;
权重确定单元,用于将各像素点的比例确定为权重;
系数矩阵确定单元,用于根据各所述权重以及各所述权重对应的位置形成像素系数矩阵。
10.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一项所述的方法。
CN202111212848.7A 2021-10-19 2021-10-19 一种东巴象形文字的图像处理方法 Active CN113657404B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111212848.7A CN113657404B (zh) 2021-10-19 2021-10-19 一种东巴象形文字的图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111212848.7A CN113657404B (zh) 2021-10-19 2021-10-19 一种东巴象形文字的图像处理方法

Publications (2)

Publication Number Publication Date
CN113657404A CN113657404A (zh) 2021-11-16
CN113657404B true CN113657404B (zh) 2022-02-22

Family

ID=78494614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111212848.7A Active CN113657404B (zh) 2021-10-19 2021-10-19 一种东巴象形文字的图像处理方法

Country Status (1)

Country Link
CN (1) CN113657404B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926847B (zh) * 2021-12-06 2023-04-07 百度在线网络技术(北京)有限公司 少数类语言的图像处理方法、装置、设备和存储介质
CN114332888B (zh) * 2022-03-16 2022-06-07 中央民族大学 一种东巴文的文字切分方法、装置、存储介质及电子设备
CN116309912B (zh) * 2023-03-15 2023-08-22 山东上水环境科技集团有限公司 一种测试热成像温度数据恢复为灰度图像的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463195A (zh) * 2014-11-08 2015-03-25 沈阳工业大学 基于模板匹配的印刷体数字识别方法
CN111291696A (zh) * 2020-02-19 2020-06-16 南京大学 一种基于卷积神经网络的手写东巴文识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463195A (zh) * 2014-11-08 2015-03-25 沈阳工业大学 基于模板匹配的印刷体数字识别方法
CN111291696A (zh) * 2020-02-19 2020-06-16 南京大学 一种基于卷积神经网络的手写东巴文识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Opencv9:实现图像尺寸缩减(降采样)功能;小娜美要努力努力;《https://blog.csdn.net/weixin_39504171/article/details/98867938》;20190808;第1-6页 *

Also Published As

Publication number Publication date
CN113657404A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN113657404B (zh) 一种东巴象形文字的图像处理方法
RU2661750C1 (ru) Распознавание символов с использованием искусственного интеллекта
CN108304357B (zh) 一种基于字体流形的中文字库自动生成方法
CN111814794B (zh) 文本检测方法、装置、电子设备及存储介质
CN111340047B (zh) 基于多尺度特征与前背景对比的图像语义分割方法及系统
CN109241974B (zh) 一种文本图像的识别方法及系统
CN109635805B (zh) 图像文本定位方法及装置、图像文本识别方法及装置
JP2006338313A (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
CN113920516B (zh) 一种基于孪生神经网络的书法字骨架匹配方法及系统
CN112966685B (zh) 用于场景文本识别的攻击网络训练方法、装置及相关设备
CN113379786B (zh) 图像抠图方法、装置、计算机设备及存储介质
CN112257578A (zh) 人脸关键点检测方法、装置、电子设备及存储介质
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN111488732A (zh) 一种变形关键词检测方法、系统及相关设备
CN113111880A (zh) 证件图像校正方法、装置、电子设备及存储介质
Zhang et al. A multiple feature fully convolutional network for road extraction from high-resolution remote sensing image over mountainous areas
CN115170403A (zh) 基于深度元学习和生成对抗网络的字体修复方法及系统
CN111582284B (zh) 用于图像识别的隐私保护方法、装置和电子设备
CN112749576A (zh) 图像识别方法和装置、计算设备以及计算机存储介质
CN113361589A (zh) 基于迁移学习与知识蒸馏的珍稀濒危植物叶片识别方法
CN114723652A (zh) 细胞密度确定方法、装置、电子设备及存储介质
CN111985487A (zh) 一种遥感影像目标提取方法、电子设备及存储介质
CN116912366A (zh) 一种基于ai的平面设计生成方法及系统
CN112990213B (zh) 一种基于深度学习的数字万用表字符识别系统和方法
CN112419249B (zh) 一种特殊服饰图片转化方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant