CN108052936B - 一种盲文图像自动倾斜校正方法及系统 - Google Patents
一种盲文图像自动倾斜校正方法及系统 Download PDFInfo
- Publication number
- CN108052936B CN108052936B CN201711071084.8A CN201711071084A CN108052936B CN 108052936 B CN108052936 B CN 108052936B CN 201711071084 A CN201711071084 A CN 201711071084A CN 108052936 B CN108052936 B CN 108052936B
- Authority
- CN
- China
- Prior art keywords
- braille
- image
- points
- lines
- square
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/23—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on positionally close patterns or neighbourhood relationships
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Character Input (AREA)
Abstract
本发明涉及一种盲文图像自动倾斜校正方法及系统,包括:利用采集设备获取纸版盲文的数字化图像;对该数字化图像的盲文进行盲文点检测,获得待校正图像;获取该待校正图像中盲文点的位置信息;根据该位置信息将该待校正图像中的盲文点和背景二值化,获得二值化图像,将背景的像素点赋值为0;将该二值化图像以预设角度为间隔进行第一轮多次旋转,将每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数相加,作为行列数,并将该行列数最大时对应的旋转角度作为校正角度,通过该校正角度对待校正图像进行倾斜校正。
Description
技术领域
本发明涉及盲文图像处理领域,特别涉及一种盲文图像自动倾斜校正方法及系统。
背景技术
视力残疾人士由于视觉障碍,无法像明眼人一样获取明文信息,主要通过触摸盲文点字符号来阅读盲文获取信息。目前流通的盲文图书数量还较少,无法满足盲人朋友的阅读需求。另一方面,盲文图书馆典藏了很多早期有价值的盲文图书和文献,这些图书由于缺乏盲文的数字化信息,导致再版的人工成本昂贵。而且,在特殊教育领域,盲生试卷的编制和阅卷,还是采用盲文老师手工翻译的方式,耗时费力,缺乏客观性。因此,针对纸质盲文图像的盲文点字自动检测和识别技术具有重要意义。
盲文俗称“点字”或“凸字”,由法国人路易·布莱尔于1824年发明,是一种依靠触觉感知的文字。盲文图书的一页大概有1000到2000个盲文凸点。盲文的基本组成单位是盲方或者盲符,每个盲方有6个点位,分布在三行两列的矩阵上,根据相应的点位上是否有凸点来代表不同的盲方。盲方根据“国家盲文标准”,按照一定的方距和行距进行排列,组成盲文。
而在实际应用中,采集到的盲文图像往往存在一定角度的倾斜。盲文点字倾斜可能有两种情况,一种是由于采集过程造成的,比如盲文纸张放置倾斜,一种是盲文在初期打印时本身就是倾斜的,导致盲文对应的盲方行和列不是水平和垂直的,为后期盲方定位和识别带来很大的误差。因此首先需要进行盲文图像倾斜校正,目前还缺乏鲁棒的自动的盲文图像倾斜方法。
发明内容
为了解决上述盲文图像往往存在一定角度的倾斜的问题,本发明提出了一种盲文点检测方法及系统。
具体地说,本发明公开了一种盲文图像自动倾斜校正方法,其中包括:
步骤1、利用采集设备获取纸版盲文的数字化图像;
步骤2、对该数字化图像的盲文进行盲文点检测,获得待校正图像;
步骤3、对该待校正图像实行倾斜校正;
其中该步骤3包括:
步骤31、获取该待校正图像中盲文点的位置信息;
步骤32、根据该位置信息将该待校正图像中的盲文点和背景二值化,获得二值化图像,将背景的像素点赋值为0;
步骤33、将该二值化图像以预设角度为间隔进行第一轮多次旋转,将每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数相加,作为行列数,并将该行列数最大时对应的旋转角度作为校正角度,通过该校正角度对待校正图像进行倾斜校正。
该盲文图像自动倾斜校正方法,其中步骤1中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。
该盲文图像自动倾斜校正方法,其中步骤33中该预设角度为1度。
该盲文图像自动倾斜校正方法,其中该步骤33中还包括在预设旋转角度范围内进行第二轮多次旋转。
该盲文图像自动倾斜校正方法,其中该预设旋转角度范围为-5度到5度,且在该第二轮多次旋转中该预设角度为0.1度。
本发明还提出了一种盲文图像自动倾斜校正系统,其中包括:
采集模块,用于通过采集设备获取纸版盲文的数字化图像;
盲文点检测模块,用于对该数字化图像的盲文进行盲文点检测,获得待校正图像;
校正模块,用于对该待校正图像实行倾斜校正;
其中该校正模块包括:
赋值模块,用于获取该待校正图像中盲文点的位置信息,并根据该位置信息将该待校正图像中的盲文点和背景二值化,获得二值化图像,将背景的像素点赋值为0;
旋转模块,用于将该二值化图像以预设角度为间隔进行第一轮多次旋转,将每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数相加,作为行列数,并将该行列数最大时对应的旋转角度作为校正角度,通过该校正角度对待校正图像进行倾斜校正。
该盲文图像自动倾斜校正系统,其中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。
该盲文图像自动倾斜校正系统,其中该预设角度为1度。
该盲文图像自动倾斜校正系统,其中该旋转模块还包括在预设旋转角度范围内进行第二轮多次旋转。
该盲文图像自动倾斜校正系统,其中该预设旋转角度范围为-5度到5度,且在该第二轮多次旋转中该预设角度为0.1度。
由此本发明可对包含盲文的数字化图像进行倾斜校正。
附图说明
图1为双面盲文图像截图;
图2为以点的形式在屏幕上显示盲文方对应盲文点位置的示意图;
图3为以“日”字的交叉点形式在屏幕上显示盲文方对应盲文点位置的示意图;
图4为已标注完成的盲文方示意图;
图5为选择盲文方进行删除的示意图;
图6为凸点和凹点的标注结果展示图;
图7为基于级联分类器的凸点检测结果展示图;
图8为盲文方定位结果示意图;
图9为初始的计算机盲文点检测结果图;
图10为本发明主要步骤框图。
具体实施方式
为让本发明的上述特征和效果能阐述的更明确易懂,下文特举实施例对上述各步骤进行展开描述,并配合说明书附图作详细说明如下。
如图10所示,本发明主要步骤包括,步骤1,盲文图像采集:
利用采集设备获取纸版盲文的数字化图像。采集方式可以包括扫描仪扫描,摄像机拍照,或者特殊的盲文图像采集仪器等方式。该纸版盲文包括凸点和/或凹点形式的盲文点,纸版盲文可以包括盲文图书或者盲文试卷等,可以是单面印刷或者双面印刷的盲文。单面印刷的盲文每页只包含凸点或者凹点一种形式的盲文点,双面印刷的盲文每页包含凸点和凹点两种形式的盲文点。例如,图1显示了采用扫描仪扫描得到的双面盲文图像的截图,既有凸点又有凹点,在文字密集区,凸点和凹点交互在一起。
步骤2,对该数字化图像的盲文进行盲文点标注或检测,获得包含盲文点位置信息的待校正图像。
步骤3,盲文图像倾斜校正:
盲文点字倾斜可能有两种情况,一种是由于采集过程造成的,例如盲文纸张放置倾斜,一种是盲文在初期打印时本身就是倾斜的,导致盲文对应的盲文方行和列不是水平和垂直的,为后期盲文方定位和标注带来很大的误差。因此首先需要进行盲文图像倾斜校正。
步骤31,获取该待校正图像中盲文点的位置信息。为表述方便本实施例以凸点为例,但不以此为限。
步骤32,较优的,根据该位置信息将该待校正图像中的盲文点和背景二值化,获得二值化图像。例如,在凸点位置使用一个黑色小正方形代替,背景等则设为全白。或者使用黑色的小圆点表示凸点,背景设为全白。
步骤33,将该二值化图像以预设角度为步进间隔进行多次旋转,将每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数相加,作为行列数,并将该行列数最大时对应的旋转角度作为校正角度,通过该校正角度对待校正图像进行倾斜校正。举例来说,在实施例中预设角度为1度(1°),统计每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数总和。空白(行像素值和为0)行列数越多则意味着该旋转角度越接近真实倾斜角度,将空白行列数总和最大对应的旋转角度记为α°(校正角度)。其中为了节省计算时间,可预设旋转角度范围,例如,从-5°到5°进行多次旋转。
步骤34,为了得到更新更精准的角度,再次执行旋转步骤43所得的二值化图像,以0.1°为间隔,从(α-0.5)°到(α+0.5)°进行多次旋转。同步骤43的方法,将投影空白行列数总和最大对应的旋转角度记为β°。
步骤35,角度β°即为所求得的盲文图像倾斜角度,反方向旋转原盲文图像可得到校正后的盲文图像。
通过以上由粗到细的旋转图像,可以快速的获取图像的倾斜角度,误差精细到0.1°。
其他可选的倾斜校正方法包括,在盲文图像上放置或粘贴一个黑色矩形框,假设该方框的水平线和竖直线与盲文方的行和列平行,通过校正该矩形框进行盲文图像的倾斜校正。
其他可选的倾斜校正方法包括,则提取上盲文图像边缘上的凸点,使用最小二乘法拟合直线来进行倾斜校正。可选的还有,人工交互式的标注出某盲文方行的第一行凸点所在位置,或者其他同一行的凸点位置,利用直线拟合的方式,求出直线的倾斜角度,从而进行盲文图像倾斜校正。
其他可选的倾斜校正方法包括,检测盲文图像的纸张边缘直线,利用直线的倾斜来校正盲文图像。
本发明特举以下实施例,进一步详细对上述各步骤进行展开描述。
本发明除上述步骤外还包括:
步骤4盲文点快速检测、步骤5盲文方自适应定位、步骤6盲文点计算机辅助标注和步骤7高精度盲文点和盲文方识别。
步骤4盲文点快速检测,提出了基于级联分类器的盲文点快速检测方法,包括:
步骤S1、基于以上步骤1和步骤2,得到了盲文图像的标注信息,包含凸点的位置信息。本发明下面将以凸点检测为例,凹点的检测方法类似。
步骤S2、利用标注信息,截取图像得到正负样本。比如以标注的凸点为中心的周围的区域图像作为正例样本,同样大小的背景和凹点区域作为反例样本。
步骤S3、提取样本的特征向量,训练分类器。优选的可以提取样本的Haar小波特征,训练Adaboost级联分类器。在待检测的盲文图像上,采用滑动窗口方式,提取窗口内图像的相应特征,比如haar特征,利用训练好的Adaboost分类器进行是否是凸点的分类判别。
步骤S4、经过步骤S1和步骤S2可以得到初步检测的凸点位置信息,保存整个盲文图像的凸点信息。比如保存文件名,以及对应的凸点坐标信息。本发明针对扫描仪得到的200dpi的盲文图像,利用优选的Haar+Adaboost的方法,检测一张图像在0.5秒以内。同时凸点的平均识别准确率达到99.74%,召回率94.01%。图7展示了一个利用级联分类器检测的凸点识别结果。
其他可选的方案,可以提取样本的灰度特征,或者HOG方向直方图特征,或者LBP二值纹理特征等特征向量,训练SVM或者随机森林等分类器,同样采用滑动窗口方式进行凸点检测。
其他可选的方式,可以通过图像分割方法,将盲文点进行前景和背景的分割,从而得到盲文点位置。如果是单面图像就可以直接到的凸点或者凹点信息。如果是双面图像,需要进一步利用特征进行区分凸点还是凹点,从而得到盲文图像上的凸点位置信息。
步骤5、盲文方自适应定位。盲文方定位是盲文识别的关键步骤。现有的盲文方定位算法大多利用规则方法,认为盲文方行列线的排列十分规范,采用标准的盲文方网格即可实现盲文方定位。但在实际处理盲文图像时我们发现,由于生产工艺、扫描设备等原因盲文图像中盲文方行列线排列存在着微小误差,其盲文方行距、方距也并不完全一致。具体步骤如下:
步骤S5、优选的,利用步骤1、2、3、4得到凸点的初步检测结果以及倾斜校正后的盲文图像。或者利用传统的图像分割方法,得到凸点的检测结果,和倾斜校正后的盲文图像。
步骤S6、针对倾斜校正后的图像,利用盲文方三行两列的特点,对凸点位置信息进行纵坐标的聚类,将凸点纵坐标接近的盲文点划分为一组,求其纵坐标均值得到多条预选盲文方水平行线的位置。
步骤S7、从上往下找出符合标准的三条水平行线,即相邻两条水平线之间距离符合统计信息中盲文方点距的范围,如果找不到则生成一个默认的盲文方网格,算法结束。
步骤S8、如果找到了,则从这三条水平线位置开始,根据统计得到的盲文方点距、行距等信息分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平线为基准,同时剔除位置错误的水平线直到达到盲文图像两端,即可得到多组三条水平线一组的盲文方水平线。
步骤S9、同上述方法可得到多组两条竖直线一组的盲文方竖直线。
步骤S10、每组中三条水平线和两条竖直线的交叉点即为盲文点可能存在的位置,六个交叉点组成一个盲文方,最终生成整个盲文方网格。
根据上述算法得到的盲文方定位效果如图8所示,可见在凸点检测基础上进行盲文方定位,消除了凹点带来的影响,算法速度快鲁棒性高。
步骤11、盲文点计算机辅助标注。当需要标注新的盲文书籍,或者盲文试卷的时候。如果我们已经有了一个盲文点检测的分类器,该分类器可以辅助我们进行新盲文图像的快速标注,即由机器先进行标注,人工再进行修正,从而提升标注效率,减少人工标注劳动量。具体步骤如下。
步骤S12、基于以上步骤1、2、3、4、5,得到具有盲文方定位的凸点检测结果。如图9所示,将该图显示在屏幕上。
步骤S13、利用鼠标点选需要修改的盲文方位置,获取该盲文方的信息。
步骤S14、按快捷键删除该盲文方的标注信息。比如DEL进行盲文方标注的删除。
步骤S15、用键盘快捷键进行盲文方内盲文点的快速填充,并在屏幕上实时显示已填充好的凸点。在实际标注时,可采用小键盘的数字键,仅选择某个位置上有凸点的数字。比如,如果该盲文方中仅有1、2、5三个位置有凸点,则仅利用数字键选择1、2、5三个键即可完成该盲文方凸点的填充。同时在屏幕上显示已经填充好的凸点。
步骤S16、也可通过键盘快捷键进行盲文方位置微调,从而更精确的匹配盲文图像上的某一个盲文方。
步骤S17、该盲文方标注完之后,可以采用快捷键进行盲文方位置的移动,移动到下一个盲文方位置。由于中国盲文的排列遵循了国家标准,盲文方行间距和列间距有固定的范围,可以结合盲文图像采集的分辨率,提前统计该盲文图像中对应的盲文方行间距和列间距,方便在交互式操作时直接进行行列的移动。比如,利用键盘上的“上下左右”方向键进行盲文方位置的单步移动,每次移动距离可以提前根据盲文图像进行统计和确定。也可以采用步骤S13,直接点选的方式,选取下一个需要标注的盲文方。这里也可以进一步用快捷键微调盲文方的位置,方法同上步骤S16。
步骤S18、重复步骤S13到步骤S17,完成对整张盲文图像盲文点的交互式辅助修改。
步骤S19、标注结束之后,按快捷键保存该盲文图像的标注信息。比如,点击“S“键进行标注信息的保存,以盲文方的形式,保存盲文方位置信息,以及填充的盲文点的位置信息等。
步骤20、高精度盲文点和盲文方识别。通过以上步骤1到步骤5,得到盲文方的定位结果,可以利用盲文方位置信息,去除Adaboost级联分类器带来的部分误报,因为凸点基本上会出现在盲文方的六个盲文点位置,从而可以提升基于Adaboost分类器的识别效果。更重要的是在盲文方定位基础上,可以仅针对每个盲文方对应的6个盲文点区域,利用更复杂的分类器来提升凸点识别的准确性。具体步骤如下:
步骤S21、优选的,基于步骤1、2得到凸点标注信息,或者利用步骤1、2、3、4、5、6得到凸点标注信息。
步骤S22、截取以凸点为中心点的图像作为正例样本,以凹点和背景的中心点的图像作为反例样本。比如采用24*24的样本大小。
步骤S23、提取样本的多种特征,分别训练多个分类器。优选的,可以提取灰度特征,可以提取HOG梯度直方图特征,可以提取LBP局部二值特征,或者将HOG和LBP进一步串联的特征,并采用支持向量机SVM或者随机森林或者其他的分类器,训练凸点的分类器,同时得到多个分类器。
步骤S24、基于步骤5得到盲文方定位信息。
步骤S25、截取以每个盲文方对应的6个盲文点为中心的小图,将这些小图分别提取多种特征,利用训练好的分类器分别进行凸点的分类判别。优选的,可以提取HOG,LBP,串联的HOG_LBP特征,然后使用三个对应的SVM分类器进行识别,包括HOG-SVM,LBP-SVM,HOG_LBP+SVM。
步骤S26、将多个SVM分类器分类结果,与级联分类器进行结果融合。最终的融合结果为不同分类器的结果与其对应的权值的乘积。如果最终的融合结果超过某阈值,说明大多数分类器的输出是凸点,则认为其存在凸点。凹点的检测方法同凸点。
步骤S37、可以进一步将盲文方内的凸点信息转化为盲文方信息,从而完成基于盲文方的检测和识别。
步骤S38、可以融合正反面的盲文点的识别结果,来提高盲文点和盲文方的识别性能。
步骤S39、还可以将盲文方的信息翻译为汉语文字和句子,根据句子分析来排查检测错误的盲方,从而提高盲文编辑人员的工作效率。
基于以上步骤,基于组合分类器的方法,对盲文图像的凸点平均识别性能,达到了准确率99.75%,召回率99.58%。对盲文方的平均识别性能,达到了准确率98.27%,召回率98.84%。本发明针对扫描仪得到的200dpi的盲文图像,利用以上步骤1至步骤7得到盲文点和盲文方检测结果,检测一张图像平均在1.8秒以内。
以下为与上述方法实施例对应的系统实施例,本实施系统可与上述实施方式互相配合实施。上述施方式中提到的相关技术细节在本实施系统中依然有效,为了减少重复,这里不再赘述。相应地,本实施系统中提到的相关技术细节也可应用在上述实施方式中。
本发明还提出了一种盲文图像自动倾斜校正系统,其中包括:
采集模块,用于通过采集设备获取纸版盲文的数字化图像;
盲文点检测模块,用于对该数字化图像的盲文进行盲文点检测,获得待校正图像;
校正模块,用于对该待校正图像实行倾斜校正;
其中该校正模块包括:
赋值模块,用于获取该待校正图像中盲文点的位置信息,并根据该位置信息将该待校正图像中的盲文点和背景二值化,获得二值化图像,将背景的像素点赋值为0;
旋转模块,用于将该二值化图像以预设角度为间隔进行第一轮多次旋转,将每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数相加,作为行列数,并将该行列数最大时对应的旋转角度作为校正角度,通过该校正角度对待校正图像进行倾斜校正。
该盲文图像自动倾斜校正系统,其中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。
该盲文图像自动倾斜校正系统,其中该预设角度为1度。
该盲文图像自动倾斜校正系统,其中该旋转模块还包括在预设旋转角度范围内进行第二轮多次旋转。
该盲文图像自动倾斜校正系统,其中该预设旋转角度范围为-5度到5度,且在该第二轮多次旋转中该预设角度为0.1度。
Claims (10)
1.一种盲文图像自动倾斜校正方法,其特征在于,包括:
步骤1、利用采集设备获取纸版盲文的数字化图像;
步骤2、对该数字化图像的盲文进行盲文点检测,获得待校正图像;
步骤3、对该待校正图像实行倾斜校正,得到倾斜校正处理完成后的盲文图像,并对该盲文图像内的盲文方进行定位,生成该盲文图像的盲文方网格;
其中该步骤3包括:
步骤31、获取该待校正图像中盲文点的位置信息;
步骤32、根据该位置信息将该待校正图像中的盲文点和背景二值化,获得二值化图像,将背景的像素点赋值为0;
步骤33、将该二值化图像以预设角度为间隔进行第一轮多次旋转,将每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数相加,作为行列数,并将该行列数最大时对应的旋转角度作为校正角度,通过该校正角度对待校正图像进行倾斜校正;
步骤34、获取倾斜校正处理完成后盲文图像的盲文点位置信息;
步骤35、根据盲文方三行两列的特点,对该盲文点位置信息中凸点位置信息进行纵坐标的聚类,将凸点纵坐标接近的盲文点划分为一组,求其纵坐标均值得到多条预选盲文方水平行线的位置;
步骤36、根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的三条水平行线,其中该标准为相邻两条水平行线间距离符合统计信息中盲文方点距的范围,若存在,则从该三条水平行线开始,根据统计得到的盲文方点距、行距分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到该盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;
步骤37、根据盲文方三行两列的特点,对该盲文点位置信息中凸点位置信息进行横坐标的聚类,将凸点横坐标接近的盲文点划分为一组,求其横坐标均值得到多条预选盲文方竖直列线的位置;
步骤38、根据各预选盲文方竖直列线的横坐标,从左到右判断是否存在符合标准的两条竖直列线,其中该标准为相邻两条竖直列线间距离符合统计信息中盲文方点距的范围,若存在,则从该两条竖直列线开始,根据统计得到的盲文方点距、列距分别向左、向右拓展,且拓展的过程中生成以最新拓展的一组两条竖直列线为基准,同时剔除位置错误的竖直列线,直到达到该盲文图像左右两端,得到包含多组以两条竖直列线为一组的盲文方竖直线;
步骤39、以该盲文方竖直线和该盲文方竖直线的相交点,构成该盲文方网格。
2.如权利要求1所述的盲文图像自动倾斜校正方法,其特征在于,步骤1中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。
3.如权利要求1所述的盲文图像自动倾斜校正方法,其特征在于,步骤33中该预设角度为1度。
4.如权利要求1所述的盲文图像自动倾斜校正方法,其特征在于,该步骤33中还包括在预设旋转角度范围内进行第二轮多次旋转。
5.如权利要求4所述的盲文图像自动倾斜校正方法,其特征在于,该预设旋转角度范围为-5度到5度,且在该第二轮多次旋转中该预设角度为0.1度。
6.一种盲文图像自动倾斜校正系统,其特征在于,包括:
采集模块,用于通过采集设备获取纸版盲文的数字化图像;
盲文点检测模块,用于对该数字化图像的盲文进行盲文点检测,获得待校正图像;
校正模块,用于对该待校正图像实行倾斜校正,得到倾斜校正处理完成后的盲文图像,并对该盲文图像内的盲文方进行定位,生成该盲文图像的盲文方网格;
其中该校正模块包括:
赋值模块,用于获取该待校正图像中盲文点的位置信息,并根据该位置信息将该待校正图像中的盲文点和背景二值化,获得二值化图像,将背景的像素点赋值为0;
旋转模块,用于将该二值化图像以预设角度为间隔进行第一轮多次旋转,将每次旋转后水平投影行像素值和为0的行数和竖直投影列像素和为0的列数相加,作为行列数,并将该行列数最大时对应的旋转角度作为校正角度,通过该校正角度对待校正图像进行倾斜校正;
纵坐标聚类模块,获取倾斜校正处理完成后盲文图像的盲文点位置信息,根据盲文方三行两列的特点,对该盲文点位置信息中凸点位置信息进行纵坐标的聚类,将凸点纵坐标接近的盲文点划分为一组,求其纵坐标均值得到多条预选盲文方水平行线的位置;
水平行线生成模块,用于根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的三条水平行线,其中该标准为相邻两条水平行线间距离符合统计信息中盲文方点距的范围,若存在,则从该三条水平行线开始,根据统计得到的盲文方点距、行距分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到该盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;
横坐标聚类模块,用于根据盲文方三行两列的特点,对该盲文点位置信息中凸点位置信息进行横坐标的聚类,将凸点横坐标接近的盲文点划分为一组,求其横坐标均值得到多条预选盲文方竖直列线的位置;
竖直列线生成模块,用于根据各预选盲文方竖直列线的横坐标,从左到右判断是否存在符合标准的两条竖直列线,其中该标准为相邻两条竖直列线间距离符合统计信息中盲文方点距的范围,若存在,则从该两条竖直列线开始,根据统计得到的盲文方点距、列距分别向左、向右拓展,且拓展的过程中生成以最新拓展的一组两条竖直列线为基准,同时剔除位置错误的竖直列线,直到达到该盲文图像左右两端,得到包含多组以两条竖直列线为一组的盲文方竖直线;
盲文方网格构成模块,用于以该盲文方竖直线和该盲文方竖直线的相交点,构成该盲文方网格。
7.如权利要求6所述的盲文图像自动倾斜校正系统,其特征在于,该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。
8.如权利要求6所述的盲文图像自动倾斜校正系统,其特征在于,该预设角度为1度。
9.如权利要求6所述的盲文图像自动倾斜校正系统,其特征在于,该旋转模块还包括在预设旋转角度范围内进行第二轮多次旋转。
10.如权利要求9所述的盲文图像自动倾斜校正系统,其特征在于,该预设旋转角度范围为-5度到5度,且在该第二轮多次旋转中该预设角度为0.1度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711071084.8A CN108052936B (zh) | 2017-11-03 | 2017-11-03 | 一种盲文图像自动倾斜校正方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711071084.8A CN108052936B (zh) | 2017-11-03 | 2017-11-03 | 一种盲文图像自动倾斜校正方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108052936A CN108052936A (zh) | 2018-05-18 |
CN108052936B true CN108052936B (zh) | 2021-06-29 |
Family
ID=62118643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711071084.8A Active CN108052936B (zh) | 2017-11-03 | 2017-11-03 | 一种盲文图像自动倾斜校正方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108052936B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110705556B (zh) * | 2019-09-18 | 2023-04-25 | 佛山职业技术学院 | 一种盲文转化仪、转化方法及存储介质 |
CN113537216B (zh) * | 2021-07-22 | 2024-05-31 | 凌云光技术股份有限公司 | 一种点阵字体文本行倾斜校正方法及装置 |
CN113421257B (zh) * | 2021-07-22 | 2024-05-31 | 凌云光技术股份有限公司 | 一种点阵字体文本行旋转校正方法及装置 |
CN114882504B (zh) * | 2022-07-06 | 2022-11-11 | 成都西交智汇大数据科技有限公司 | 一种评分方法、装置、设备及可读存储介质 |
CN118429978A (zh) * | 2024-04-29 | 2024-08-02 | 杭州彗光科技有限公司 | 一种基于块检测预处理的旋转盲文方检测方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101135940A (zh) * | 2007-09-07 | 2008-03-05 | 中国科学院计算技术研究所 | 一种盲文计算机点字输入系统和装置以及方法 |
CN106446885A (zh) * | 2016-09-21 | 2017-02-22 | 北京联合大学 | 纸介盲文识别方法和系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770575B (zh) * | 2008-12-31 | 2012-06-06 | 汉王科技股份有限公司 | 名片图像倾斜角度的测量方法和装置 |
CN101840648B (zh) * | 2010-04-28 | 2011-09-28 | 长春大学 | 自动盲文阅卷方法 |
CN101923710A (zh) * | 2010-06-30 | 2010-12-22 | 青岛海信网络科技股份有限公司 | 图像倾斜校正方法及装置 |
US8885193B2 (en) * | 2011-10-10 | 2014-11-11 | King Saud University | Braille-to-Braille facsimile machine using image processing |
CN102722711B (zh) * | 2012-05-31 | 2014-05-07 | 信帧电子技术(北京)有限公司 | 一种车牌类型识别中的车牌字符序列识别方法及装置 |
CN104766078B (zh) * | 2015-04-02 | 2018-06-22 | 四川九洲电器集团有限责任公司 | 目标图像的倾斜角检测方法及倾斜角检测设备 |
CN105404621B (zh) * | 2015-09-25 | 2018-07-10 | 中国科学院计算技术研究所 | 一种用于盲人读取汉字的方法及系统 |
CN105488501B (zh) * | 2015-11-26 | 2018-11-16 | 南京富士通南大软件技术有限公司 | 基于旋转投影的车牌倾斜矫正的方法 |
-
2017
- 2017-11-03 CN CN201711071084.8A patent/CN108052936B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101135940A (zh) * | 2007-09-07 | 2008-03-05 | 中国科学院计算技术研究所 | 一种盲文计算机点字输入系统和装置以及方法 |
CN106446885A (zh) * | 2016-09-21 | 2017-02-22 | 北京联合大学 | 纸介盲文识别方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108052936A (zh) | 2018-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108052936B (zh) | 一种盲文图像自动倾斜校正方法及系统 | |
CN108052955B (zh) | 一种高精度盲文识别方法及系统 | |
JP5379085B2 (ja) | スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム | |
US6778703B1 (en) | Form recognition using reference areas | |
CN110597806A (zh) | 一种基于批阅识别的错题集生成与答题统计系统及方法 | |
CN101719142B (zh) | 基于分类字典的稀疏表示图片文字检测方法 | |
CN102567300A (zh) | 图片文档的处理方法及装置 | |
CN105046200B (zh) | 基于直线检测的电子阅卷方法 | |
CN111414905B (zh) | 一种文本检测方法、文本检测装置、电子设备及存储介质 | |
CN106033535A (zh) | 电子阅卷方法 | |
CN105117741A (zh) | 一种书法字风格的识别方法 | |
CN108564079A (zh) | 一种便携式字符识别装置及方法 | |
CN106778717A (zh) | 一种基于图像识别和k近邻的测评表识别方法 | |
CN107958261B (zh) | 一种盲文点检测方法及系统 | |
CN113159014A (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN110298236B (zh) | 一种基于深度学习的盲文图像自动识别方法和系统 | |
CN112560849A (zh) | 基于神经网络算法的文理分割方法及系统 | |
CN114463770A (zh) | 一种用于普遍试卷题目的智能切题方法 | |
CN108062548B (zh) | 一种盲文方自适应定位方法及系统 | |
CN104408403A (zh) | 一种二次录入不一致的仲裁方法及装置 | |
CN114241492A (zh) | 一种识别作文稿纸的手写文本识别并复现文本结构的方法 | |
CN113657162A (zh) | 一种基于深度学习的票据ocr识别方法 | |
CN107292255B (zh) | 基于特征矩阵相似度分析的手写数字识别方法 | |
CN111612045B (zh) | 一种获取目标检测数据集的通用方法 | |
CN110766001B (zh) | 基于cnn和rnn的银行卡卡号定位与端到端识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |