CN115953785A - 基于教辅图书内容增强的数字化编辑系统 - Google Patents
基于教辅图书内容增强的数字化编辑系统 Download PDFInfo
- Publication number
- CN115953785A CN115953785A CN202310246055.XA CN202310246055A CN115953785A CN 115953785 A CN115953785 A CN 115953785A CN 202310246055 A CN202310246055 A CN 202310246055A CN 115953785 A CN115953785 A CN 115953785A
- Authority
- CN
- China
- Prior art keywords
- point
- segmentation
- candidate
- points
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 claims abstract description 300
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 20
- 230000001186 cumulative effect Effects 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 230000008859 change Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像处理领域,具体涉及基于教辅图书内容增强的数字化编辑系统,所述系统包括数据采集模块、文字分割模块和教辅资源检索模块;数据采集模块:采集得到教案图像;文字分割模块:根据教案图像得到投影直方图;根据投影直方图得到每个点为分割点的可能程度,进而得到多个第一候选分割点;计算每个第一候选分割点的分割点符合性;进而得到多个第二候选分割点,计算每个第二候选分割点的可能概率;根据每个第二候选分割点的可能概率得到准确分割点;根据准确分割点得到教案图像的所有标准文字;教辅资源检索模块:利用教案图像的所有标准文字中的关键词进行教辅资源检索得到相应的教辅资料,从而提高教案图像文字分割的准确性。
Description
技术领域
本申请涉及图像处理领域,具体涉及基于教辅图书内容增强的数字化编辑系统。
背景技术
数字化编辑系统是教师的教辅图书编辑网站,在该系统上,教师通过上传自身书写的文字教案,来申购相配套的数字化教辅图书资源。数字化编辑系统通过对教师上传的教案图片进行文字识别处理得到索引文字,根据索引文字对教辅图书资源进行搜索匹配得到相应教辅图书资源。在对教师上传的教案图片进行文字识别处理前,需先对教案图片中的文字进行分割处理,由于书写习惯等原因,教案图片上的书写文字会存在粘连问题,这将会影响文字的分割准确性。
在现有技术中,对手写汉字的分割主要是通过垂直投影的方法,通过获得每行字的投影直方图,然后根据直方图中像素点的分布进行区间的划分,进而得到文字的分割线。此方法对清晰、分割线比较明显的文字具有较好的分割效果,但是对手写粘连文字不能进行很好的分割,会出现分割错误的情况,造成文字无法识别。
发明内容
为了解决上述技术问题,本发明提供基于教辅图书内容增强的数字化编辑系统,所述系统包括:
数据采集模块、文字分割模块和教辅资源检索模块;
数据采集模块:采集得到教案图像;
文字分割模块:根据教案图像得到二值图像,根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,通过对每行文字图像的每列像素进行统计得到投影直方图;根据投影直方图中每个点的像素统计个数以及每个点与参考点的距离得到每个点为分割点的可能程度,将可能程度大于第一预设阈值的点划分为第一候选分割点得到多个第一候选分割点;
对所有第一候选分割点进行聚类分析得到多个聚类簇,根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,根据每个聚类簇、每个第一候选分割点的第一像素累加和、第二像素累加和以及两个相邻第一候选分割点之间距离得到每个第一候选分割点的分割点符合性;将分割点符合性大于第二预设阈值的第一候选分割点划分为第二候选分割点;根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,根据最小基准距离和参考相邻距离得到每个第二候选分割点的可能概率;
根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点;根据准确分割点和每行文字图像得到教案图像的所有标准文字;
教辅资源检索模块:利用教案图像的所有标准文字中的关键词进行教辅资源检索得到相应的教辅资料。
优选的,所述根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,包括的具体步骤为:
获取文字高度,获取教案图像的行宽,根据文字高度和教案图像的行宽设置预设矩形框的大小;
利用预设矩形框,以预设滑动步长,在教案图像上从上到下移动得到每行文字图像。
优选的,所述通过对每行文字图像的每列像素进行统计得到投影直方图,包括的具体步骤为:
对二值图像的每列的文字像素进行统计得到每列的统计像素个数,将所有列的统计像素个数按列次序进行排列得到每行文字的投影直方图。
优选的,所述根据投影直方图中每个点的像素统计个数以及每个点与参考点的距离得到每个点为分割点的可能程度,包括的具体步骤为:
获取投影直方图中的所有谷点;将投影直方图中每个横坐标点称为每个点,将投影直方图中处于每个点左侧的最近谷点作为每个点的参考点;
投影直方图中第i个点为分割点的可能程度计算公式:
其中,表示在投影直方图中第i个点为分割点的可能程度,表示归一化
函数,表示投影直方图中第个点处的像素统计个数,表示预设的最小文字宽度,表示
投影直方图中第点到该点的参考点的距离,exp()表示以自然常数为底的指数函数。
优选的,所述根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,包括的具体步骤为:
基于同一聚类簇的第一候选分割点进行分析,当不包含各第一候选分割点与前一个相邻第一候选分割点时,在投影直方图上获取前一个相邻第一候选分割点与各第一候选点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第一像素点累加和;当不包含前一个相邻第一候选分割点但包含各第一候选分割点时,在投影直方图上获取前一个相邻第一候选分割点与各第一候选分割点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第二像素累加和。
优选的,所述根据每个聚类簇、每个第一候选分割点的第一像素累加和、第二像素累加和以及两个相邻第一候选分割点之间距离得到每个第一候选分割点的分割点符合性,包括的具体步骤为:
其中,表示第个第一候选分割点的分割点符合性,表示同一个聚类簇中第i
个第一候选分割点与第i-1个第一候选分割点的距离,表示预设的最小文字宽度;表
示第i个第一候选分割点的第一像素点累加和,表示第i个第一候选分割点的第二像素
累加和,exp()表示以自然常数为底的指数函数,表示归一化函数。
优选的,所述根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,包括的具体步骤为:
获得投影像素点个数为0的第二候选分割点,将所选的第二候选分割点构成的集合称为基准分割点集合,将基准分割点集合中每个元素称为基准分割点;
对于投影直方图,将各基准分割点与前一个位置的基准分割点之间的距离称为各基准分割点的基准距离,在所有基准分割点的基准距离中获取最小基准距离;
对于投影直方图,将各第二候选分割点与前一个位置的第二候选分割点之间的距离称为各第二候选分割点的距离,获取所有第二候选分割点的距离均值记为参考相邻距离。
优选的,所述根据最小基准距离和参考相邻距离得到每个第二候选分割点的可能概率,包括的具体步骤为:
第i个第二候选分割点的可能概率:
优选的,所述根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点,包括的具体步骤为:
在投影直方图的横坐标上获取左侧第一个点记为第一基准点;
根据第一基准点和最小基准距离mind得到准确分割点,包括:在投影直方图的横
坐标上获取处于第一基准点右测并且与第一基准点间隔为的点记为第一边界
点,在第一基准点到第一边界点之间的区域内获取所有候选分割点记为第一基准点的多个
候选分割点,将第一基准点的多个候选分割点中的可能概率最大的候选分割点作为准确分
割点;
将第一边界点作为第一基准点,重复执行所述根据第一基准点和最小基准距离mind得到准确分割点的操作,直至在投影直方图的横坐标上无法获得第一边界点,得到多个准确分割点。
优选的,所述根据准确分割点和每行文字图像得到教案图像的所有标准文字,包括的具体步骤为:
以准确分割点所在列为分界线对每行文字图像进行分割处理得到多个独立字图像,利用文字识别算法OCR对于每个独立字图像进行文字识别得到标准文字,教案图像的所有行文字图像得到标准文字作为教案图像的所有标准。
本发明实施例至少具有如下有益效果:在通过投影直方图中统计像素个数最少处的点作为分割点对文字进行分割时,会造成汉字的识别错误,因此根据直方图中像素点的分布特征以及文字特征来实现文字分割。因为投影直方图中得到的分割点是包含了所有准确的分割点,但同时会存在多余的错误分割点,因此在进行分割点的挑选时,根据文字之间的距离变化,结合投影直方图的变化得到每个分割点的可能程度,然后在确定准确的分割点。该方法能实现手写粘连文字的准确分割,避免汉字之间的分割错误,提高汉字的识别正确率,进而能够准确的进行汉字的识别与匹配。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的基于教辅图书内容增强的数字化编辑方法的流程图;
图2为本发明提供的书写文字分析示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于教辅图书内容增强的数字化编辑系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于教辅图书内容增强的数字化编辑系统的具体方案。
本发明一个实施例提供的基于教辅图书内容增强的数字化编辑系统,该系统包含数据采集模块、文字分割模块和教辅资源检索模块;其中数据采集模块:采集得到教案图像;文字分割模块:通过对教案图像进行分割处理得到教案图像的所有标准字;教辅资源检索模块:利用教案图像的所有标准字中的关键词进行教辅资源检索得到所需的教辅资源。
具体的,本实施例的基于教辅图书内容增强的数字化编辑系统提供了如下的基于教辅图书内容增强的数字化编辑方法,请参阅图1,该方法包括以下步骤:
步骤S001,采集得到教案图像,对教案图像进行预处理得到二值图像。
本实施例主要解决教案图像中文字分割问题,因而需要先获取教案图像。因为教师在通过教辅图书资源库搜索资源时,需要上传教案,因此系统能够自动获取到教师的教案图像。
为了便于后续分析需先对教案图像进行预处理来提高教案图像的质量。
首先使用直方图均衡化算法对教案图像进行增强处理得到增强后的教案图像,然后使用均值滤波算法对增强后的教案图像进行去噪处理得到去噪后的教案图像,随后使用OTSU算法对去噪后的教案图像进行二值化处理得到二值图像,在二值图像中像素值为0的像素为文字像素,像素值为1的像素为背景像素。
步骤S002,根据二值图像得到每行文字的投影直方图,根据投影直方图得到每个点为分割点的可能程度,根据每个点为投影点的可能程度得到第一候选分割点。
传统方法一般先通过对每行文字进行垂直投影获得投影直方图,而后通过寻找投影直方图中像素点数量最少的点作为分割点,然后利用分割点对每行文字进行文字分割。但是这种方法在对手写文字进行分割的时候,因为文字之间会存在粘连,而文字的粘连会导致投影直方图中像素点的分布发生变化,因此获得的分割点不是实际文字间的分割点;并且由于汉字是方块形文字,存在偏旁部首,直接通过投影直方图进行分割,可能会将一个字拆分为两个字,因而只利用投影直方图的分布无法对文字进行准确分割;为了解决上述问题,本实施例提供一种文字分割方法,该文字分割方法不仅考虑了投影直方图的分布情况,同时还结合文字特征来对文字进行分割,从而提高文字分割的准确性。
由于每行文字的投影直方图的分布特征能够反映文字的间隔特征,因而可根据投影直方图的分布特征来得到候选分割点,首先获得每行文字的投影直方图,具体如下:
1、根据二值图像得到每行文字的投影直方图:
(1)根据二值图像得到每行文字:
由于手写文字中每行文字之间一般不会存在粘连,并且每行文字的高度一般不会超出一定范围,因而可根据每行文字的高度以及每行文字的宽度来分割出每行文字。
根据经验在教案图像上文字高度为51个像素,为了防止有些文字超出这个高度导致分割出的文字不完整,所以留出10个像素的余量,将分割高度调整成61。
利用W*61的预设矩形框,以61为预设滑动步长,在教案图像的最小外接矩形区域内上从上到下移动得到多个矩形图像,每个矩形图像中包含一行文字,得到多行文字,为了便于描述,后续将每个矩形图像称为每行文字图像。
(2)获取每行文字的投影直方图:
对二值图像的每列的文字像素进行统计得到每列的统计像素个数,将所有列的统计像素个数按列次序进行排列得到每行文字的投影直方图。
2、根据每行文字的投影直方图得到每个点为分割点的可能程度:
因为在投影直方图中,像素点数量越少的点越可能是两个文字之间的分割点,但是文字的偏旁部首之间像素点的数量也较少,因此在根据投影直方图获得分割点时,不但需要根据投影直方图的像素统计个数来获得可能的分割点,同时还要根据原始的文字信息来得到分割点的可能程度,同时因为同一个人书写的汉字的大小时比较相似的,因而分割点之间距离应该相似,因而可结合该特征以及每个点处的统计像素个数来确定每个点为分割点的可能程度。具体如下:
将投影直方图中每个横坐标点称为每个点;
对投影直方图进行处理得到投影直方图中的所有极值点,在投影直方图的所有极值点中既包含峰点也包含谷点,获取投影直方图中的所有谷点;将处于每个点左侧的最近谷点作为每个点的参考点。
投影直方图中每个点为分割点的可能程度计算公式:
式中,表示在投影直方图中第i个点为分割点的可能程度,表示归一化
函数,本实施例中采用softmax归一化方法,其归一化范围为,表示投影直方图中第
个点处的像素统计个数,表示预设的最小文字宽度,本实施例中取33个像素,因为根据经
验每个文字的宽度不会小于33,其他实施例中实施者可根据实际设置,表示投影直方图
中第个点到该点的参考点的距离,exp()表示以自然常数为底的指数函数,通过
来反映统计直方图中像素统计个数对每个点为分割点的可能程度的影响,该值越大说明该
点处像素统计个数较少,该点为文字之间分割点的概率越大,来反映了统计直方图
中每个点分割出的文字宽度对每个点为分割点的可能程度的影响,该值越大说明将该点与
该点的参考点作为分割点分割出的文字宽度满足文字宽度要求的程度越大,这样有效避免
将偏旁部首分割成独立字的情况。
3、根据每个点作为分割点的可能程度得到候选分割点:
将可能程度大于第一预设阈值P1的点划分为第一候选分割点,得到多个第一候选分割点。本实施例中P1取0.42,其他实施例中实施者可根据实际设置。
至此,得到第一候选分割点,为后续确定准确分割点提供基础,在确定第一候选分割点时,首先获取每行文字的投影直方图,然后根据投影直方图得到每个点为分割点的可能程度,在确定分割点的可能程度时,既考虑了文字之间的分割点处的文字像素个数较少,同时还考虑到独立的文字宽度不会太小,基于这两个方面来确定各点为分割点的可能程度,利用每个点为分割点的可能程度来划分出第一候选分割点。
步骤S003,计算每个第一候选分割点的分割点符合性,根据每个第一候选分割点的分割点符合性得到第二候选分割点,计算每个第二候选分割点的可能概率。
如示意图2所示,人们在书写文字中主要存在以下几种场景,即图中第1个文字和第2个文字之间不存在空隙,第1个文字和第2个文字存在黏连,这种文字通过上述步骤中的距离特征无法获取两个文字之间的准确分割点;第2个文字与第3个文字之间存在空隙,这种利用上述步骤中的距离特征能够较好的筛选出分割点;第6个文字,文字较宽,并且文字的两个部分之间的文字笔画较小,即两部分的投影像素个数较少,这种问题利用上述步骤中的距离特征不能够较好的获取这种文字的分割点,下面需针对第6个文字体现的文字较宽,无法获取这种文字分割点的问题,以及第1个文字与第2文字之间存在黏连的问题,继续进行研究。
1、对第一候选分割点进行聚类分析得到多个聚类簇:
设置聚类层数为2层,利用层次聚类方法对所有第一候选分割点进行聚类分析得到多个聚类簇。
通过聚类分析能够将距离较近的第一候选分割点划分在一个聚类簇中,需要说明的是,由于分布在较宽文字两侧的第一候选分割点距离较大,因而分布与较宽文字两侧的第一候选分割点会被划分在两个聚类簇中;黏连文字的左侧文字的左侧第一候选分割点与右测文字的右侧第一候选分割点距离较远,因而黏连文字的左侧文字的左侧第一候选分割点与右测文字的右测第一候选分割点会被划分在两个聚类簇中。
2、计算每个第一候选分割点的分割点符合性:
如示意图2所示,由于较宽文字部件之间的第一候选分割点,可能会被划分在文字的左、右侧第一候选分割点的聚类簇中,因而下面需要对同一聚类簇中第一候选分割点之间的关系来进一步分析各第一候选分割点的分割点符合性,从而排除较宽文字部件之间的第一候选分割点的干扰。
基于同一聚类簇的第一候选分割点进行分析,当不包含第i-1个第一候选分割点
与第i个第一候选分割点时,在投影直方图上获取第个第一候选分割点与第个第一候
选点之间内的所有点处的投影像素点个数的累加和记为第i个第一候选分割点的第一像素
点累加和;当不包含第i-1个第一候选分割点但包含第i个第一候选分割点时,在投影直
方图上获取第个第一候选分割点与第个第一候选分割点之间的所有点处的投影像素
点个数的累加和记为第i个第一候选分割点的第二像素累加和。
根据第i个第一候选分割点的第一像素累加和、第二像素累加和得到第i个第一候选分割点的分割点符合性:
其中,表示第个第一候选分割点的分割点符合性,表示一个聚类簇中第i个
第一候选分割点与第i-1个第一候选分割点的距离,表示预设的最小文字宽度,
反映了一个聚类簇中第i个第一候选分割点与第i-1个第一候选分割点之间的距离与最小
文字看度之间的差值绝对值,该值越小,说明第i个第一候选分割点与第i-1个第一候选分
割点分割出的区域越接近最小文字宽度,因而第i个第一候选分割点的分割点符合性越大;表示第i个第一候选分割点的第一像素点累加和,表示第i个第一候选分割点的第二
像素累加和,反映了第i个候选分割点处投影像素点个数占第i-1个第一候选分割点与第
i个第一候选分割点之间所有投影像素个数据比例,该值越接近1说明第i个第一候选分割
点处的投影像素点个数越少,因而第i个第一候选分割点的分割点符合性越大。exp()表示
以自然常数为底的指数函数,表示归一化函数,其归一化值为,本实施例利用
softmax归一化方法进行归一化处理,其他实施例中实施者可根基实际选择。在较宽文字的
两部件之间第一候选分割点相较于文字之间的第一候选分割点,其第一候选分割点处的投
影像素个数较多,因而通过此计算出的分割点符合性较小;同时由于较宽文字每个部件的
宽度较小,因而较宽文字的两部件之间的第一候选分割点与该文字的左侧/右测第一候选
分割点之间的距离与参考剧烈的差异较大,因而通过此计算出的分割点符合性较小。
3、根据分割点符合性得到第二候选分割点:
4、计算每个第二候选分割点的可能概率:
由于黏连文字之间存在一些干扰分割点,下面需对第二候选分割点进一步分析,来排除这些分割点的干扰得到准确的分割点。
由于投影直方图中统计像素个数为0的分割点为准确分割点的可能程度大,因此获取统计像素个数为0的第二候选分割点,将所选第二候选分割点构成的集合称为基准分割点集合,将基准分割点集合中每个元素称为基准分割点;
对于投影直方图,将各基准分割点与前一个位置的基准分割点之间的距离称为各
基准分割点的基准距离,需要说明的是当基准分割点不存在前一个位置的基准分割点时,
无需获取各基准分割点的基准距离;在所有基准分割点的基准距离中获取最小基准距离记
为,该最小基准距离能够较为准确的反映书写文字的字宽情况。
对于投影直方图,将各第二候选分割点与前一个位置的第二候选分割点之间的距离称为各第二候选分割点的距离,获取所有第二候选分割点的距离均值记为参考相邻距离。
根据最小基准距离得到每个第二候选分割点的可能概率:
式中,表示第个第二候选分割点的可能概率,表示第i个第二候选分割点与
前一个第二候选分割点之间的距离,表示最小基准距离,该值能够较为准确的反映书
写文字的字宽情况,表示参考相邻距离,该值能够反映所有第二候选分割点的平均距离。表示第个第二候选分割点的距离与最小参考距离的差,由于正常书写的文字之
间会存在一定的间隙,因此两个第二候选分割点之间的距离可能会大于实际字宽,因而反映了第i个第二候选分割点与第i-1个第二候选分割点之间存在的文字间隙。表示去除文字间隙后的参考相邻距离,即第i个第二候选分割点与第i-1个
第二候选分割点之间的文字的实际宽度,表示第i个第二候选分
割点的距离与去除文字间隙后的参考相邻距离之间的差值,该值越小,说明第i个第二候选
分割点与第i-1个候选分割点之间的距离与实际字宽较为接近,因而第i个第二候选分割点
的可能概率越大,表示以自然常数为底的指数函数,表示第i个第二候选分割点的
可能概率。由于正常书写的文字之间会存在一定的间隙,而文字黏连时,文字之间不存在间
隙。通过所有第二候选分割点得到的参考相邻距离会包含一定的文字间隙,因而为了防
止这些间隙的干扰,因而将去除参考相邻距离中的文字间隙,即通过式子来去除中的间隙得到实际文字字宽,当第i个第二候选分割点为黏连
文字分割点时,第i个第二候选分割点的距离应该与实际字宽相近,即越小时,第i个候选分割点为黏连文字之间准确分割点的可能性
越大。
步骤S004,根据每个第二候选分割点的可能概率得到准确分割点,利用准确分割点得到教案图像的所有标准文字,根据所有标准文字获取教辅资料。
1、根据每个第二候选分割点的可能概率得到准确分割点:
在投影直方图的横坐标上获取左侧第一个点记为第一基准点;
根据第一基准点和最小基准距离得到准确分割点,包括:在投影直方图的横坐标
上获取处于第一基准点右侧且与第一基准点间隔为的点记为第一边界点,在第
一基准点到第一边界点之间的区域内获取所有第二候选分割点记为第一基准点的多个第
二候选分割点,将第一基准点的多个第二候选分割点中选取的可能概率最大的第二候选分
割点作为准确分割点;
将第一边界点作为第一基准点,重复执行,根据第一基准点和最小基准距离得到准确分割点操作,直至在投影直方图中无法获取第一边界点,得到多个准确分割点。
2、利用准确分割点对每行文字图像进行分割处理得到多个独立字图像:
以准确分割点所在列为分界线对每行文字图像进行分割处理得到多个独立字图像。
3、根据独立字图像完成教辅图书资源的匹配:
利用文字识别算法OCR对于每个独立字图像进行文字识别得到标准文字,利用教案图像中所有的标准文字中关键词作为索引在教辅图书资源库进行资源匹配得到与教案图像相符的教辅图像资源。
综上所述,本发明实施例提供了基于教辅图书内容增强的数字化编辑方法,在通过投影直方图中统计像素个数最少处的点作为分割点对文字进行分割时,会造成汉字的识别错误,因此根据直方图中像素点的分布特征以及文字特征来实现文字分割。因为投影直方图中得到的分割点是包含了所有准确的分割点,但同时会存在多余的错误分割点,因此在进行分割点的挑选时,根据文字之间的距离变化,结合投影直方图的变化得到每个分割点的可能程度,然后在确定准确的分割点。该方法能实现手写粘连文字的准确分割,避免汉字之间的分割错误,提高汉字的识别正确率,进而能够准确的进行汉字的识别与匹配。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于教辅图书内容增强的数字化编辑系统,其特征在于,所述系统包括:
数据采集模块、文字分割模块和教辅资源检索模块;
数据采集模块:采集得到教案图像;
文字分割模块:根据教案图像得到二值图像,根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,通过对每行文字图像的每列像素进行统计得到投影直方图;根据投影直方图中每个点的像素统计个数以及每个点与参考点的距离得到每个点为分割点的可能程度,将可能程度大于第一预设阈值的点划分为第一候选分割点得到多个第一候选分割点;
对所有第一候选分割点进行聚类分析得到多个聚类簇,根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,根据每个聚类簇、每个第一候选分割点的第一像素累加和、第二像素累加和以及两个相邻第一候选分割点之间距离得到每个第一候选分割点的分割点符合性;将分割点符合性大于第二预设阈值的第一候选分割点划分为第二候选分割点;根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,根据最小基准距离和参考相邻距离得到每个第二候选分割点的可能概率;
根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点;根据准确分割点和每行文字图像得到教案图像的所有标准文字;
教辅资源检索模块:利用教案图像的所有标准文字中的关键词进行教辅资源检索得到相应的教辅资料。
2.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,包括的具体步骤为:
获取文字高度,获取教案图像的行宽,根据文字高度和教案图像的行宽设置预设矩形框的大小;
利用预设矩形框,以预设滑动步长,在教案图像上从上到下移动得到每行文字图像。
3.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述通过对每行文字图像的每列像素进行统计得到投影直方图,包括的具体步骤为:
对二值图像的每列的文字像素进行统计得到每列的统计像素个数,将所有列的统计像素个数按列次序进行排列得到每行文字的投影直方图。
5.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,包括的具体步骤为:
基于同一聚类簇的第一候选分割点进行分析,当不包含各第一候选分割点与前一个相邻第一候选分割点时,在投影直方图上获取前一个相邻第一候选分割点与各第一候选点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第一像素点累加和;当不包含前一个相邻第一候选分割点但包含各第一候选分割点时,在投影直方图上获取前一个相邻第一候选分割点与各第一候选分割点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第二像素累加和。
7.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,包括的具体步骤为:
获得投影像素点个数为0的第二候选分割点,将所选的第二候选分割点构成的集合称为基准分割点集合,将基准分割点集合中每个元素称为基准分割点;
对于投影直方图,将各基准分割点与前一个位置的基准分割点之间的距离称为各基准分割点的基准距离,在所有基准分割点的基准距离中获取最小基准距离;
对于投影直方图,将各第二候选分割点与前一个位置的第二候选分割点之间的距离称为各第二候选分割点的距离,获取所有第二候选分割点的距离均值记为参考相邻距离。
9.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点,包括的具体步骤为:
在投影直方图的横坐标上获取左侧第一个点记为第一基准点;
根据第一基准点和最小基准距离mind得到准确分割点,包括:在投影直方图的横坐标上获取处于第一基准点右测并且与第一基准点间隔为的点记为第一边界点,在第一基准点到第一边界点之间的区域内获取所有候选分割点记为第一基准点的多个候选分割点,将第一基准点的多个候选分割点中的可能概率最大的候选分割点作为准确分割点;
将第一边界点作为第一基准点,重复执行所述根据第一基准点和最小基准距离mind得到准确分割点的操作,直至在投影直方图的横坐标上无法获得第一边界点,得到多个准确分割点。
10.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据准确分割点和每行文字图像得到教案图像的所有标准文字,包括的具体步骤为:
以准确分割点所在列为分界线对每行文字图像进行分割处理得到多个独立字图像,利用文字识别算法OCR对于每个独立字图像进行文字识别得到标准文字,教案图像的所有行文字图像得到标准文字作为教案图像的所有标准。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310246055.XA CN115953785B (zh) | 2023-03-15 | 2023-03-15 | 基于教辅图书内容增强的数字化编辑系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310246055.XA CN115953785B (zh) | 2023-03-15 | 2023-03-15 | 基于教辅图书内容增强的数字化编辑系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115953785A true CN115953785A (zh) | 2023-04-11 |
CN115953785B CN115953785B (zh) | 2023-05-16 |
Family
ID=85907052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310246055.XA Active CN115953785B (zh) | 2023-03-15 | 2023-03-15 | 基于教辅图书内容增强的数字化编辑系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115953785B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08305795A (ja) * | 1995-04-28 | 1996-11-22 | Nippon Steel Corp | 文字認識方法 |
US20050154707A1 (en) * | 2002-01-31 | 2005-07-14 | Napper Jonathon L. | Electronic filing system searchable by a handwritten search query |
US20080219556A1 (en) * | 2007-03-06 | 2008-09-11 | Microsoft Corporation | Radical-Based HMM Modeling for Handwritten East Asian Characters |
CN108805128A (zh) * | 2017-05-05 | 2018-11-13 | 北京京东金融科技控股有限公司 | 一种字符分割方法和装置 |
CN110516674A (zh) * | 2019-09-04 | 2019-11-29 | 中国地质调查局西安地质调查中心 | 一种文本图像的手写汉字分割方法及系统 |
WO2019232849A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 汉字模型训练方法、手写字识别方法、装置、设备及介质 |
CN111507356A (zh) * | 2020-04-20 | 2020-08-07 | 恒银金融科技股份有限公司 | 一种金融票据小写金额手写字符的分割方法 |
CN113723413A (zh) * | 2021-08-01 | 2021-11-30 | 北京工业大学 | 一种基于贪吃蛇的手写中文文本切分方法 |
CN115082934A (zh) * | 2022-07-04 | 2022-09-20 | 南京晨浩泰电子商务有限公司 | 一种金融票据中手写汉字分割识别方法 |
CN115171124A (zh) * | 2022-09-07 | 2022-10-11 | 江苏巨信众汇数字科技有限公司 | 用于手写汉字识别的文本分割方法 |
-
2023
- 2023-03-15 CN CN202310246055.XA patent/CN115953785B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08305795A (ja) * | 1995-04-28 | 1996-11-22 | Nippon Steel Corp | 文字認識方法 |
US20050154707A1 (en) * | 2002-01-31 | 2005-07-14 | Napper Jonathon L. | Electronic filing system searchable by a handwritten search query |
US20080219556A1 (en) * | 2007-03-06 | 2008-09-11 | Microsoft Corporation | Radical-Based HMM Modeling for Handwritten East Asian Characters |
CN108805128A (zh) * | 2017-05-05 | 2018-11-13 | 北京京东金融科技控股有限公司 | 一种字符分割方法和装置 |
WO2019232849A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 汉字模型训练方法、手写字识别方法、装置、设备及介质 |
CN110516674A (zh) * | 2019-09-04 | 2019-11-29 | 中国地质调查局西安地质调查中心 | 一种文本图像的手写汉字分割方法及系统 |
CN111507356A (zh) * | 2020-04-20 | 2020-08-07 | 恒银金融科技股份有限公司 | 一种金融票据小写金额手写字符的分割方法 |
CN113723413A (zh) * | 2021-08-01 | 2021-11-30 | 北京工业大学 | 一种基于贪吃蛇的手写中文文本切分方法 |
CN115082934A (zh) * | 2022-07-04 | 2022-09-20 | 南京晨浩泰电子商务有限公司 | 一种金融票据中手写汉字分割识别方法 |
CN115171124A (zh) * | 2022-09-07 | 2022-10-11 | 江苏巨信众汇数字科技有限公司 | 用于手写汉字识别的文本分割方法 |
Non-Patent Citations (2)
Title |
---|
DONA VALY 等: "Line Segmentation Approach for Ancient Palm Leaf Manuscripts Using Competitive Learning Algorithm", 《2016 15TH INTERNATIONAL CONFERENCE ON FRONTIERS IN HANDWRITING》 * |
苏敏: "古籍手写文字分割算法的研究与应用", 《信息科技》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115953785B (zh) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及系统 | |
CN110032938B (zh) | 一种藏文识别方法、装置及电子设备 | |
CN106156761B (zh) | 面向移动终端拍摄的图像表格检测与识别方法 | |
Rath et al. | Word image matching using dynamic time warping | |
CN113158808B (zh) | 中文古籍字符识别、组段与版面重建方法、介质和设备 | |
CN110598686B (zh) | 发票的识别方法、系统、电子设备和介质 | |
CN112052852B (zh) | 一种基于深度学习的手写气象档案资料的字符识别方法 | |
CN104573688A (zh) | 基于深度学习的移动平台烟草激光码智能识别方法及装置 | |
WO2021042505A1 (zh) | 基于文字识别技术的笔记生成方法、装置和计算机设备 | |
CN110458158B (zh) | 一种针对盲人辅助阅读的文本检测与识别方法 | |
Chamchong et al. | Character segmentation from ancient palm leaf manuscripts in Thailand | |
Tardón et al. | Optical music recognition for scores written in white mensural notation | |
CN113159014A (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN115984859B (zh) | 一种图像文字识别的方法、装置及存储介质 | |
CN111340032A (zh) | 一种基于金融领域应用场景的字符识别方法 | |
CN110991374B (zh) | 一种基于rcnn的指纹奇异点检测方法 | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
CN115862045A (zh) | 基于图文识别技术的病例自动识别方法、系统、设备及存储介质 | |
CN115881265A (zh) | 电子病历智能病案质控方法、系统、设备及存储介质 | |
WO2022121021A1 (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
CN110705535A (zh) | 一种试卷版面文字行自动检测的方法 | |
CN112560856B (zh) | 车牌检测识别方法、装置、设备及存储介质 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN108985294B (zh) | 一种轮胎模具图片的定位方法、装置、设备及存储介质 | |
CN110633754A (zh) | 一种基于神经网络的智能病案文字识别的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Digital Editing System Based on Content Enhancement of Teaching Aid Books Effective date of registration: 20231026 Granted publication date: 20230516 Pledgee: Liangshan County sub branch of Postal Savings Bank of China Ltd. Pledgor: Shandong Xinghuo Book Co.,Ltd. Registration number: Y2023980062950 |