CN115953785B - 基于教辅图书内容增强的数字化编辑系统 - Google Patents

基于教辅图书内容增强的数字化编辑系统 Download PDF

Info

Publication number
CN115953785B
CN115953785B CN202310246055.XA CN202310246055A CN115953785B CN 115953785 B CN115953785 B CN 115953785B CN 202310246055 A CN202310246055 A CN 202310246055A CN 115953785 B CN115953785 B CN 115953785B
Authority
CN
China
Prior art keywords
point
candidate
points
segmentation
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310246055.XA
Other languages
English (en)
Other versions
CN115953785A (zh
Inventor
许传峰
秦海燕
许刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Xinghuo Book Co ltd
Original Assignee
Shandong Xinghuo Book Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Xinghuo Book Co ltd filed Critical Shandong Xinghuo Book Co ltd
Priority to CN202310246055.XA priority Critical patent/CN115953785B/zh
Publication of CN115953785A publication Critical patent/CN115953785A/zh
Application granted granted Critical
Publication of CN115953785B publication Critical patent/CN115953785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明涉及图像处理领域,具体涉及基于教辅图书内容增强的数字化编辑系统,所述系统包括数据采集模块、文字分割模块和教辅资源检索模块;数据采集模块:采集得到教案图像;文字分割模块:根据教案图像得到投影直方图;根据投影直方图得到每个点为分割点的可能程度,进而得到多个第一候选分割点;计算每个第一候选分割点的分割点符合性;进而得到多个第二候选分割点,计算每个第二候选分割点的可能概率;根据每个第二候选分割点的可能概率得到准确分割点;根据准确分割点得到教案图像的所有标准文字;教辅资源检索模块:利用教案图像的所有标准文字中的关键词进行教辅资源检索得到相应的教辅资料,从而提高教案图像文字分割的准确性。

Description

基于教辅图书内容增强的数字化编辑系统
技术领域
本申请涉及图像处理领域,具体涉及基于教辅图书内容增强的数字化编辑系统。
背景技术
数字化编辑系统是教师的教辅图书编辑网站,在该系统上,教师通过上传自身书写的文字教案,来申购相配套的数字化教辅图书资源。数字化编辑系统通过对教师上传的教案图片进行文字识别处理得到索引文字,根据索引文字对教辅图书资源进行搜索匹配得到相应教辅图书资源。在对教师上传的教案图片进行文字识别处理前,需先对教案图片中的文字进行分割处理,由于书写习惯等原因,教案图片上的书写文字会存在粘连问题,这将会影响文字的分割准确性。
在现有技术中,对手写汉字的分割主要是通过垂直投影的方法,通过获得每行字的投影直方图,然后根据直方图中像素点的分布进行区间的划分,进而得到文字的分割线。此方法对清晰、分割线比较明显的文字具有较好的分割效果,但是对手写粘连文字不能进行很好的分割,会出现分割错误的情况,造成文字无法识别。
发明内容
为了解决上述技术问题,本发明提供基于教辅图书内容增强的数字化编辑系统,所述系统包括:
数据采集模块、文字分割模块和教辅资源检索模块;
数据采集模块:采集得到教案图像;
文字分割模块:根据教案图像得到二值图像,根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,通过对每行文字图像的每列像素进行统计得到投影直方图;根据投影直方图中每个点的像素统计个数以及每个点与参考点的距离得到每个点为分割点的可能程度,将可能程度大于第一预设阈值的点划分为第一候选分割点得到多个第一候选分割点;
对所有第一候选分割点进行聚类分析得到多个聚类簇,根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,根据每个聚类簇、每个第一候选分割点的第一像素累加和、第二像素累加和以及两个相邻第一候选分割点之间距离得到每个第一候选分割点的分割点符合性;将分割点符合性大于第二预设阈值的第一候选分割点划分为第二候选分割点;根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,根据最小基准距离和参考相邻距离得到每个第二候选分割点的可能概率;
根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点;根据准确分割点和每行文字图像得到教案图像的所有标准文字;
教辅资源检索模块:利用教案图像的所有标准文字中的关键词进行教辅资源检索得到相应的教辅资料。
优选的,所述根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,包括的具体步骤为:
获取文字高度,获取教案图像的行宽,根据文字高度和教案图像的行宽设置预设矩形框的大小;
利用预设矩形框,以预设滑动步长,在教案图像上从上到下移动得到每行文字图像。
优选的,所述通过对每行文字图像的每列像素进行统计得到投影直方图,包括的具体步骤为:
对二值图像的每列的文字像素进行统计得到每列的统计像素个数,将所有列的统计像素个数按列次序进行排列得到每行文字的投影直方图。
优选的,所述根据投影直方图中每个点的像素统计个数以及每个点与参考点的距离得到每个点为分割点的可能程度,包括的具体步骤为:
获取投影直方图中的所有谷点;将投影直方图中每个横坐标点称为每个点,将投影直方图中处于每个点左侧的最近谷点作为每个点的参考点;
投影直方图中第i个点为分割点的可能程度计算公式:
其中,表示在投影直方图中第i个点为分割点的可能程度,表示归一化函数,表示投影直方图中第个点处的像素统计个数,表示预设的最小文字宽度,表示投影直方图中第点到该点的参考点的距离,exp()表示以自然常数为底的指数函数。
优选的,所述根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,包括的具体步骤为:
基于同一聚类簇的第一候选分割点进行分析,当不包含各第一候选分割点与前一个相邻第一候选分割点时,在投影直方图上获取前一个相邻第一候选分割点与各第一候选点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第一像素点累加和;当不包含前一个相邻第一候选分割点但包含各第一候选分割点时,在投影直方图上获取前一个相邻第一候选分割点与各第一候选分割点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第二像素累加和。
优选的,所述根据每个聚类簇、每个第一候选分割点的第一像素累加和、第二像素累加和以及两个相邻第一候选分割点之间距离得到每个第一候选分割点的分割点符合性,包括的具体步骤为:
其中,表示第个第一候选分割点的分割点符合性,表示同一个聚类簇中第i个第一候选分割点与第i-1个第一候选分割点的距离,表示预设的最小文字宽度;表示第i个第一候选分割点的第一像素点累加和,表示第i个第一候选分割点的第二像素累加和,exp()表示以自然常数为底的指数函数,表示归一化函数。
优选的,所述根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,包括的具体步骤为:
获得投影像素点个数为0的第二候选分割点,将所选的第二候选分割点构成的集合称为基准分割点集合,将基准分割点集合中每个元素称为基准分割点;
对于投影直方图,将各基准分割点与前一个位置的基准分割点之间的距离称为各基准分割点的基准距离,在所有基准分割点的基准距离中获取最小基准距离;
对于投影直方图,将各第二候选分割点与前一个位置的第二候选分割点之间的距离称为各第二候选分割点的距离,获取所有第二候选分割点的距离均值记为参考相邻距离。
优选的,所述根据最小基准距离和参考相邻距离得到每个第二候选分割点的可能概率,包括的具体步骤为:
第i个第二候选分割点的可能概率:
其中,表示第个第二候选分割点的可能概率,表示第i个第二候选分割点与前一个第二候选分割点之间的距离,表示最小基准距离,表示参考相邻距离,exp()表示以自然常数为底的指数函数。
优选的,所述根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点,包括的具体步骤为:
在投影直方图的横坐标上获取左侧第一个点记为第一基准点;
根据第一基准点和最小基准距离mind得到准确分割点,包括:在投影直方图的横坐标上获取处于第一基准点右侧并且与第一基准点间隔为的点记为第一边界点,在第一基准点到第一边界点之间的区域内获取所有候选分割点记为第一基准点的多个候选分割点,将第一基准点的多个候选分割点中的可能概率最大的候选分割点作为准确分割点;
将第一边界点作为第一基准点,重复执行所述根据第一基准点和最小基准距离mind得到准确分割点的操作,直至在投影直方图的横坐标上无法获得第一边界点,得到多个准确分割点。
优选的,所述根据准确分割点和每行文字图像得到教案图像的所有标准文字,包括的具体步骤为:
以准确分割点所在列为分界线对每行文字图像进行分割处理得到多个独立字图像,利用文字识别算法OCR对于每个独立字图像进行文字识别得到标准文字,教案图像的所有行文字图像得到标准文字作为教案图像的所有标准。
本发明实施例至少具有如下有益效果:在通过投影直方图中统计像素个数最少处的点作为分割点对文字进行分割时,会造成汉字的识别错误,因此根据直方图中像素点的分布特征以及文字特征来实现文字分割。因为投影直方图中得到的分割点是包含了所有准确的分割点,但同时会存在多余的错误分割点,因此在进行分割点的挑选时,根据文字之间的距离变化,结合投影直方图的变化得到每个分割点的可能程度,然后在确定准确的分割点。该方法能实现手写粘连文字的准确分割,避免汉字之间的分割错误,提高汉字的识别正确率,进而能够准确的进行汉字的识别与匹配。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的基于教辅图书内容增强的数字化编辑方法的流程图;
图2为本发明提供的书写文字分析示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于教辅图书内容增强的数字化编辑系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于教辅图书内容增强的数字化编辑系统的具体方案。
本发明一个实施例提供的基于教辅图书内容增强的数字化编辑系统,该系统包含数据采集模块、文字分割模块和教辅资源检索模块;其中数据采集模块:采集得到教案图像;文字分割模块:通过对教案图像进行分割处理得到教案图像的所有标准字;教辅资源检索模块:利用教案图像的所有标准字中的关键词进行教辅资源检索得到所需的教辅资源。
具体的,本实施例的基于教辅图书内容增强的数字化编辑系统提供了如下的基于教辅图书内容增强的数字化编辑方法,请参阅图1,该方法包括以下步骤:
步骤S001,采集得到教案图像,对教案图像进行预处理得到二值图像。
本实施例主要解决教案图像中文字分割问题,因而需要先获取教案图像。因为教师在通过教辅图书资源库搜索资源时,需要上传教案,因此系统能够自动获取到教师的教案图像。
为了便于后续分析需先对教案图像进行预处理来提高教案图像的质量。
首先使用直方图均衡化算法对教案图像进行增强处理得到增强后的教案图像,然后使用均值滤波算法对增强后的教案图像进行去噪处理得到去噪后的教案图像,随后使用OTSU算法对去噪后的教案图像进行二值化处理得到二值图像,在二值图像中像素值为0的像素为文字像素,像素值为1的像素为背景像素。
步骤S002,根据二值图像得到每行文字的投影直方图,根据投影直方图得到每个点为分割点的可能程度,根据每个点为投影点的可能程度得到第一候选分割点。
传统方法一般先通过对每行文字进行垂直投影获得投影直方图,而后通过寻找投影直方图中像素点数量最少的点作为分割点,然后利用分割点对每行文字进行文字分割。但是这种方法在对手写文字进行分割的时候,因为文字之间会存在粘连,而文字的粘连会导致投影直方图中像素点的分布发生变化,因此获得的分割点不是实际文字间的分割点;并且由于汉字是方块形文字,存在偏旁部首,直接通过投影直方图进行分割,可能会将一个字拆分为两个字,因而只利用投影直方图的分布无法对文字进行准确分割;为了解决上述问题,本实施例提供一种文字分割方法,该文字分割方法不仅考虑了投影直方图的分布情况,同时还结合文字特征来对文字进行分割,从而提高文字分割的准确性。
由于每行文字的投影直方图的分布特征能够反映文字的间隔特征,因而可根据投影直方图的分布特征来得到候选分割点,首先获得每行文字的投影直方图,具体如下:
1、根据二值图像得到每行文字的投影直方图:
 (1)根据二值图像得到每行文字:
由于手写文字中每行文字之间一般不会存在粘连,并且每行文字的高度一般不会超出一定范围,因而可根据每行文字的高度以及每行文字的宽度来分割出每行文字。
根据经验在教案图像上文字高度为51个像素,为了防止有些文字超出这个高度导致分割出的文字不完整,所以留出10个像素的余量,将分割高度调整成61。
获取二值图像中所有文字像素的最小外接矩形,获取最小外接矩形的宽度作为行宽
利用W*61的预设矩形框,以61为预设滑动步长,在教案图像的最小外接矩形区域内上从上到下移动得到多个矩形图像,每个矩形图像中包含一行文字,得到多行文字,为了便于描述,后续将每个矩形图像称为每行文字图像。
(2)获取每行文字的投影直方图:
对二值图像的每列的文字像素进行统计得到每列的统计像素个数,将所有列的统计像素个数按列次序进行排列得到每行文字的投影直方图。
2、根据每行文字的投影直方图得到每个点为分割点的可能程度:
因为在投影直方图中,像素点数量越少的点越可能是两个文字之间的分割点,但是文字的偏旁部首之间像素点的数量也较少,因此在根据投影直方图获得分割点时,不但需要根据投影直方图的像素统计个数来获得可能的分割点,同时还要根据原始的文字信息来得到分割点的可能程度,同时因为同一个人书写的汉字的大小时比较相似的,因而分割点之间距离应该相似,因而可结合该特征以及每个点处的统计像素个数来确定每个点为分割点的可能程度。具体如下:
将投影直方图中每个横坐标点称为每个点;
对投影直方图进行处理得到投影直方图中的所有极值点,在投影直方图的所有极值点中既包含峰点也包含谷点,获取投影直方图中的所有谷点;将处于每个点左侧的最近谷点作为每个点的参考点。
投影直方图中每个点为分割点的可能程度计算公式:
式中,表示在投影直方图中第i个点为分割点的可能程度,表示归一化函数,本实施例中采用softmax归一化方法,其归一化范围为表示投影直方图中第个点处的像素统计个数,表示预设的最小文字宽度,本实施例中取33个像素,因为根据经验每个文字的宽度不会小于33,其他实施例中实施者可根据实际设置,表示投影直方图中第个点到该点的参考点的距离,exp()表示以自然常数为底的指数函数,通过来反映统计直方图中像素统计个数对每个点为分割点的可能程度的影响,该值越大说明该点处像素统计个数较少,该点为文字之间分割点的概率越大,来反映了统计直方图中每个点分割出的文字宽度对每个点为分割点的可能程度的影响,该值越大说明将该点与该点的参考点作为分割点分割出的文字宽度满足文字宽度要求的程度越大,这样有效避免将偏旁部首分割成独立字的情况。
3、根据每个点作为分割点的可能程度得到候选分割点:
将可能程度大于第一预设阈值P1的点划分为第一候选分割点,得到多个第一候选分割点。本实施例中P1取0.42,其他实施例中实施者可根据实际设置。
至此,得到第一候选分割点,为后续确定准确分割点提供基础,在确定第一候选分割点时,首先获取每行文字的投影直方图,然后根据投影直方图得到每个点为分割点的可能程度,在确定分割点的可能程度时,既考虑了文字之间的分割点处的文字像素个数较少,同时还考虑到独立的文字宽度不会太小,基于这两个方面来确定各点为分割点的可能程度,利用每个点为分割点的可能程度来划分出第一候选分割点。
步骤S003,计算每个第一候选分割点的分割点符合性,根据每个第一候选分割点的分割点符合性得到第二候选分割点,计算每个第二候选分割点的可能概率。
如示意图2所示,人们在书写文字中主要存在以下几种场景,即图中第1个文字和第2个文字之间不存在空隙,第1个文字和第2个文字存在黏连,这种文字通过上述步骤中的距离特征无法获取两个文字之间的准确分割点;第2个文字与第3个文字之间存在空隙,这种利用上述步骤中的距离特征能够较好的筛选出分割点;第6个文字,文字较宽,并且文字的两个部分之间的文字笔画较小,即两部分的投影像素个数较少,这种问题利用上述步骤中的距离特征不能够较好的获取这种文字的分割点,下面需针对第6个文字体现的文字较宽,无法获取这种文字分割点的问题,以及第1个文字与第2文字之间存在黏连的问题,继续进行研究。
1、对第一候选分割点进行聚类分析得到多个聚类簇:
设置聚类层数为2层,利用层次聚类方法对所有第一候选分割点进行聚类分析得到多个聚类簇。
通过聚类分析能够将距离较近的第一候选分割点划分在一个聚类簇中,需要说明的是,由于分布在较宽文字两侧的第一候选分割点距离较大,因而分布与较宽文字两侧的第一候选分割点会被划分在两个聚类簇中;黏连文字的左侧文字的左侧第一候选分割点与右侧文字的右侧第一候选分割点距离较远,因而黏连文字的左侧文字的左侧第一候选分割点与右侧文字的右侧第一候选分割点会被划分在两个聚类簇中。
 2、计算每个第一候选分割点的分割点符合性:
如示意图2所示,由于较宽文字部件之间的第一候选分割点,可能会被划分在文字的左、右侧第一候选分割点的聚类簇中,因而下面需要对同一聚类簇中第一候选分割点之间的关系来进一步分析各第一候选分割点的分割点符合性,从而排除较宽文字部件之间的第一候选分割点的干扰。
基于同一聚类簇的第一候选分割点进行分析,在投影直方图上获取不包含第i-1个第一候选分割点与第i个第一候选分割点的情况时,第个第一候选分割点与第个第一候选点之间内的所有点处的投影像素点个数的累加和记为第i个第一候选分割点的第一像素点累加和;在投影直方图上获取不包含第i-1个第一候选分割点但包含第i个第一候选分割点的情况时,第个第一候选分割点与第个第一候选分割点之间的所有点处的投影像素点个数的累加和记为第i个第一候选分割点的第二像素累加和
根据第i个第一候选分割点的第一像素累加和、第二像素累加和得到第i个第一候选分割点的分割点符合性:
其中,表示第个第一候选分割点的分割点符合性,表示一个聚类簇中第i个第一候选分割点与第i-1个第一候选分割点的距离,表示预设的最小文字宽度,反映了一个聚类簇中第i个第一候选分割点与第i-1个第一候选分割点之间的距离与最小文字看度之间的差值绝对值,该值越小,说明第i个第一候选分割点与第i-1个第一候选分割点分割出的区域越接近最小文字宽度,因而第i个第一候选分割点的分割点符合性越大;表示第i个第一候选分割点的第一像素点累加和,表示第i个第一候选分割点的第二像素累加和,反映了第i个候选分割点处投影像素点个数占第i-1个第一候选分割点与第i个第一候选分割点之间所有投影像素个数据比例,该值越接近1说明第i个第一候选分割点处的投影像素点个数越少,因而第i个第一候选分割点的分割点符合性越大。exp()表示以自然常数为底的指数函数,表示归一化函数,其归一化值为,本实施例利用softmax归一化方法进行归一化处理,其他实施例中实施者可根基实际选择。在较宽文字的两部件之间第一候选分割点相较于文字之间的第一候选分割点,其第一候选分割点处的投影像素个数较多,因而通过此计算出的分割点符合性较小;同时由于较宽文字每个部件的宽度较小,因而较宽文字的两部件之间的第一候选分割点与该文字的左侧/右侧第一候选分割点之间的距离与参考剧烈的差异较大,因而通过此计算出的分割点符合性较小。
3、根据分割点符合性得到第二候选分割点:
将大于第二预设阈值的第一候选分割点划分为第二候选分割点,本实施例中第二预设阈值取0.61,其他实施例中,实施者可根据实际设置。通过此可以排除较宽文字的部件之间分割点的干扰。
4、计算每个第二候选分割点的可能概率:
由于黏连文字之间存在一些干扰分割点,下面需对第二候选分割点进一步分析,来排除这些分割点的干扰得到准确的分割点。
由于投影直方图中统计像素个数为0的分割点为准确分割点的可能程度大,因此获取统计像素个数为0的第二候选分割点,将所选第二候选分割点构成的集合称为基准分割点集合,将基准分割点集合中每个元素称为基准分割点;
对于投影直方图,将各基准分割点与前一个位置的基准分割点之间的距离称为各基准分割点的基准距离,需要说明的是当基准分割点不存在前一个位置的基准分割点时,无需获取各基准分割点的基准距离;在所有基准分割点的基准距离中获取最小基准距离记为,该最小基准距离能够较为准确的反映书写文字的字宽情况。
对于投影直方图,将各第二候选分割点与前一个位置的第二候选分割点之间的距离称为各第二候选分割点的距离,获取所有第二候选分割点的距离均值记为参考相邻距离。
根据最小基准距离得到每个第二候选分割点的可能概率:
式中,表示第个第二候选分割点的可能概率,表示第i个第二候选分割点与前一个第二候选分割点之间的距离,表示最小基准距离,该值能够较为准确的反映书写文字的字宽情况,表示参考相邻距离,该值能够反映所有第二候选分割点的平均距离。表示第个第二候选分割点的距离与最小参考距离的差,由于正常书写的文字之间会存在一定的间隙,因此两个第二候选分割点之间的距离可能会大于实际字宽,因而反映了第i个第二候选分割点与第i-1个第二候选分割点之间存在的文字间隙。表示去除文字间隙后的参考相邻距离,即第i个第二候选分割点与第i-1个第二候选分割点之间的文字的实际宽度,表示第i个第二候选分割点的距离与去除文字间隙后的参考相邻距离之间的差值,该值越小,说明第i个第二候选分割点与第i-1个候选分割点之间的距离与实际字宽较为接近,因而第i个第二候选分割点的可能概率越大,表示以自然常数为底的指数函数,表示第i个第二候选分割点的可能概率。由于正常书写的文字之间会存在一定的间隙,而文字黏连时,文字之间不存在间隙。通过所有第二候选分割点得到的参考相邻距离会包含一定的文字间隙,因而为了防止这些间隙的干扰,因而将去除参考相邻距离中的文字间隙,即通过式子来去除中的间隙得到实际文字字宽,当第i个第二候选分割点为黏连文字分割点时,第i个第二候选分割点的距离应该与实际字宽相近,即越小时,第i个候选分割点为黏连文字之间准确分割点的可能性越大。
步骤S004,根据每个第二候选分割点的可能概率得到准确分割点,利用准确分割点得到教案图像的所有标准文字,根据所有标准文字获取教辅资料。
1、根据每个第二候选分割点的可能概率得到准确分割点:
在投影直方图的横坐标上获取左侧第一个点记为第一基准点;
根据第一基准点和最小基准距离得到准确分割点,包括:在投影直方图的横坐标上获取处于第一基准点右侧且与第一基准点间隔为的点记为第一边界点,在第一基准点到第一边界点之间的区域内获取所有第二候选分割点记为第一基准点的多个第二候选分割点,将第一基准点的多个第二候选分割点中选取的可能概率最大的第二候选分割点作为准确分割点;
将第一边界点作为第一基准点,重复执行,根据第一基准点和最小基准距离得到准确分割点操作,直至在投影直方图中无法获取第一边界点,得到多个准确分割点。
2、利用准确分割点对每行文字图像进行分割处理得到多个独立字图像:
以准确分割点所在列为分界线对每行文字图像进行分割处理得到多个独立字图像。
3、根据独立字图像完成教辅图书资源的匹配:
利用文字识别算法OCR对于每个独立字图像进行文字识别得到标准文字,利用教案图像中所有的标准文字中关键词作为索引在教辅图书资源库进行资源匹配得到与教案图像相符的教辅图像资源。
综上所述,本发明实施例提供了基于教辅图书内容增强的数字化编辑方法,在通过投影直方图中统计像素个数最少处的点作为分割点对文字进行分割时,会造成汉字的识别错误,因此根据直方图中像素点的分布特征以及文字特征来实现文字分割。因为投影直方图中得到的分割点是包含了所有准确的分割点,但同时会存在多余的错误分割点,因此在进行分割点的挑选时,根据文字之间的距离变化,结合投影直方图的变化得到每个分割点的可能程度,然后在确定准确的分割点。该方法能实现手写粘连文字的准确分割,避免汉字之间的分割错误,提高汉字的识别正确率,进而能够准确的进行汉字的识别与匹配。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.基于教辅图书内容增强的数字化编辑系统,其特征在于,所述系统包括:
数据采集模块、文字分割模块和教辅资源检索模块;
数据采集模块:采集得到教案图像;
文字分割模块:根据教案图像得到二值图像,根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,通过对每行文字图像的每列像素进行统计得到投影直方图;根据投影直方图中每个点的像素统计个数以及每个点与参考点的距离得到每个点为分割点的可能程度,将可能程度大于第一预设阈值的点划分为第一候选分割点得到多个第一候选分割点;
对所有第一候选分割点进行聚类分析得到多个聚类簇,根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,根据每个聚类簇、每个第一候选分割点的第一像素累加和、第二像素累加和以及两个相邻第一候选分割点之间距离得到每个第一候选分割点的分割点符合性;将分割点符合性大于第二预设阈值的第一候选分割点划分为第二候选分割点;根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,根据最小基准距离和参考相邻距离得到每个第二候选分割点的可能概率;
根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点;根据准确分割点和每行文字图像得到教案图像的所有标准文字;
教辅资源检索模块:利用教案图像的所有标准文字中的关键词进行教辅资源检索得到相应的教辅资料;
所述根据投影直方图中每个点的像素统计个数以及每个点与参考点的距离得到每个点为分割点的可能程度,包括的具体步骤为:
获取投影直方图中的所有谷点;将投影直方图中每个横坐标点称为每个点,将投影直方图中处于每个点左侧的最近谷点作为每个点的参考点;
投影直方图中第i个点为分割点的可能程度计算公式:
其中,表示在投影直方图中第i个点为分割点的可能程度,表示归一化函数,表示投影直方图中第个点处的像素统计个数,表示预设的最小文字宽度,表示投影直方图中第点到该点的参考点的距离,exp()表示以自然常数为底的指数函数;
所述根据每个聚类簇、每个第一候选分割点的第一像素累加和、第二像素累加和以及两个相邻第一候选分割点之间距离得到每个第一候选分割点的分割点符合性,包括的具体步骤为:
其中,表示第个第一候选分割点的分割点符合性,表示同一个聚类簇中第i个第一候选分割点与第i-1个第一候选分割点的距离,表示预设的最小文字宽度;表示第i个第一候选分割点的第一像素点累加和,表示第i个第一候选分割点的第二像素累加和,exp()表示以自然常数为底的指数函数,表示归一化函数;
所述根据第二候选分割点和投影直方图得到最小基准距离和参考相邻距离,包括的具体步骤为:
获得投影像素点个数为0的第二候选分割点,将所选的第二候选分割点构成的集合称为基准分割点集合,将基准分割点集合中每个元素称为基准分割点;
对于投影直方图,将各基准分割点与前一个位置的基准分割点之间的距离称为各基准分割点的基准距离,在所有基准分割点的基准距离中获取最小基准距离;
对于投影直方图,将各第二候选分割点与前一个位置的第二候选分割点之间的距离称为各第二候选分割点的距离,获取所有第二候选分割点的距离均值记为参考相邻距离;
所述根据每个聚类簇和投影直方图得到每个第一候选分割点的第一像素累加和、第二像素累加和,包括的具体步骤为:
基于同一聚类簇的第一候选分割点进行分析,将同一聚类簇中与第一候选分割点相邻的第一候选分割点记为相邻第一候选分割点;在投影直方图上获取不包含各第一候选分割点与前一个相邻第一候选分割点的情况时,前一个相邻第一候选分割点与各第一候选点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第一像素点累加和;在投影直方图上获取不包含前一个相邻第一候选分割点但包含各第一候选分割点的情况时,前一个相邻第一候选分割点与各第一候选分割点之间的所有点处的投影像素点个数的累加和记为各第一候选分割点的第二像素累加和。
2.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据文字高度、每行宽度对教案图像进行分割得到每行文字图像,包括的具体步骤为:
获取文字高度,获取教案图像的行宽,根据文字高度和教案图像的行宽设置预设矩形框的大小;
利用预设矩形框,以预设滑动步长,在教案图像上从上到下移动得到每行文字图像。
3.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述通过对每行文字图像的每列像素进行统计得到投影直方图,包括的具体步骤为:
对二值图像的每列的文字像素进行统计得到每列的统计像素个数,将所有列的统计像素个数按列次序进行排列得到每行文字的投影直方图。
4.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据最小基准距离和参考相邻距离得到每个第二候选分割点的可能概率,包括的具体步骤为:
第i个第二候选分割点的可能概率:
其中,表示第个第二候选分割点的可能概率,表示第i个第二候选分割点与前一个第二候选分割点之间的距离,表示最小基准距离,表示参考相邻距离,exp()表示以自然常数为底的指数函数。
5.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据每个第二候选分割点的可能概率和最小基准距离得到准确分割点,包括的具体步骤为:
在投影直方图的横坐标上获取左侧第一个点记为第一基准点;
根据第一基准点和最小基准距离mind得到准确分割点,包括:在投影直方图的横坐标上获取处于第一基准点右侧并且与第一基准点间隔为的点记为第一边界点,在第一基准点到第一边界点之间的区域内获取所有候选分割点记为第一基准点的多个候选分割点,将第一基准点的多个候选分割点中的可能概率最大的候选分割点作为准确分割点;
将第一边界点作为第一基准点,重复执行所述根据第一基准点和最小基准距离mind得到准确分割点的操作,直至在投影直方图的横坐标上无法获得第一边界点,得到多个准确分割点。
6.如权利要求1所述的基于教辅图书内容增强的数字化编辑系统,其特征在于,所述根据准确分割点和每行文字图像得到教案图像的所有标准文字,包括的具体步骤为:
以准确分割点所在列为分界线对每行文字图像进行分割处理得到多个独立字图像,利用文字识别算法OCR对于每个独立字图像进行文字识别得到标准文字,教案图像的所有行文字图像得到标准文字作为教案图像的所有标准。
CN202310246055.XA 2023-03-15 2023-03-15 基于教辅图书内容增强的数字化编辑系统 Active CN115953785B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310246055.XA CN115953785B (zh) 2023-03-15 2023-03-15 基于教辅图书内容增强的数字化编辑系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310246055.XA CN115953785B (zh) 2023-03-15 2023-03-15 基于教辅图书内容增强的数字化编辑系统

Publications (2)

Publication Number Publication Date
CN115953785A CN115953785A (zh) 2023-04-11
CN115953785B true CN115953785B (zh) 2023-05-16

Family

ID=85907052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310246055.XA Active CN115953785B (zh) 2023-03-15 2023-03-15 基于教辅图书内容增强的数字化编辑系统

Country Status (1)

Country Link
CN (1) CN115953785B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN110516674A (zh) * 2019-09-04 2019-11-29 中国地质调查局西安地质调查中心 一种文本图像的手写汉字分割方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305795A (ja) * 1995-04-28 1996-11-22 Nippon Steel Corp 文字認識方法
AUPS020302A0 (en) * 2002-01-31 2002-02-21 Silverbrook Research Pty. Ltd. Methods and systems (npw007)
US7903877B2 (en) * 2007-03-06 2011-03-08 Microsoft Corporation Radical-based HMM modeling for handwritten East Asian characters
CN108921031A (zh) * 2018-06-04 2018-11-30 平安科技(深圳)有限公司 汉字模型训练方法、手写字识别方法、装置、设备及介质
CN111507356A (zh) * 2020-04-20 2020-08-07 恒银金融科技股份有限公司 一种金融票据小写金额手写字符的分割方法
CN113723413B (zh) * 2021-08-01 2024-03-08 北京工业大学 一种基于贪吃蛇的手写中文文本切分方法
CN115082934B (zh) * 2022-07-04 2023-12-29 蒋锋 一种金融票据中手写汉字分割识别方法
CN115171124B (zh) * 2022-09-07 2022-11-11 江苏巨信众汇数字科技有限公司 用于手写汉字识别的文本分割方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN110516674A (zh) * 2019-09-04 2019-11-29 中国地质调查局西安地质调查中心 一种文本图像的手写汉字分割方法及系统

Also Published As

Publication number Publication date
CN115953785A (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
CN111325203B (zh) 一种基于图像校正的美式车牌识别方法及系统
CN106156761B (zh) 面向移动终端拍摄的图像表格检测与识别方法
WO2019232853A1 (zh) 中文模型训练、中文图像识别方法、装置、设备及介质
CN110032938B (zh) 一种藏文识别方法、装置及电子设备
CN110598686B (zh) 发票的识别方法、系统、电子设备和介质
CN113158808B (zh) 中文古籍字符识别、组段与版面重建方法、介质和设备
CN104573688A (zh) 基于深度学习的移动平台烟草激光码智能识别方法及装置
WO2021042505A1 (zh) 基于文字识别技术的笔记生成方法、装置和计算机设备
CN111783757A (zh) 一种基于ocr技术的复杂场景下身份证识别方法
CN115082934B (zh) 一种金融票据中手写汉字分割识别方法
CN111914698A (zh) 图像中人体的分割方法、分割系统、电子设备及存储介质
CN112052852A (zh) 一种基于深度学习的手写气象档案资料的字符识别方法
Chamchong et al. Character segmentation from ancient palm leaf manuscripts in Thailand
CN113033558B (zh) 一种用于自然场景的文本检测方法及装置、存储介质
CN116030396B (zh) 一种用于视频结构化提取的精确分割方法
Gupta et al. Automatic assessment of OCR quality in historical documents
CN111368632A (zh) 一种签名识别方法及设备
CN114038004A (zh) 一种证件信息提取方法、装置、设备及存储介质
CN110991374B (zh) 一种基于rcnn的指纹奇异点检测方法
CN110443235B (zh) 一种智能纸质试卷总分识别方法及系统
CN111507356A (zh) 一种金融票据小写金额手写字符的分割方法
WO2022121021A1 (zh) 一种身份证号码检测方法、装置、可读存储介质和终端
CN112560856B (zh) 车牌检测识别方法、装置、设备及存储介质
CN115953785B (zh) 基于教辅图书内容增强的数字化编辑系统
CN117076455A (zh) 一种基于智能识别的保单结构化存储方法、介质及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Digital Editing System Based on Content Enhancement of Teaching Aid Books

Effective date of registration: 20231026

Granted publication date: 20230516

Pledgee: Liangshan County sub branch of Postal Savings Bank of China Ltd.

Pledgor: Shandong Xinghuo Book Co.,Ltd.

Registration number: Y2023980062950