CN112446262A - 文本分析方法、装置、终端和计算机可读存储介质 - Google Patents

文本分析方法、装置、终端和计算机可读存储介质 Download PDF

Info

Publication number
CN112446262A
CN112446262A CN201910824902.XA CN201910824902A CN112446262A CN 112446262 A CN112446262 A CN 112446262A CN 201910824902 A CN201910824902 A CN 201910824902A CN 112446262 A CN112446262 A CN 112446262A
Authority
CN
China
Prior art keywords
text
characters
text image
image
text analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910824902.XA
Other languages
English (en)
Inventor
贺涛
曾志辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE ICT Technologies Co Ltd
Original Assignee
ZTE ICT Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE ICT Technologies Co Ltd filed Critical ZTE ICT Technologies Co Ltd
Priority to CN201910824902.XA priority Critical patent/CN112446262A/zh
Publication of CN112446262A publication Critical patent/CN112446262A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种文本分析方法、装置、终端和计算机可读存储介质,其中,文本分析方法包括:对文本图像进行水平投影和垂直投影,生成水平投影数据和垂直投影数据,根据水平投影数据和垂直投影数据确定字符的位置信息;根据位置信息识别字符,根据识别结果统计出文本图像中的文字个数。通过本发明的技术方案能够准确定位文本图像中的各个字符,根据字符的位置进行对字符进行识别和统计,字数统计结果准确度高,抗干扰能力强。

Description

文本分析方法、装置、终端和计算机可读存储介质
技术领域
本发明涉及图像处理领域,具体而言,涉及一种文本分析方法、一种文本分析装置、一种终端和一种计算机可读存储介质。
背景技术
人工智能相关技术在各个领域中的应用越来越广泛,在教育领域中,学生考试成绩分析系统能有效提取学生考试题目和老师的批改信息智能化的完成学生考试试卷的分析,自动生成反应出学生个人学习情况的用户画像。最终输出学生学习考试情况分析报告,帮助学生、老师以及家长提升学生成绩。语文作为初中以及高中重要考试科目,其中的作文的分数占总分比例相对较大,因而对作文答题情况的详细分析也是很有必要的。学生写作字数是否达标是考试中评分的一个基本要求。如何在学生考试成绩分析系统中完成字数自动统计任务,成为亟待解决的技术问题。
另外,整个说明书对背景技术的任何讨论,并不代表该背景技术一定是所属领域技术人员所知晓的现有技术,整个说明书中的对现有技术的任何讨论并不代表该现有技术一定是广泛公知的或一定构成本领域的公知常识。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提出了一种文本分析方法。
本发明的另一个目的在于提出了一种文本分析装置。
本发明的又一个目的在于提出了一种终端。
本发明的又一个目的在于提出了一种计算机可读存储介质。
在本发明的第一方面的技术方案中,提出了一种文本分析方法,包括:对文本图像进行水平投影和垂直投影,生成水平投影数据和垂直投影数据,其中,文本包含多个字符,字符包括文字和/或限定文字位置的线段;根据水平投影数据确定文本图像中的文本在水平方向上的坐标区域,以及根据垂直投影数据确定文本图像中的文本在垂直方向上的坐标区域,其中,水平方向上的坐标区域对应字符的上边界和下边界,垂直方向上的坐标区域对应字符的左边界和右边界,根据上边界、下边界、左边界和右边界确定字符的位置信息;根据位置信息识别字符,根据识别结果统计出文本图像中的文字个数。
在该技术方案中,通过对文本图像进行水平投影和垂直投影,确定文本图像中的字符或者字符的框线的坐标,从而完成字符定位,根据字符定位对每个字符进行分析,进而确定文本图像的文字个数。相较于传统的文字识别方法,本申请基于投影数据确定字符的位置,根据字符位置进行文字识别,在扫描图像质量较差的情况下依旧能够保持较高的文字识别率,具有较高的识别准确度。此外,根据投影结果确定每个字符的位置后,将文本图像拆分为多个子图进行识别,能够最大程度地降低干扰信息对文字识别过程的干扰,提高识别效率和准确度。
另外,根据本发明上述实施例的文本分析方法,还可以具有如下附加的技术特征:
在上述任一技术方案中,可选地,根据位置信息识别字符,根据识别结果统计出文本图像中的文字个数,具体包括:计算出文本图像的像素值均值;根据字符的位置信息确定文本框,计算出文本框内的像素值均值;根据文本图像的像素值均值以及文本框内的像素值均值,确定文本框内包含文字,记录文字个数。
在该技术方案中,检测文本图像的像素值均值,根据文本图像的像素值均值设定像素阈值,再对每个文本框的像素值均值进行检测,若文本框的均值大于像素阈值,说明该文本框中含有文字。此外,还能够通过检测文本框中黑色目标的面积与设定阈值做比较来确定文本框中是否含有文字。对每个文本框进行像素值检测以确定文本框中是否含有文字,提高文字个数统计的准确度。
在上述任一技术方案中,可选地,还包括:根据颜色定位文本图像中的干扰信息并删除干扰信息。
在该技术方案中,干扰信息一般会与文本重叠,影响文字个数统计结果,通过颜色信息准确提取干扰信息并进行删除,能够提升文字个数统计准确度。
在上述任一技术方案中,可选地,干扰信息为叠加在文本上的批改痕迹,则根据颜色定位文本图像中的干扰信息并删除干扰信息,具体包括:
根据批改痕迹的颜色在文本图像中识别出批改痕迹,读取批改笔迹的轮廓,将轮廓的内部填充为白色。
在该技术方案中,对文本图像颜色空间进行转换,切换到HSV颜色空间中,以提取出批改痕迹,使用白色像素覆盖干扰信息,提高文字个数统计准确度。此外,也可以通过估计轮廓临近像素值的方法填充,以删除干扰信息。
在上述任一技术方案中,可选地,还包括:根据文本图像中的定位标记进行倾斜校正;或者根据文本图像中的直线线段的方向进行倾斜校正。
在该技术方案中,文本图像倾斜会影响投影结果,根据定位标记(定位块)校正图像消除倾斜,或者根据文本图像中的直线段的方向进行方向校正以调整图像姿态,有利于后续的位置信息获取,使其识别效率有了较大提升。
在上述任一技术方案中,可选地,还包括:检测文本图像中的空白区域;根据空白区域分割文本图像,以确定文本图像的版面,其中,文本图像包括一个或多个版面。
在该技术方案中,根据文本图像中的空白区域确定版面,对于具有多版面的文本图像具有更好的识别效果,将文本图像分割为多个版面进行识别也有助于提升识别效率。
在上述任一技术方案中,可选地,统计出文本图像中的文字个数,具体包括:根据文本的段落书写规范、题目书写规范和标点符号情况优化统计过程,具体优化步骤包括一下任一项或其组合:默认每段文字的首行前两格为空;默认段落最后一行未被填满的情况下会存在空白格;默认文本题目在第一版面的第一行;默认文本最后一行之后的位置为空白行;标点符号计算在文字总数中或标点符合不视为文字。
在该技术方案中,通过多种预设步骤减少不必要的识别步骤,提升了字数统计的准确度。
在本发明的第二方面的技术方案中,提出了一种文本分析装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的程序,程序被处理器执行时实现如上述任一项技术方案的文本分析方法的步骤。该文本分析装置包括如上述任一项技术方案的文本分析方法的全部有益效果,在此不再赘述。
在本发明的第三方面的技术方案中,提出了一种终端,包括:上述第二方面技术方案所述的文本分析装置。该终端包括如上述任一项技术方案的文本分析方法的全部有益效果,在此不再赘述。
在本发明的第四方面的技术方案中,提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时,实现如上述任一项技术方案所述的文本分析方法的步骤。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了根据本发明的一个实施例的文本分析方法的流程示意图;
图2示出了根据本发明的另一个实施例的文本分析方法的流程示意图;
图3示出了根据本发明的一个实施例的文本分析方法的考试试卷扫描图片;
图4示出了根据本发明的一个实施例的文本分析方法的去除红笔痕迹的前后对比图;
图5示出了根据本发明的一个实施例的文本分析方法的版面切割结果;
图6示出了根据本发明的一个实施例的文本分析方法的水平投影可视化结果图;
图7示出了根据本发明的一个实施例的文本分析方法的垂直投影可视化结果图;
图8示出了根据本发明的一个实施例的文本分析方法的简化水平投影示意图;
图9示出了根据本发明的一个实施例的文本分析方法的简化垂直投影示意图;
图10示出了根据本发明的一个实施例的文本分析方法的文本框识别结果示意图;
图11示出了根据本发明的一个实施例的文本分析装置的示意框图;
图12示出了根据本发明的一个实施例的终端示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
如图1所示,根据本发明的一个实施例的文本分析方法,包括:步骤S102,对文本图像进行水平投影和垂直投影,生成水平投影数据和垂直投影数据,其中,文本包含多个字符,字符包括文字和/或限定文字位置的线段;步骤S104,根据水平投影数据确定文本图像中的文本在水平方向上的坐标区域,以及根据垂直投影数据确定文本图像中的文本在垂直方向上的坐标区域,其中,水平方向上的坐标区域对应字符的上边界和下边界,垂直方向上的坐标区域对应字符的左边界和右边界,根据上边界、下边界、左边界和右边界确定字符的位置信息;步骤S106,根据位置信息识别字符,根据识别结果统计出文本图像中的文字个数。
在该实施例中,通过对文本图像进行水平投影和垂直投影,确定文本图像中的字符或者字符的框线的坐标,从而完成字符定位,根据字符定位对每个字符进行分析,进而确定文本图像的文字个数。相较于传统的文字识别方法,本申请基于投影数据确定字符的位置,根据字符位置进行文字识别,在扫描图像质量较差的情况下依旧能够保持较高的文字识别率,具有较高的识别准确度。此外,根据投影结果确定每个字符的位置后,将文本图像拆分为多个子图进行识别,能够最大程度地降低干扰信息对文字识别过程的干扰,提高识别效率和准确度。
根据上述实施例的文本分析方法,可选地,步骤S106具体包括:计算出文本图像的像素值均值;根据字符的位置信息确定文本框,计算出文本框内的像素值均值;根据文本图像的像素值均值以及文本框内的像素值均值,确定文本框内包含文字,记录文字个数。
在该实施例中,检测文本图像的像素值均值,根据文本图像的像素值均值设定像素阈值,再对每个文本框的像素值均值进行检测,若文本框的均值大于像素阈值,说明该文本框中含有文字。此外,还能够通过检测文本框中黑色目标的面积与设定阈值做比较来确定文本框中是否含有文字。对每个文本框进行像素值检测以确定文本框中是否含有文字,提高文字个数统计的准确度。
根据上述任一个实施例的文本分析方法,可选地,还包括:根据颜色定位文本图像中的干扰信息并删除干扰信息。
在该实施例中,干扰信息一般会与文本重叠,影响文字个数统计结果,通过颜色信息准确提取干扰信息并进行删除,能够提升文字个数统计准确度。
根据上述任一个实施例的文本分析方法,可选地,干扰信息为叠加在文本上的批改痕迹,则根据颜色定位文本图像中的干扰信息并删除干扰信息,具体包括:根据批改痕迹的颜色在文本图像中识别出批改痕迹,读取批改笔迹的轮廓,将轮廓的内部填充为白色。
在该实施例中,对文本图像颜色空间进行转换,切换到HSV颜色空间中,以提取出批改痕迹,使用白色像素覆盖干扰信息,提高文字个数统计准确度。此外,也可以通过估计轮廓临近像素值的方法填充,以删除干扰信息。
根据上述任一个实施例的文本分析方法,可选地,还包括:根据文本图像中的定位标记进行倾斜校正;或者根据文本图像中的直线线段的方向进行倾斜校正。
在该实施例中,文本图像倾斜会影响投影结果,根据定位标记(定位块)校正图像消除倾斜,或者根据文本图像中的直线段的方向进行方向校正以调整图像姿态,有利于后续的位置信息获取,使其识别效率有了较大提升。
根据上述任一个实施例的文本分析方法,可选地,还包括:检测文本图像中的空白区域;根据空白区域分割文本图像,以确定文本图像的版面,其中,文本图像包括一个或多个版面。
在该实施例中,根据文本图像中的空白区域确定版面,对于具有多版面的文本图像具有更好的识别效果,将文本图像分割为多个版面进行识别也有助于提升识别效率。
根据上述任一个实施例的文本分析方法,可选地,统计出文本图像中的文字个数,具体包括:根据文本的段落书写规范、题目书写规范和标点符号情况优化统计过程,具体优化步骤包括一下任一项或其组合:默认每段文字的首行前两格为空;默认段落最后一行未被填满的情况下会存在空白格;默认文本题目在第一版面的第一行;默认文本最后一行之后的位置为空白行;标点符号计算在文字总数中或标点符合不视为文字。通过多种预设步骤减少不必要的识别步骤,提升了字数统计的准确度。
实施例二
如图2所示,根据本发明的另一个实施例的文本分析方法,实际应用在语文考试试卷作文字数统计中,主要步骤包括:步骤S202,输入考试试卷扫描图片;步骤S204,去除红笔批改痕迹;步骤S206,图片版面切割;步骤S208,投影检测图片中文字框位置;步骤S210,对文本进行字数统计;步骤S212,生成字数统计结果。
下面结合图3至图10对作文字数统计的流程进行具体说明:
1.获取学生语文考试试卷的扫描图片,该图片是学生考试之后(经过老师红笔批改或者没批改)的试卷经扫描仪扫描后保存的彩色图片。如图3所示,为老师批改之后的扫描原始图片。
2.在上述图3试卷中存在老师红笔的批改痕迹,为了去除批改痕迹在后续字数统计过程中的影响,因而需要对红笔痕迹进行删除。在具体实施过程中该过程的基本技术执行步骤是:变换颜色空间至HSV;(HSV是图像处理中的一种像素值表示方法,图3中的原始图像是RGB颜色空间);定位红色区域,找到红色笔记轮廓;使用轮廓值将原始图片图3中的对应位置的红色笔记内容填充为白色像素值。最终结果如图4所示:图4示出了去除红笔痕迹区域前后对比,其中,402为去除红笔痕迹之前的图像,404为去除红笔痕迹之后的图像。
3.将图片进行一些预处理(预处理方法为包括图像均值滤波,倾斜校正等,是图像处理技术中较为常用的方法),然后使用垂直投影的方式找到空白分割区域,对去除了红色笔记后的图像进行版面切割。切割后结果如图5所示,图片被分为3个小版面(part1、part2和part3)。
4.经过上述步骤3的图片切割处理,将上述图片依次进行目标文字框检测,检测文字框位置的过程可分解为如下多个步骤:
(1)对各个小版面图片进行水平投影,得到投影结果如图6所示。
(2)对各个小版面图片进行垂直投影,得到投影结果如下图7所示。
(3)对上述步骤(1)和(2)的投影结果进行优化,图8为对水平投影结果的优化,图9为对垂直投影结果的优化。
(4)上述图8和图9分别是水平方向和垂直方向上直线框位置坐标结果,我们使用统计并根据文本框阈值范围,准确定位到文本行和文本列的位置。
(5)根据上述步骤(4)能有效找出所有文本框的位置,所有作文格被识别出(参见图10)。其中,图10中各个作文格即为文本框,文本框与框内的文字统称为字符,每个作文格均被标记。
5.根据上述步骤4找到的文字坐标信息以及预处理之后各个小模块的图像数据找到文字区域。并包含多个步骤,具体如下:
(1)计算分别计算各个小模块的像素值均值。
(2)根据上述步骤4中的坐标位置,判断各个文字框中是否包含手写文字。
(3)统计手写文字的个数。结果可视化结果图像类似于下图12所示,其中绿色框为检测到的包含手写文字的框坐标。蓝色为空白的文字框或者标点符号以及部分的误检结果。该结果以数组方式保存,数组为二维矩阵,假设数组为A,则其中数组A的行即是文本的一行,每一行包含N个元素,N为每一行作文表格方格的数量,每个元素两种信息,具体包括文字的位置坐标(x1,x2,y1,y2)以及是否为文字的标签(True或者False)。
(4)根据上述中文书写习惯对每行的统计结果进行优化。根据下面所述的三条基本规则,进一步优化数组A的结果,对误检以及标点符号进行字数统计结果的修正,得到修正后的数组B,统计最终作文总字数。优化方法以及原则包括:
①段落书写规则:作文出题目以外一般都遵守每段文字首行空两格。每段段落的最后一行如果没有写满则可能存在空白格,此时。
②题目书写规则:题目一般写在文章的开头,即在第一版面的第一行。
③标点符号一般算在作文字数内。
④文章末尾行之后所有行都为空白行。
在该实施例中,上述技术方案为最佳方法,该方案的基本步骤不变。但具体实现细节有很多可以变化的部分:
其一,在上述步骤2中,去除红笔痕迹本申请中直接采用将红笔痕迹填充白色的处理方式,其实也可以通过估计临近像素值的方法填充。但这种填充方式对结果影响并不明显,且增加了计算量。
其二,在步骤三的预处理过程中,进行图像预处理方法根据实际扫描图像质量以及图片中的特征有不同的实施方案,本申请中使用的是直线检测方案进行倾斜校正,使用的是自动阈值分割的方法进行图像的二值化分割处理。其实在本申请的图例中试卷图片的4个角上有矩形的黑色定位标记可以辅助校正图片方向,设置标志位置也是不少物体定位校正中常用的方法。但本申请考虑到有些试卷中并没有这种标注位,因而不采用这种图像倾斜校正的方式,而是采用直线检测的方式(语文考试试卷中文本框是一定包含直线段的),通过直线的方向校正图像的方向。这种方法更具鲁棒性。
其三,上述步骤4准确定位到各个文字手写矩形框的位置。
其四,上述步骤5包括两部分内容:
第一,计算文字框中是否有文字:本申请是使用的计算均值的算法执行的。分别计算图像均值和文字框内像素值的均值,二者做对比得出最终结果。其变形方案可能还包括两种:
①将小模块图像二值化,根据文本框位置坐标和小模块二值化图,计算其中各个文字框中黑色像素点的个数,设置像素点个数的阈值M,黑色像素点个数大于M个则该矩形框为文字框,标签属性为True,否则标签属性为False;
②将小模块图像二值化,根据文本框位置坐标和小模块二值化图截取文字框内区域,计算框内黑色目标面积Sn,设置阈值S,如果Sn≥S,则该矩形框为文字框且标签属性为True,否则标签属性为False。
第二,字数统计时如何优化,加快运行速度:在本申请中根据上述步骤5.3中列出的规则进行的计算。在具体执行中各个条件的应用有不同选择方法,如其中原则:文章末尾行之后所有行都为空白行。在具体应用该原则的过程中,本申请统计到字不为零的最后一行之后的3行字数均为0,就可以确认作文写作结束并结束字数统计过程,而不需要统计全部空白结果行。
实施例三
如图11所示,根据本发明的一个实施例的文本分析装置300,包括:存储器302、处理器304及存储在存储器302上并可在处理器304上运行的程序,程序被处理器304执行时实现如上述任一实施例的文本分析方法的步骤。该文本分析装置300包括如上述任一项实施例的文本分析方法的全部有益效果,在此不再赘述。
实施例四
如图12所示,根据本发明的一个实施例的终端400,包括:实施例三所述的文本分析装置300。该终端400运行时能够实现:对答题卡图像进行文本识别,获取文本内容信息以及文本位置信息;根据文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域;基于深度学习模型对字符串所处的区域进行识别,以获取字符串。该终端400包括如上述任一实施例的文本分析方法的全部有益效果,在此不再赘述。
实施例五
根据本发明的一个实施例,还提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被执行时实现上述任一实施例限定的文本分析方法。
针对现有技术中存在的技术问题,本发明提出了一种文本分析方法、装置和计算机可读存储介质,利用文本识别技术,获取答题卡中目标字符串的位置信息,而不需要定位块进行定位,能够兼容各种形式的答题卡,对存在目标字符串的图像区域进行水平投影和垂直投影,获取每个字符串中每个字符的位置从而进行精确识别,抗干扰能力强,识别率高。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种文本分析方法,其特征在于,包括:
对文本图像进行水平投影和垂直投影,生成水平投影数据和垂直投影数据,其中,所述文本包含多个字符,所述字符包括文字和/或限定所述文字位置的线段;
根据所述水平投影数据确定所述文本图像中的文本在水平方向上的坐标区域,以及根据所述垂直投影数据确定所述文本图像中的文本在垂直方向上的坐标区域,其中,所述水平方向上的坐标区域对应所述字符的上边界和下边界,所述垂直方向上的坐标区域对应所述字符的左边界和右边界,根据所述上边界、所述下边界、所述左边界和所述右边界确定所述字符的位置信息;
根据所述位置信息识别所述字符,根据识别结果统计出所述文本图像中的文字个数。
2.根据权利要求1所述的文本分析方法,其特征在于,所述根据所述位置信息识别所述字符,根据识别结果统计出所述文本图像中的文字个数,具体包括:
计算出所述文本图像的像素值均值;
根据所述字符的位置信息确定文本框,计算出文本框内的像素值均值;
根据所述文本图像的像素值均值以及所述文本框内的像素值均值,确定所述文本框内包含文字,记录文字个数。
3.根据权利要求1所述的文本分析方法,其特征在于,还包括:
根据颜色定位所述文本图像中的干扰信息并删除所述干扰信息。
4.根据权利要求3所述的文本分析方法,其特征在于,所述干扰信息为叠加在文本上的批改痕迹,则所述根据颜色定位所述文本图像中的干扰信息并删除所述干扰信息,具体包括:
根据所述批改痕迹的颜色在所述文本图像中识别出所述批改痕迹,读取所述批改笔迹的轮廓,将所述轮廓的内部填充为白色。
5.根据权利要求1至4中任一项所述的文本分析方法,其特征在于,还包括:
根据所述文本图像中的定位标记进行倾斜校正;或者
根据所述文本图像中的直线线段的方向进行倾斜校正。
6.根据权利要求1至4中任一项所述的文本分析方法,其特征在于,还包括:
检测所述文本图像中的空白区域;
根据所述空白区域分割所述文本图像,以确定所述文本图像的版面,其中,所述文本图像包括一个或多个版面。
7.根据权利要求1至4中任一项所述的文本分析方法,其特征在于,所述统计出所述文本图像中的文字个数,具体包括:
根据文本的段落书写规范、题目书写规范和标点符号情况优化统计过程,具体优化步骤包括一下任一项或其组合:
默认每段文字的首行前两格为空;
默认段落最后一行未被填满的情况下会存在空白格;
默认文本题目在第一版面的第一行;
默认文本最后一行之后的位置为空白行;
标点符号计算在文字总数中或标点符合不视为文字。
8.一种文本分析装置,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时能够实现如权利要求1至7中任一项所述的文本分析方法限定的步骤。
9.一种终端,其特征在于,包括:
如权利要求8所述的文本分析装置。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时,实现如权利要求1至7中任一项所述的文本分析方法的步骤。
CN201910824902.XA 2019-09-02 2019-09-02 文本分析方法、装置、终端和计算机可读存储介质 Pending CN112446262A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910824902.XA CN112446262A (zh) 2019-09-02 2019-09-02 文本分析方法、装置、终端和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910824902.XA CN112446262A (zh) 2019-09-02 2019-09-02 文本分析方法、装置、终端和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112446262A true CN112446262A (zh) 2021-03-05

Family

ID=74734225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910824902.XA Pending CN112446262A (zh) 2019-09-02 2019-09-02 文本分析方法、装置、终端和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112446262A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949649A (zh) * 2021-05-12 2021-06-11 北京世纪好未来教育科技有限公司 一种文本图像的识别方法、装置及计算设备
CN112966678A (zh) * 2021-03-11 2021-06-15 南昌航空大学 一种文本检测方法及系统
CN113516009A (zh) * 2021-04-07 2021-10-19 山东理工大学 一种输电线路图像水印影响的消除方法
CN113642573A (zh) * 2021-07-20 2021-11-12 南京红松信息技术有限公司 一种基于栅格的图片分离方法
CN113971805A (zh) * 2021-12-22 2022-01-25 深圳市迪博企业风险管理技术有限公司 一种结合机器视觉和语义分析的智能阅卷评分方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693533A (zh) * 2012-03-12 2012-09-26 清华大学 一种医学数字图像拼接方法
CN105608074A (zh) * 2016-01-15 2016-05-25 中译语通科技(北京)有限公司 一种字数统计方法及装置
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN108229303A (zh) * 2017-11-14 2018-06-29 北京市商汤科技开发有限公司 检测识别和检测识别网络的训练方法及装置、设备、介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693533A (zh) * 2012-03-12 2012-09-26 清华大学 一种医学数字图像拼接方法
CN105608074A (zh) * 2016-01-15 2016-05-25 中译语通科技(北京)有限公司 一种字数统计方法及装置
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN108229303A (zh) * 2017-11-14 2018-06-29 北京市商汤科技开发有限公司 检测识别和检测识别网络的训练方法及装置、设备、介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966678A (zh) * 2021-03-11 2021-06-15 南昌航空大学 一种文本检测方法及系统
CN113516009A (zh) * 2021-04-07 2021-10-19 山东理工大学 一种输电线路图像水印影响的消除方法
CN112949649A (zh) * 2021-05-12 2021-06-11 北京世纪好未来教育科技有限公司 一种文本图像的识别方法、装置及计算设备
CN112949649B (zh) * 2021-05-12 2021-09-03 北京世纪好未来教育科技有限公司 一种文本图像的识别方法、装置及计算设备
CN113642573A (zh) * 2021-07-20 2021-11-12 南京红松信息技术有限公司 一种基于栅格的图片分离方法
CN113642573B (zh) * 2021-07-20 2023-10-13 南京红松信息技术有限公司 一种基于栅格的图片分离方法
CN113971805A (zh) * 2021-12-22 2022-01-25 深圳市迪博企业风险管理技术有限公司 一种结合机器视觉和语义分析的智能阅卷评分方法

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
CN108171297B (zh) 一种答题卡识别方法
CN112446262A (zh) 文本分析方法、装置、终端和计算机可读存储介质
CN111507251B (zh) 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质
CN106980857B (zh) 一种基于碑帖的毛笔字分割识别方法
CN108235115B (zh) 一种歌曲视频中人声区域定位的方法及终端
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN112507758A (zh) 答题卡字符串识别方法、装置、终端和计算机存储介质
CN110414563A (zh) 考试成绩统计方法、系统及计算机可读存储介质
CN112446259A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN110929727A (zh) 图像标注方法及装置、文字检测方法及系统、电子设备
CN110458014A (zh) 答题卡识读方法、装置和计算机可读存储介质
CN111814576A (zh) 一种基于深度学习的购物小票图片识别方法
CN110135407B (zh) 样本标注方法及计算机存储介质
CN111126266B (zh) 文本处理方法、文本处理系统、设备及介质
CN111626145A (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
CN114241492A (zh) 一种识别作文稿纸的手写文本识别并复现文本结构的方法
CN110705442A (zh) 一种试卷答案自动获取方法、终端设备及存储介质
CN109284702B (zh) 一种基于图像模式的答题卷给分及阅卷系统
CN111008594A (zh) 改错题评阅方法、相关设备及可读存储介质
CN112084103B (zh) 界面测试方法、装置、设备和介质
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
CN108062548B (zh) 一种盲文方自适应定位方法及系统
CN110298236A (zh) 一种基于深度学习的盲文图像自动识别方法和系统
CN114241486A (zh) 一种提高识别试卷学生信息准确率的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination