CN110728687A - 文件图像分割方法、装置、计算机设备和存储介质 - Google Patents

文件图像分割方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110728687A
CN110728687A CN201910977072.4A CN201910977072A CN110728687A CN 110728687 A CN110728687 A CN 110728687A CN 201910977072 A CN201910977072 A CN 201910977072A CN 110728687 A CN110728687 A CN 110728687A
Authority
CN
China
Prior art keywords
image
file
segmentation
analyzed
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910977072.4A
Other languages
English (en)
Other versions
CN110728687B (zh
Inventor
龚泽熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Original Assignee
Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuo Erzhi Lian Wuhan Research Institute Co Ltd filed Critical Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Priority to CN201910977072.4A priority Critical patent/CN110728687B/zh
Publication of CN110728687A publication Critical patent/CN110728687A/zh
Application granted granted Critical
Publication of CN110728687B publication Critical patent/CN110728687B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

本申请涉及一种文件图像分割方法、装置、计算机设备和存储介质,包括:对文件图像进行图像二值化处理和垂直方向投影,得到垂直直方图,根据垂直直方图的波谷的坐标和坐标对应的起始字符信息,确定分割点,根据分割点将文件图像分割成区域图像,并得到预设二维坐标系下坐标与区域图像的分割关系。上述过程,通过确定好的分割点即能高效地完成图像的分割,省去大量的识别操作,并且,在后续的图像处理过程中,能够根据预设二维坐标系下坐标与区域图像的分割关系,即能快速地将图像分割成多个区域图像,提高了文件图像分割的效率。

Description

文件图像分割方法、装置、计算机设备和存储介质
技术领域
本申请涉及机器视觉领域,特别是涉及文件图像分割方法、装置、计算机设备和存储介质。
背景技术
文件图像分割为图像分析中的一种,文件图像分割更侧重于研究图像的内容,包括但不局限于使用图像处理的各种技术,它更倾向于对图像内容的分析、解释和识别。文件图像分割在计算机视觉领域,也得到了越来越广泛的应用。
现有的文件图像分割方法,或是通过目标字符对象之间的相对位置关系来分割出包含字符对象的图像,进一步得到分析内容,或是通过特定的标识符进行图像分割,基于分割之后的图像区域,通过特定标识进行内容分析,如自动阅卷方法,要实现试卷内容的分割和分割区域的数据分析,需要对试卷中不同类型的数据和进行标记,例如,将数字、字母和符号等均采用不同的标识,以便于数据的识的分割及分析,计算机在对标识字符进行识别时,需要执行大量的识别操作,对计算机硬件消耗较大,在进行大量的图像内容分割及分析时,处理效率较低。
发明内容
基于此,有必要针对现有的文件图像分割方法处理效率较低的问题,提供一种高效的文件图像分割方法、装置、计算机设备和存储介质。
一种文件图像分割方法,方法包括:
获取文件图像;
对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;
记录垂直直方图的波谷在预设二维坐标系中对应的坐标信息;
识别坐标信息对应文件图像中的起始字符信息,若起始字符信息为目标类型信息,则保留坐标信息对应的分割点;
根据分割点将文件图像分割成多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系。
在其中一个实施例中,获取文件图像包括:
获取初始文件图像;
根据初始文件图像的文件数据,将初始文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到文件图像。
在其中一个实施例中,对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图包括:
将文件图像转换为HSV(Hue,Saturation,Value)域图像;
采用Yen算法,计算HSV域图像中V通道的门限值;
根据V通道的门限值,调整黑色像素阈值范围;
基于调整后的黑色像素阈值范围,得到二值化图像;
对二值化图像进行垂直方向投影,得到对应的垂直直方图。
在其中一个实施例中,根据分割点将文件图像分割成多个区域图像之后,还包括:
采用光学字符识别技术,将区域图像携带的文字信息转化为文本字符;
对文本字符进行标注、分割以及关键词提取,得到区域图像对应的提取信息。
在其中一个实施例中,根据分割点将文件图像分割成多个区域图像之后,还包括:
获取待分析文件图像;
根据待分析文件图像的文件数据,将待分析文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到分割重组后的待分析文件图像;
将分割重组后的待分析文件图像映射到预设坐标系中、并根据预设坐标系下的坐标与区域图像的分割关系,将分割重组后的待分析文件图像分割为多个待分析区域图像;
识别待分析区域图像的符号标记,若符号标记为目标符号标记类型时,则提取待分析区域图像的信息。
在其中一个实施例中,提取待分析区域图像的信息包括:
采用光学字符识别技术,将待分析区域图像携带的文字信息转换为文本字符;
根据区域图像对应的提取信息,提取出待分析区域图像的对应的文本字符。
在其中一个实施例中,将分割重组后的待分析文件图像映射到预设坐标系中之前,还包括:
对待分析文件图像进行字符识别或标识码识别,识别分割重组后的待分析文件图像的所属用户;
识别待分析区域图像的符号标记,若符号标记为目标符号标记类型时,则提取待分析区域图像的信息之后,还包括:
将所属用户与待分析区域图像的信息进行绑定。
一种文件图像分割装置,装置包括:
图像获取模块,用于获取文件图像;
图像处理模块,用于对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;
坐标记录模块,用于记录垂直直方图的波谷在预设二维坐标系中对应的坐标信息;
分割点确定模块,用于识别坐标信息对应文件图像中的起始字符信息,若起始字符信息为目标类型信息,则保留坐标信息对应的分割点;
图像分割模块,用于根据分割点将文件图像分割成多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取文件图像;
对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;
记录垂直直方图的波谷在预设二维坐标系中对应的坐标信息;
识别坐标信息对应文件图像中的起始字符信息,若起始字符信息为目标类型信息,则保留坐标信息对应的分割点;
根据分割点将文件图像分割成多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取文件图像;
对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;
记录垂直直方图的波谷在预设二维坐标系中对应的坐标信息;
识别坐标信息对应文件图像中的起始字符信息,若起始字符信息为目标类型信息,则保留坐标信息对应的分割点;
根据分割点将文件图像分割成多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系。
上述文件图像分割方法、装置、计算机设备和存储介质,通过对文件图像进行图像二值化处理和垂直方向投影,得到垂直直方图,根据垂直直方图的波谷的坐标和坐标对应的起始字符信息,确定分割点,根据分割点将文件图像分割成区域图像,并得到预设二维坐标系下坐标与区域图像的分割关系。上述过程,通过确定好的分割点即能高效地完成图像的分割,省去大量的识别操作,并且,在后续的图像处理过程中,能够根据预设二维坐标系下坐标与区域图像的分割关系,即能快速地将图像分割成多个区域图像,提高了文件图像分割的效率。
附图说明
图1为一个实施例中文件图像分割方法的应用环境图;
图2为一个实施例中文件图像分割方法的流程示意图;
图3为另一个实施例中文件图像分割的详细流程示意图;
图4为另一个实施例中文件图像分割之后信息提取部分的流程示意图;
图5为一个实施例中文件图像分割装置的结构框图;
图6为另一个实施例中文件图像分割装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的文件图像分割方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。具体的,可以是用户将文件图像输入至终端102,终端102将用户上传的文件图像实时上传至服务器104,服务器104获取文件图像,对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图,记录垂直直方图的波谷在预设二维坐标系中对应的坐标信息,识别坐标信息对应文件图像中的起始字符信息,若起始字符信息为目标类型信息,则保留坐标信息对应的分割点,根据分割点将文件图像分割成多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在其中一个实施例中,如图2所示,提供了一种文件图像分割方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S100,获取文件图像。
其中,文件图像的来源可以是用户将初始文件通过扫描的方式,将文件转换为图像,然后,将扫描后得到的文件图像输入至终端,终端实时将用户输入的文件图像上传至服务器的数据库,当用户通过终端向服务器发送分割指令时,从数据库中获取文件图像。
如图3所示,在其中一个实施例中,获取文件图像包括:步骤S120,获取初始文件图像,根据初始文件图像的文件数据,将初始文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到文件图像。
在实际应用中,文件图像为分割重组后的图像,具体的,可以是用户于终端输入文件的属性数据,包括纸张大小、文字排列方式如横排以及栏目数等,然后将初始文件通过扫描的方式存储为图像,得到初始文件图像,终端将出初始文件图像发送至服务器,服务器获取初始文件图像,根据初始文件图像携带的文件数据,对初始文件图像进行分割,例如,一份扫描文件(例如试卷)的大小为B4,横排,两栏,在扫描完成后,根据扫描文件的文件数据,将初始文件图像分割为四面,得到四份分割文件,将四份分割文件按照文件内容的先后顺序进行垂直排列重组,以使初始文件图像中携带的内容在同一图像上显示,得到重组图像即文件图像。
步骤S200,对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图。
图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。二值化可以把灰度图像转换成二值图像。把大于某个临界灰度值的像素灰度设为灰度极大值,把小于这个值的像素灰度设为灰度极小值,从而实现二值化。本实施例中,预设的二维坐标系的建立方式可以是选取文件图像的左上角的点为原点,原点向右为横坐标轴,原点向下为纵坐标轴(以下简称Y轴),垂直直方图能够体现灰度值的分布情况。当获取文件图像后,可以是以RGB(Red,Green,Blue,红、绿、蓝)三通道方式读取文件图像各像素点的像素值,按照规范将像素值设置为0或255,将文件图像转换为二值化图像。本实施例中,二值化图像黑色像素区域为具有字体的部分,白色像素区域为无字体的部分。采用标记黑色像素点为1,白色像素点为0的方法对黑色像素区域进行二值化,得到二值化图像。
如图3所示,在其中一个实施例中,对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图包括:步骤S220,将文件图像转换为HSV域图像,采用Yen算法,计算HSV域图像中V通道的门限值,根据V通道的门限值,调整黑色像素阈值范围,基于调整后的黑色像素阈值范围,得到二值化图像,对二值化图像进行垂直方向投影,得到对应的垂直直方图。
HSV是根据颜色的直观特性创建的一种颜色空间,也称六角锥体模型,其中H代表色调,S代表饱和度,V代表明度。Yen算法是一种求解二值化阈值的方法。本实施例中,采用Yen算法,计算HSV域图像中V通道的门限值,记为Tv。根据V通道的门限值,即在V通道取像素值在0~35范围内选取一个数值作为黑色像素阈值,以此调整黑色像素阈值范围,并从HSV域图像中选取三通道值在黑色像素阈值范围内的像素点,作为黑色像素点。基于调整后的黑色像素阈值,将黑色像素点标记为1,白色像素点标记为0,对黑色像素区域进行二值化,得到二值化图像。再将得到的二值化图像进行预设坐标系下的垂直方向投影,得到对应的垂直直方图。
步骤S300,记录垂直直方图的波谷在预设二维坐标系中对应的坐标信息。
如上述实施例所述,当得到文件图像对应的垂直直方图后,记录每个垂直直方图每个波谷在Y轴对应的坐标信息Gn,得到坐标信息数据集R1为:
其中,每个垂直直方图的每个波谷代表该Y轴位置Gn处所含黑色像素点数量最少即文字信息最少。
步骤S400,识别坐标信息对应文件图像中的起始字符信息,若起始字符信息为目标类型信息,则保留坐标信息对应的分割点。
当记录了每个垂直直方图的波谷在Y轴的坐标信息时,可以将每个记录下的坐标信息Gn标记为分割点,则识别每个坐标信息对应在文件图像的起始字符信息即开头信息,当起始字符信息为数字字符如“1.”或“1.2”或者包含关键字时,则保留该坐标信息对应的分割点,否则,从坐标信息数据集R1中删除该坐标信息,以此方式,更新坐标信息数据集R1,得到坐标信息数据集R2为:
Figure BDA0002233981480000081
步骤S500,根据分割点将文件图像分割成多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系。
经上述步骤S400,得到更新后的坐标信息数据集R2之后,根据R2中保留的分割点,将文件图像分割多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系,分割关系可以是
Figure BDA0002233981480000082
上述文件图像分割方法,通过对文件图像进行图像二值化处理和垂直方向投影,得到垂直直方图,根据垂直直方图的波谷的坐标和坐标对应的起始字符信息,确定分割点,根据分割点将文件图像分割成区域图像,并得到预设二维坐标系下坐标与区域图像的分割关系。上述过程,通过确定好的分割点即能高效地完成图像的分割,省去大量的识别操作,并且,在后续的图像处理过程中,能够根据预设二维坐标系下坐标与区域图像的分割关系,即能快速地将图像分割成多个区域图像,提高了文件图像分割的效率。
为便于对本申请提供的文件图像分割方法进行更清楚的说明,下面结合一个实例进行说明:
在实际应用中,可以是用户于终端输入初始文件(初始文件包含文字字符)的属性数据,包括纸张大小、文字排列方式如横排以及栏目数等,然后将初始文件通过扫描的方式存储为图像,得到初始文件图像,终端将出初始文件图像发送至服务器,服务器获取初始文件图像,根据初始文件图像携带的文件数据,对初始文件图像进行分割,在将分割后得到的文件按照文件固有的先后顺序垂直排列重组,得到文件图像,将文件图像转换为HSV域图像,然后采用Yen算法,计算HSV域图像中V通道的门限值,根据上述门限值调整黑色像素,得到二值化图像,然后对二值化图像进行预设二维坐标系下的垂直方向投影,得到对应的垂直直方图,记录每个垂直直方图的每个波谷在纵坐标轴的坐标信息Gn(将坐标信息作为分割点),然后,识别每个坐标信息Gn对应的文件图像中的起始字符信息,若起始字符为数字字符如“1,2”或“1.1,1.2”或者包含关键字如“第一题,第二题”等,则保留坐标信息对应的分割点,得到Gn’,否则删除,最后,根据保留下的分割点将文件图像分割为多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系,如:
Figure BDA0002233981480000091
在其中一个实施例中,根据分割点将文件图像分割成多个区域图像之后,还包括:采用光学字符识别技术,将区域图像携带的文字信息转化为文本字符,对文本字符进行标注、分割以及关键词提取,得到区域图像对应的提取信息。
光学字符识别技术即OCR(optical character recognition,光学字符识别)技术,OCR是指针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。本实施例中,文件图像以试卷为例,则分割出来的区域图像可以是以题目为单位的试题图像,通过光学字符识别技术,对每个区域Area对应的试题图像携带的文字字符进行字符识别,将试题图像的文字字符即印刷体字符转化为文本字符,然后,标注出每张试题图像的类别信息(可以是标注出每一题的题目编号,记为Label,Label与Area为一一对应关系,即一个区域Area对应一道试题即一个Label),并对试题图像中的文字字符进行分割和关键词提取,来判断该试题所属的知识领域Zone,得到区域图像对应的提取关系,如下所示:
Figure BDA0002233981480000101
Zone∈[知识领域1,知识领域2,知识领域3……知识领域n],例如,提取出坐标范围为[0,G1’]对应的是题目编号为1即第1题的试题图像,该试题图像中的文本字符信息中关键词包含有三角形,中点,垂线,平分线以及交点等,则判断此试题大概率属于数学三角几何的知识领域,[0,G1’]~第1题~数学三角几何的对应关系即本实施例中的提取信息。本实施例中,通过光学字符识别技术,得到区域图像对应的提取信息,能够便于在后续处理文件图像时,由图像的坐标,直接查找到对应的类别信息和所属领域等。
如图4所示,在其中一个实施例中,根据分割点将文件图像分割成多个区域图像之后,还包括:
步骤S600,获取待分析文件图像;
步骤S620,根据待分析文件图像的文件数据,将待分析文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到分割重组后的待分析文件图像;
步骤S640,将分割重组后的待分析文件图像映射到预设坐标系中、并根据预设坐标系下的坐标与区域图像的分割关系,将分割重组后的待分析文件图像分割为多个待分析区域图像;
步骤S660,识别待分析区域图像的符号标记,若符号标记为目标符号标记类型时,则提取待分析区域图像的信息。
本实施例中,以待分析文件图像为批改后的试卷(批改试卷携带批改痕迹)扫描得到的试卷图像为例,得到的区域图像与坐标的分割关系,可应用于后续的试题图像的分析处理中。具体的,可以是用户再次输入已批改的试卷图像至终端,终端将已批改的试卷图像发送给服务器,服务器获取已批改的试卷图像,同样的,按照步骤S120的处理,根据已批改的试卷图像的文件属性数据如纸张大小为B4,横排以及两栏,将已批改的试卷图像进行分割和垂直排列重组,以使文件中携带的试题信息在同一图像上显示(即所有的试题从第一题开始依次往下垂直排列在一张图像上),得到分割重组后的待分析的试卷图像。然后,同样的,将分割重组后的已批改试卷图像映射到预设坐标系中、并根据得到的预设坐标系下的坐标与区域图像的分割关系,将分割重组后的待分析试卷图像分割为多个试题区域图像Px,得到试题区域图像与题目试题的关系(Label~Px),其表示Label题号所对应的图片信息为Px,则有:
Figure BDA0002233981480000111
分析各试题区域图像Px,识别其中的符号标记,通过符号标记来识别该试题区域的对应题目的错对状态,记为Corrx,并整理得分情况,记为Scorex,然后,记录出特定标识对应的状态,并采用光学字符识别技术,将待分析区域图像携带的文字信息转换为文本字符,根据区域图像对应的提取信息,提取出待分析区域图像的对应的文本字符。具体的,符号标记可以是图像中的特定标识如红色标志的手机数字、勾、半勾及叉等,当识别到试题区域图像中的符号标记为勾或半勾时,则表示试题回答正确,Corrx记为1,并根据预设的各题分数计算得分;当识别到试题区域图像中的符号标记为叉时,则表示试题回答错误,Corrx记为0,并根据预设的各题分数计算得分,以此方式,提取该待分析区域图像的信息(Label~Px~Corrx~Scorex),具体的,可以是:
Figure BDA0002233981480000121
(1表示回答正确,0表示回答错误)
Figure BDA0002233981480000122
得到上述(Label~Px~Corrx~Scorex)之后,保存(Label~Px~Corrx~Scorex)中Corrx=0的题目信息对应的区域图像Px,遍历(Label~Px~Corrx~Scorex),查找出其中Corrx=0的Label,记为Labelx,其中
Figure BDA0002233981480000125
通过Label~Zone查找Labelx的信息(即错题信息),提取所需要记录的内容,包括题目编号,题目信息,所属知识领域等,记为(Labelx~Zone),其中:
Figure BDA0002233981480000123
Zonex∈[知识领域1,知识领域2,知识领域3,……,知识领域n]
Figure BDA0002233981480000124
本实施例中,通过预设坐标系下的坐标与区域图像的分割关系和区域图像中的符号标记,便能快速完成图像分割和内容提取,提高图像处理的效率。
在其中一个实施例中,将分割重组后的待分析文件图像映射到预设坐标系中之前,还包括:对待分析文件图像进行字符识别或标识码识别,识别分割重组后的待分析文件图像的所属用户;识别待分析区域图像的符号标记,若符号标记为目标符号标记类型时,则提取待分析区域图像的信息之后,还包括:将所属用户与待分析区域图像的信息进行绑定。
本实施例中,待分析文件图像中携带有用户标识内容例如用户姓名或用于标识用户身份的条形码或二维码,为提升用户的体验感,可以是在将分割重组后的待分析文件图像映射到预设坐标系中之前,对待分析文件图像进行字符识别或标识码识别,识别出分割重组后的待分析文件图像的所属用户Nx,Nx表示用户编号,然后对待分析文件图像进行分割,提取出待分析区域图像的信息之后,将所属用户与待分析区域图像的信息的进行绑定,待分析文件图像以试卷图像为例,将所属用户与待分析区域图像的信息的进行绑定,可记为Nx~(Labelx~Zone)。在其他实施例中,还可以是将识别出的所属用户和提取出的待分析区域图像中的信息按照对应关系进行存储,便于对提取出的信息的管理。本实施例中,通过识别用户信息,并将用户信息与提取出的信息进行绑定,使得能够将提取出的信息对应到所属用户,用户也能对应查看到从待分析区域图像中提取出的对应信息。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在其中一个实施例中,如图5所示,提供了一种文件图像分割装置,包括:图像获取模块510、图像处理模块520、坐标记录模块530、分割点确定模块540和图像分割模块550,其中:
图像获取模块510,用于获取文件图像;
图像处理模块520,用于对文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;
坐标记录模块530,用于记录垂直直方图的波谷在预设二维坐标系中对应的坐标信息;
分割点确定模块540,用于识别坐标信息对应文件图像中的起始字符信息,若起始字符信息为目标类型信息,则保留坐标信息对应的分割点;
图像分割模块550,用于根据分割点将文件图像分割成多个区域图像,得到预设二维坐标系下坐标与区域图像的分割关系。
在其中一个实施例中,图像获取模块510还用于获取初始文件图像,根据初始文件图像的文件数据,将初始文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到文件图像。
在其中一个实施例中,图像处理模块520还用于将文件图像转换为HSV域图像,采用Yen算法,计算HSV域图像中V通道的门限值,根据V通道的门限值,调整黑色像素阈值范围,基于调整后的黑色像素阈值范围,得到二值化图像,对二值化图像进行垂直方向投影,得到对应的垂直直方图。
如图6所示,在其中一个实施例中,文件图像分割装置还包括信息提取模块560,用于采用光学字符识别技术,将区域图像携带的文字信息转化为文本字符,对文本字符进行标注、分割以及关键词提取,得到区域图像对应的提取信息。
如图6所示,在其中一个实施例中,文件图像分割装置还包括图像分析模块570,用于获取待分析文件图像,根据待分析文件图像的文件数据,将待分析文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到分割重组后的待分析文件图像,将分割重组后的待分析文件图像映射到预设坐标系中、并根据预设坐标系下的坐标与区域图像的分割关系,将分割重组后的待分析文件图像分割为多个待分析区域图像,识别待分析区域图像的符号标记,若符号标记为目标符号标记类型时,则提取待分析区域图像的信息。
在其中一个实施例中,信息提取模块560还用于采用光学字符识别技术,将待分析区域图像携带的文字信息转换为文本字符,根据区域图像对应的提取信息,提取出待分析区域图像的对应的文本字符。
如图6所示,在其中一个实施例中,文件图像分割装置还包括信息绑定模块580,用于对待分析文件图像进行字符识别或标识码识别,识别分割重组后的待分析文件图像的所属用户,将所属用户与待分析区域图像的信息进行绑定。
关于文件图像分割装置的具体限定可以参见上文中对于文件图像分割方法的限定,在此不再赘述。上述文件图像分割装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在其中一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文件图像数据以及用户数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文件图像分割方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述文件图像分割方法的步骤。
在其中一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述文件图像分割方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文件图像分割方法,所述方法包括:
获取文件图像;
对所述文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;
记录所述垂直直方图的波谷在所述预设二维坐标系中对应的坐标信息;
识别所述坐标信息对应所述文件图像中的起始字符信息,若所述起始字符信息为目标类型信息,则保留所述坐标信息对应的分割点;
根据所述分割点将所述文件图像分割成多个区域图像,得到所述预设二维坐标系下坐标与区域图像的分割关系。
2.根据权利要求1所述的文件图像分割方法,其特征在于,所述获取文件图像包括:
获取初始文件图像;
根据所述初始文件图像的文件数据,将所述初始文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到所述文件图像。
3.根据权利要求1所述的文件图像分割方法,其特征在于,所述对所述文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图包括:
将所述文件图像转换为HSV域图像;
采用Yen算法,计算所述HSV域图像中V通道的门限值;
根据所述V通道的门限值,调整黑色像素阈值范围;
基于所述调整后的黑色像素阈值范围,得到二值化图像;
对所述二值化图像进行垂直方向投影,得到对应的垂直直方图。
4.根据权利要求1所述的文件图像分割方法,其特征在于,所述根据所述分割点将所述文件图像分割成多个区域图像之后,还包括:
采用光学字符识别技术,将所述区域图像携带的文字信息转化为文本字符;
对所述文本字符进行标注、分割以及关键词提取,得到所述区域图像对应的提取信息。
5.根据权利要求4所述的文件图像分割方法,其特征在于,所述根据所述分割点将所述文件图像分割成多个区域图像之后,还包括:
获取待分析文件图像;
根据所述待分析文件图像的文件数据,将所述待分析文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到分割重组后的待分析文件图像;
将所述分割重组后的待分析文件图像映射到所述预设坐标系中、并根据所述预设坐标系下的坐标与区域图像的分割关系,将所述分割重组后的待分析文件图像分割为多个待分析区域图像;
识别所述待分析区域图像的符号标记,若所述符号标记为目标符号标记类型时,则提取所述待分析区域图像的信息。
6.根据权利要求5所述的文件图像分割方法,其特征在于,提取所述待分析区域图像的信息包括:
采用光学字符识别技术,将所述待分析区域图像携带的文字信息转换为文本字符;
根据所述区域图像对应的提取信息,提取出所述待分析区域图像的对应的文本字符。
7.根据权利要求5所述的文件图像分割方法,其特征在于,所述将所述分割重组后的待分析文件图像映射到所述预设坐标系中之前,还包括:
对所述待分析文件图像进行字符识别或标识码识别,识别所述分割重组后的待分析文件图像的所属用户;
所述识别所述待分析区域图像的符号标记,若所述符号标记为目标符号标记类型时,则提取所述待分析区域图像的信息之后,还包括:
将所述所属用户与所述待分析区域图像的信息进行绑定。
8.一种文件图像分割装置,其特征在于,所述装置包括:
图像获取模块,用于获取文件图像;
图像处理模块,用于对所述文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;
坐标记录模块,用于记录所述垂直直方图的波谷在所述预设二维坐标系中对应的坐标信息;
分割点确定模块,用于识别所述坐标信息对应所述文件图像中的起始字符信息,若所述起始字符信息为目标类型信息,则保留所述坐标信息对应的分割点;
图像分割模块,用于根据所述分割点将所述文件图像分割成多个区域图像,得到所述预设二维坐标系下坐标与区域图像的分割关系。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910977072.4A 2019-10-15 2019-10-15 文件图像分割方法、装置、计算机设备和存储介质 Active CN110728687B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910977072.4A CN110728687B (zh) 2019-10-15 2019-10-15 文件图像分割方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910977072.4A CN110728687B (zh) 2019-10-15 2019-10-15 文件图像分割方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110728687A true CN110728687A (zh) 2020-01-24
CN110728687B CN110728687B (zh) 2022-08-02

Family

ID=69221287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910977072.4A Active CN110728687B (zh) 2019-10-15 2019-10-15 文件图像分割方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110728687B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626682A (zh) * 2020-08-03 2020-09-04 南昌梦想软件有限公司 一种成本的核算方法、装置、计算机设备和存储介质
CN112329548A (zh) * 2020-10-16 2021-02-05 北京临近空间飞行器系统工程研究所 一种文档章节分割方法、装置及存储介质
CN113824546A (zh) * 2020-06-19 2021-12-21 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN114332866A (zh) * 2021-12-08 2022-04-12 上海大学 一种基于图像处理的文献曲线分离与坐标信息提取方法
CN115292542A (zh) * 2022-10-09 2022-11-04 江西风向标智能科技有限公司 基于试题配图的试题搜索方法、系统、存储介质及设备
CN117894217A (zh) * 2024-03-12 2024-04-16 中国科学技术大学 一种用于在线学习系统的数学题目导学系统

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458768A (zh) * 2009-01-04 2009-06-17 上海大学 自由手写数字串分割方法
CN102609699A (zh) * 2012-02-17 2012-07-25 重庆大学 一种激光扫描铸件工件号的识别装置和方法
CN103324930A (zh) * 2013-06-28 2013-09-25 浙江大学苏州工业技术研究院 一种基于灰度直方图二值化的车牌字符分割方法
CN105046254A (zh) * 2015-07-17 2015-11-11 腾讯科技(深圳)有限公司 字符识别方法及装置
CN106156773A (zh) * 2016-06-27 2016-11-23 湖南大学 一种文本图像的分割方法及装置
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN106446896A (zh) * 2015-08-04 2017-02-22 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN106529532A (zh) * 2016-11-07 2017-03-22 湖南源信光电科技有限公司 一种基于积分特征通道与灰度投影的车牌识别系统
CN106599894A (zh) * 2016-12-27 2017-04-26 上海铁路局科学技术研究所 一种基于图像识别的接触网杆号识别方法
CN107122777A (zh) * 2017-04-25 2017-09-01 云南省交通科学研究所 一种基于视频文件的车辆分析系统及分析方法
CN107292311A (zh) * 2017-08-10 2017-10-24 河南科技大学 一种基于神经网络的字符粘连验证码的识别方法
CN107507334A (zh) * 2017-08-31 2017-12-22 深圳怡化电脑股份有限公司 一种纸币面额识别方法、装置、设备及存储介质
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108108734A (zh) * 2016-11-24 2018-06-01 杭州海康威视数字技术股份有限公司 一种车牌识别方法及装置
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN109241973A (zh) * 2018-08-21 2019-01-18 南京工程学院 一种纹理背景下的字符全自动软分割方法
CN109325492A (zh) * 2018-08-17 2019-02-12 平安科技(深圳)有限公司 字符切割方法、装置、计算机设备及存储介质
CN109977959A (zh) * 2019-03-29 2019-07-05 国家电网有限公司 一种火车票字符区域分割方法及装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458768A (zh) * 2009-01-04 2009-06-17 上海大学 自由手写数字串分割方法
CN102609699A (zh) * 2012-02-17 2012-07-25 重庆大学 一种激光扫描铸件工件号的识别装置和方法
CN103324930A (zh) * 2013-06-28 2013-09-25 浙江大学苏州工业技术研究院 一种基于灰度直方图二值化的车牌字符分割方法
CN105046254A (zh) * 2015-07-17 2015-11-11 腾讯科技(深圳)有限公司 字符识别方法及装置
CN106446896A (zh) * 2015-08-04 2017-02-22 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN106156773A (zh) * 2016-06-27 2016-11-23 湖南大学 一种文本图像的分割方法及装置
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN106529532A (zh) * 2016-11-07 2017-03-22 湖南源信光电科技有限公司 一种基于积分特征通道与灰度投影的车牌识别系统
CN108108734A (zh) * 2016-11-24 2018-06-01 杭州海康威视数字技术股份有限公司 一种车牌识别方法及装置
CN106599894A (zh) * 2016-12-27 2017-04-26 上海铁路局科学技术研究所 一种基于图像识别的接触网杆号识别方法
CN107122777A (zh) * 2017-04-25 2017-09-01 云南省交通科学研究所 一种基于视频文件的车辆分析系统及分析方法
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN107292311A (zh) * 2017-08-10 2017-10-24 河南科技大学 一种基于神经网络的字符粘连验证码的识别方法
CN107507334A (zh) * 2017-08-31 2017-12-22 深圳怡化电脑股份有限公司 一种纸币面额识别方法、装置、设备及存储介质
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN109325492A (zh) * 2018-08-17 2019-02-12 平安科技(深圳)有限公司 字符切割方法、装置、计算机设备及存储介质
CN109241973A (zh) * 2018-08-21 2019-01-18 南京工程学院 一种纹理背景下的字符全自动软分割方法
CN109977959A (zh) * 2019-03-29 2019-07-05 国家电网有限公司 一种火车票字符区域分割方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113824546A (zh) * 2020-06-19 2021-12-21 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN113824546B (zh) * 2020-06-19 2024-04-02 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN111626682A (zh) * 2020-08-03 2020-09-04 南昌梦想软件有限公司 一种成本的核算方法、装置、计算机设备和存储介质
CN112329548A (zh) * 2020-10-16 2021-02-05 北京临近空间飞行器系统工程研究所 一种文档章节分割方法、装置及存储介质
CN114332866A (zh) * 2021-12-08 2022-04-12 上海大学 一种基于图像处理的文献曲线分离与坐标信息提取方法
CN115292542A (zh) * 2022-10-09 2022-11-04 江西风向标智能科技有限公司 基于试题配图的试题搜索方法、系统、存储介质及设备
CN117894217A (zh) * 2024-03-12 2024-04-16 中国科学技术大学 一种用于在线学习系统的数学题目导学系统
CN117894217B (zh) * 2024-03-12 2024-06-04 中国科学技术大学 一种用于在线学习系统的数学题目导学系统

Also Published As

Publication number Publication date
CN110728687B (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN110728687B (zh) 文件图像分割方法、装置、计算机设备和存储介质
CN110334585B (zh) 表格识别方法、装置、计算机设备和存储介质
CN110390666B (zh) 道路损伤检测方法、装置、计算机设备及存储介质
CN107688789B (zh) 文档图表抽取方法、电子设备及计算机可读存储介质
CN107689070B (zh) 图表数据结构化提取方法、电子设备及计算机可读存储介质
CN111626124B (zh) Ocr图像样本生成、印刷体验证方法、装置、设备及介质
CN109522898B (zh) 手写样本图片标注方法、装置、计算机设备及存储介质
WO2021012382A1 (zh) 配置聊天机器人的方法、装置、计算机设备和存储介质
CN110807454B (zh) 基于图像分割的文字定位方法、装置、设备及存储介质
CN110675940A (zh) 病理图像标注方法、装置、计算机设备及存储介质
CN112926564B (zh) 图片分析方法、系统、计算机设备和计算机可读存储介质
CN112712014A (zh) 表格图片结构解析方法、系统、设备和可读存储介质
CN112749606A (zh) 一种文本定位方法和装置
CN110866457A (zh) 一种电子保单的获得方法、装置、计算机设备和存储介质
JP3851742B2 (ja) 帳票処理方法及び装置
CN111291741B (zh) 单据识别方法、装置、计算机设备和存储介质
CN110751013B (zh) 场景识别方法、装置和计算机可读存储介质
CN114972817A (zh) 图像相似度匹配方法、设备及存储介质
CN112580499A (zh) 文本识别方法、装置、设备及存储介质
CN113537184A (zh) Ocr模型训练方法、装置、计算机设备、存储介质
CN111126266B (zh) 文本处理方法、文本处理系统、设备及介质
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
CN113610090B (zh) 印章图像识别分类方法、装置、计算机设备和存储介质
CN107688788B (zh) 文档图表抽取方法、电子设备及计算机可读存储介质
KR100957508B1 (ko) 광학 문자 인식 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant