CN114064961A - 一种扫描件存档方法及装置 - Google Patents

一种扫描件存档方法及装置 Download PDF

Info

Publication number
CN114064961A
CN114064961A CN202111247707.9A CN202111247707A CN114064961A CN 114064961 A CN114064961 A CN 114064961A CN 202111247707 A CN202111247707 A CN 202111247707A CN 114064961 A CN114064961 A CN 114064961A
Authority
CN
China
Prior art keywords
picture
name
archiving
target cell
naming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111247707.9A
Other languages
English (en)
Inventor
吴美雨
廖勇
陈文刚
孙光辉
许诺
祁富钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongfeng Liuzhou Motor Co Ltd
Original Assignee
Dongfeng Liuzhou Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongfeng Liuzhou Motor Co Ltd filed Critical Dongfeng Liuzhou Motor Co Ltd
Priority to CN202111247707.9A priority Critical patent/CN114064961A/zh
Publication of CN114064961A publication Critical patent/CN114064961A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种扫描件存档方法及装置,所述方法包括:获取第一图片后,根据预设坐标从第一图片中获取第一区域图片;其中,第一图片为同类表格扫描件,第一区域图片为包含目标单元格的图片;对第一区域图片进行倾斜矫正处理,得到第二区域图片后,对第二区域图片进行第一识别处理,得到目标单元格图片;根据目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据目标内容识别结果对第一图片命名后进行存档。采用本发明实施例能提高扫描件命名存档的准确性。

Description

一种扫描件存档方法及装置
技术领域
本发明涉及图片处理技术领域,尤其涉及一种扫描件存档方法及装置。
背景技术
现实生活中存在同时对大批量扫描件进行命名、存档的情况,以汽车冲压工艺为例,汽车冲压件从开发到量产需要经历工艺分析、工法设计、工法评审、结构设计、结构评审、模具验收等多个阶段,而每一套模具在不同的阶段都会涉及一份乃至多份表格类工艺指导文件,如工法设计阶段和结构设计阶段的工法评审纪要、结构评审纪要、工法点检表、结构点检表、结构设计申请、CAE检查表等众多文件。每一款新开发的车型新增件约有400余件,新开发模具约1000余套,需要人工完成数万张纸质工艺文件的会签与扫描存档,工作繁琐,效率低下;且文件种类繁多,不同类型文档命名要求不同,人工命名容易混淆、出错。
综上所述,现有的表格类扫描件存档方法效率低下,且命名存档的准确率不高。
发明内容
本发明实施例提供一种扫描件存档方法及装置,提高了扫描件命名存档的准确率。
本申请实施例的第一方面提供了一种扫描件存档方法,包括:
获取第一图片后,根据预设坐标从第一图片中获取第一区域图片;其中,第一图片为同类表格扫描件,第一区域图片为包含目标单元格的图片;
对第一区域图片进行倾斜矫正处理,得到第二区域图片后,对第二区域图片进行第一识别处理,得到目标单元格图片;
根据目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据目标内容识别结果对第一图片命名后进行存档。
在第一方面的一种可能的实现方式中,对第一区域图片进行倾斜矫正处理,具体为:
对第一区域图片进行预处理,得到第一二值图;
根据第一二值图进行横向识别并得到第一横向识别结果后,对第一横向识别结果进行霍夫变换,得到第一二值图中的第一直线及其斜率;
根据第一直线的斜率,计算得到第一角度;
当第一角度的绝对值大于第一预设数值时,对第一区域图片和第一二值图进行倾斜矫正处理,分别得到第二区域图片和第二二值图。
在第一方面的一种可能的实现方式中,对第二区域图片进行第一识别处理,得到目标单元格图片,具体为:
根据第二二值图进行横向识别和纵向识别,分别得到第二横向识别结果和第二纵向识别结果;
对第二横向识别结果和第二纵向识别结果进行求交处理,得到目标单元格的坐标;
根据目标单元格的坐标从第二区域图片中提取目标单元格图片,完成第一识别处理。
在第一方面的一种可能的实现方式中,根据目标内容识别结果对第一图片命名后进行存档,具体为:
根据字符串替换方法,对目标内容识别结果进行过滤处理,得到过滤结果;
根据过滤结果,并结合命名规则对第一图片命名后进行存档。
在第一方面的一种可能的实现方式中,根据过滤结果,并结合命名规则对第一图片命名,具体为:
命名规则包括:覆盖规则、前缀规则和后缀规则;
当命名规则为覆盖规则时,提取第一图片的后缀名,将第一图片命名为第一名称;其中,第一名称包括:过滤结果和后缀名;
当命名规则为前缀规则时,提取第一图片的原文件名,将第一图片命名为第二名称;其中,第二名称包括:过滤结果、分隔符和原文件名;
当命名规则为后缀规则时,提取第一图片的后缀名和原文件名,将第一图片命名为第三名称;其中,第三名称包括:原文件名、分隔符、过滤结果和后缀名。
在第一方面的一种可能的实现方式中,还包括:
判断第一名称、第二名称或者第三名称是否与现有名称重合,若是,则更新第一名称、第二名称或者第三名称后进行存档;若否,则根据第一名称、第二名称或者第三名称直接存档。
在第一方面的一种可能的实现方式中,根据预设坐标从第一图片中获取第一区域图片,具体为:
根据预设坐标,并结合图片分割法,对第一图片进行切割后提取第一区域图片。
在第一方面的一种可能的实现方式中,根据目标单元格图片进行第二识别处理,得到目标内容识别结果,具体为:
将目标单元格图片输入至光学字符识别服务器中,以使光学字符识别服务器对目标单元格图片进行第二识别处理并输出目标内容识别结果。
在第一方面的一种可能的实现方式中,获取第一图片,具体为:
获取初始图片,并将初始图片按照预设比例进行等比缩放后,得到预设像素图片;
在预设像素图片上设置m行n列的网格,得到第一图片并获取;其中,m和n均为正整数。
本申请实施例的第二方面提供了一种扫描件存档装置,包括:获取模块、处理模块和存档模块;
其中,获取模块用于获取第一图片后,根据预设坐标从第一图片中获取第一区域图片;其中,第一图片为同类表格扫描件,第一区域图片为包含目标单元格的图片;
处理模块用于对第一区域图片进行倾斜矫正处理,得到第二区域图片后,对第二区域图片进行第一识别处理,得到目标单元格图片;
存档模块用于根据目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据目标内容识别结果对第一图片命名后进行存档。
相比于现有技术,本发明实施例提供的一种扫描件存档方法及装置,所述方法包括:获取第一图片后,根据预设坐标从第一图片中获取第一区域图片;其中,第一图片为同类表格扫描件,第一区域图片为包含目标单元格的图片;对第一区域图片进行倾斜矫正处理,得到第二区域图片后,对第二区域图片进行第一识别处理,得到目标单元格图片;根据目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据目标内容识别结果对第一图片命名后进行存档。
其有益效果在于:本发明实施例根据预设坐标,先从第一图片获取包含目标单元格的第一区域图片,然后对第一区域图片进行倾斜校正处理后进行第一识别处理,准确得到目标单元格图片后,对目标单元格图片进行第二识别处理,根据目标内容识别结果对第一图片命名后进行存档,能够准确得到每个同类表格扫描件的目标内容识别结果,并根据目标识别结果进行扫描件命名存档,能够提高扫描件命名的准确率。而不再像现有技术一样:需要在电脑上逐个打开、人工查找大量表格扫描件的目标单元格以及目标内容、人工根据目标内容对第一图片进行命名存档,工作强度、难度高,耗时长,工作人员极易因视觉疲劳与肌肉记忆效应导致命名错误,且出错误难以检查。而且,扫描件种类繁多,不同类型扫描件命名要求不同,人工命名容易混淆,错误率较高。所以本发明实施例提出的一种扫描件存档方法及装置,避免了人工干涉而导致的失误和难度,能够有效提高扫描件命名存档的准确性。
此外,相比于人工查找、命名和存档,本发明实施例提出的一种扫描件存档方法及装置对于同类表格扫描件,只需人工设置一次预设坐标,便可实现同类表格扫描件批量识别、命名和存档,有效降低了因为人为失误导致的命名错误,提高了效率。而且单个表格扫描件识别所需时间不到1秒,综合工况下,效率约为手工的50-100倍。
最后,可以通过多种命名规则,结合不同的预设坐标实现对同一表格扫描件的多种信息提取,提高了系统的柔性,能胜任各种复杂环境的识别及归档工作。
附图说明
图1是本发明一实施例提供的一种扫描件存档方法的流程示意图;
图2是本发明一实施例提供的第一图片示意图;
图3是本发明一实施例提供的第一区域图片位置示意图;
图4是本发明一实施例提供的第一区域图片示意图;
图5是本发明一实施例提供的第一横向识别结果示意图;
图6是本发明一实施例提供的第二二值图;
图7是本发明一实施例提供的第二横向识别结果示意图;
图8是本发明一实施例提供的第二纵向识别结果示意图;
图9是本发明一实施例提供的求交处理示意图;
图10是本发明一实施例提供的目标单元格图片示意图;
图11是本发明一实施例提供的一种扫描件存档装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,是本发明一实施例提供的一种扫描件存档方法的流程示意图,包括S101-S103:
S101:获取第一图片后,根据预设坐标从第一图片中获取第一区域图片。
其中,第一图片为同类表格扫描件,第一区域图片为包含目标单元格的图片。
在本实施例中,所述获取第一图片,具体为:
获取初始图片,并将所述初始图片按照预设比例进行等比缩放后,得到预设像素图片;
在所述预设像素图片上设置m行n列的网格,得到所述第一图片并获取;其中,m和n均为正整数。具体地,m和n的值可根据实际需要进行设置。
其中,初始图片为同一类表格类纸质档工艺扫描文件,且同一类表格类纸质档工艺扫描文件置于一个路径已知的文件夹下。获取初始图片就是从该路径已知的文件夹中随机读取一张图片至计算机内存中。
在一具体实施例中,使用OpenCV(基于BSD许可发行的跨平台计算机视觉和机器学习软件库)的resize函数将所述初始图片按照预设比例进行等比缩放,得到图片宽度为720像素的预设像素图片。
在本实施例中,所述根据预设坐标从所述第一图片中获取第一区域图片,具体为:
根据所述预设坐标,并结合图片分割法,对所述第一图片进行切割后提取所述第一区域图片。
在一具体实施例中,获取预设坐标的具体流程为:先随机从同一类表格类纸质档工艺扫描文件中抽取一张图片,进行等比缩放得到预设像素图片;接着在预设像素图片上设置m行n列的网格,具体为:使用OpenCV的line函数在预设像素图片上绘制m行n列的网格,得到第一图片;然后通过人工观察第一图片中是否存在一个或多个网格能将ROI区域(即目标单元格所在区域)包含,且判断目标单元格的四个边框线是否满足完整、清晰、可见的条件,如果不满足条件则加密网格,直至满足条件;最后将满足条件的网格区域中左上角为网格中的第L_row行,L_col列个格子,右下角为网格中的第R_row行,R_col列个格子,故可求出ROI区域的上边界坐标y1=图片高度*(L_row-1)/总行数m,同理可以计算出下边界坐标y2与左右边界坐标x1,x2,即该类文件在采用m行n列网格划分时,ROI区域的边界坐标y1,y2,x1和x2能将ROI区域完全包裹。根据ROI区域的边界坐标y1,y2,x1和x2,便能单独提取得到第一区域图片,即包含目标单元格的图片。由上所述,第一区域图片即为ROI区域的图片。
由于同一类表格类纸质档工艺扫描文件的表格形式相同,多个第一图片为同类表格扫描件,所以只需要将任意一张第一图片的ROI区域边界坐标(y1,y2,x1和x2)作为预设坐标,能够实现同类表格扫描件中的每一份文件的ROI区域的定位,即实现了对同类表格扫描件中ROI区域的批量识别,从而进一步实现了根据预设坐标从第一图片中批量获取第一区域图片,大大提高了扫描件存档的效率,且无需人工干涉,有效降低了因为人为失误导致的命名错误。
S102:对第一区域图片进行倾斜矫正处理,得到第二区域图片后,对第二区域图片进行第一识别处理,得到目标单元格图片。
在本实施例中,所述对所述第一区域图片进行倾斜矫正处理,具体为:
对所述第一区域图片进行预处理,得到第一二值图;
根据所述第一二值图进行横向识别并得到第一横向识别结果后,对所述第一横向识别结果进行霍夫变换,得到所述第一二值图中的第一直线及其斜率;
根据所述第一直线的斜率,计算得到第一角度;
当所述第一角度的绝对值大于第一预设数值时,对所述第一区域图片和所述第一二值图进行倾斜矫正处理,分别得到所述第二区域图片和第二二值图。
在一具体实施例中,使用OpenCV的cvtColor函数将所述第一区域图片转化为灰度图;使用OpenCV的adaptiveThreshold函数将所述灰度图转化为所述第一二值图。使用OpenCV的erode与dilate函数,设置过滤的核为全为1的行向量,对第一二值图进行横向识别,得到第一横向识别结果。然后使用OpenCV的HoughLinesP对第一横向识别结果进行霍夫变换,得到第一二值图中所有的直线(即第一直线)。计算所有第一直线的斜率,剔除最高值与最低值,求平均值,将平均值转为第一角度。当第一角度的绝对值大于第一预设数值时,则使用OpenCV的warpAffine函数对第一区域图片和第一二值图进行倾斜矫正处理,分别得到第二区域图片和第二二值图。其中,第一预设数值为0.5°。由于第一区域图片为ROI区域图片,而ROI区域即为目标单元格所在区域,则第二区域图片为经倾斜矫正处理后的包含目标单元格的图片。
具体地,使用核为1的行向量对第一二值图进行腐蚀与膨胀的形态学操作,将第一二值图上的其他数据信息过滤,只保留横向直线。则第一横向识别结果即为只包含横向直线信息的第一二值图。对只包含横向直线信息的第一二值图(即第一横向识别结果)进行霍夫变化,得到第一二值图中包含的所有横向直线,即第一直线,并计算第一直线的平均斜率。将平均斜率转换为第一角度后,若角度大于0.5°则同时对第一区域图片和第一二值图进行倾斜矫正处理,以提高OCR(即,光学字符识别)的识别精度。
在本实施例中,所述对所述第二区域图片进行第一识别处理,得到所述目标单元格图片,具体为:
根据所述第二二值图进行横向识别和纵向识别,分别得到第二横向识别结果和第二纵向识别结果;
对所述第二横向识别结果和所述第二纵向识别结果进行求交处理,得到所述目标单元格的坐标;
根据所述目标单元格的坐标从所述第二区域图片中提取所述目标单元格图片,完成第一识别处理。
在一具体实施例中,使用OpenCV的erode与dilate函数,设置过滤的核为全为1的行向量,对第二二值图进行横向识别,得到第二横向识别结果,并记为resr。使用OpenCV的erode与dilate函数,设置过滤的核为全为1的列向量,对第二二值图进行纵向识别,得到第二纵向识别结果,并记为resc。使用OpenCV的bitwise_and函数对第二横向识别结果resr和第二纵向识别结果resc进行求交处理,得到目标单元格的四个顶点,由四个顶点的坐标可以得出目标单元格上、下、左、右四个边界坐标为y3、y4、x3和x4。根据目标单元格的边界坐标(即y3、y4、x3和x4),便能够从所述第二区域图片(即经过倾斜矫正处理后的包含目标单元格的图片)中提取所述目标单元格图片,完成第一识别处理。
具体地,使用核为1的行向量对第二二值图进行腐蚀与膨胀的形态学操作,将图片上的其他数据信息过滤,只保留横向直线,则第二横向识别结果即为只包含横向直线信息的第二二值图。使用核为1的列向量对第二二值图进行腐蚀与膨胀的形态学操作,将图片上的其他数据信息过滤,只保留纵向直线,则第二纵向识别结果即为只包含纵向直线信息的第二二值图。将第二横向识别结果和第二纵向识别结果求交,可以得到目标单元格的四个顶点,进而确定目标单元格在第二区域图片中的坐标,可以从第二区域图片中单独提取得到只有目标单元格的图片,即为目标单元格图片。由于第二区域图片为经过倾斜矫正处理后的包含目标单元格的图片,第二区域图片中还存在许多不需要的、与目标单元格无关的部分,为了提高命名的准确性,所以需要进一步从第二区域图片中提取只有目标单元格的图片,以避免在后续的识别处理过程中导致失误。
其中,目标单元格即为包含表格关键信息的单元格。
S103:根据目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据目标内容识别结果对第一图片命名后进行存档。
其中,目标内容识别结果即为表格关键信息数据。
在本实施例中,所述根据所述目标单元格图片进行第二识别处理,得到目标内容识别结果,具体为:
将所述目标单元格图片输入至光学字符识别服务器中,以使所述光学字符识别服务器对所述目标单元格图片进行第二识别处理并输出所述目标内容识别结果。
在本实施例中,所述根据所述目标内容识别结果对所述第一图片命名后进行存档,具体为:
根据字符串替换方法,对所述目标内容识别结果进行过滤处理,得到过滤结果;
根据所述过滤结果,并结合命名规则对所述第一图片命名后进行存档。
在一具体实施例中,使用字符串替换的方法,将目标内容识别结果中“/”,“\”等无法用于命名的字符串替换成“&”或其他可用于命名又易于识别的字符串,完成过滤处理,并生成过滤结果。其中,所述过滤结果即为最终的识别结果。
在一具体实施例中,所述根据所述过滤结果,并结合命名规则对所述第一图片命名,具体为:
所述命名规则包括:覆盖规则、前缀规则和后缀规则;
当所述命名规则为所述覆盖规则时,提取所述第一图片的后缀名,将所述第一图片命名为第一名称;其中,所述第一名称包括:所述过滤结果和所述后缀名;
当所述命名规则为所述前缀规则时,提取所述第一图片的原文件名,将所述第一图片命名为第二名称;其中,所述第二名称包括:所述过滤结果、分隔符和所述原文件名;
当所述命名规则为所述后缀规则时,提取所述第一图片的后缀名和原文件名,将所述第一图片命名为第三名称;其中,所述第三名称包括:所述原文件名、所述分隔符、所述过滤结果和所述后缀名。
其中,第一名称的形式为:过滤结果.所述后缀名;第二名称的形式为:过滤结果+分隔符+原文件名;第三名称的形式为:原文件名+分隔符+过滤结果.后缀名。
在一具体实施例中,还包括:
判断所述第一名称、所述第二名称或者所述第三名称是否与现有名称重合,若是,则更新所述第一名称、所述第二名称或者所述第三名称后进行存档;若否,则根据所述第一名称、所述第二名称或者所述第三名称直接存档。
具体地,若所述第一名称、所述第二名称或者所述第三名称是否与现有名称重合,则将所述第一名称、所述第二名称或者所述第三名称更新为:副本+第一名称/第二名称/第三名称,然后继续判断是否与现有名称重合,若是,则继续更新,直至与现有名称不重合,将最新名称作为文件名进行存档。其中,现有名称指,与第一图片同一路径下的所有文件名。
为了进一步说明提取目标单元格图片的过程,请参照图2至图10。
其中,图2是本发明一实施例提供的第一图片示意图,由图2可得,第一图片上有m行n列的网格。在本实施例中,m为20,n为10。
根据第一图片以及ROI区域的边界坐标(y1,y2,x1和x2),可得到第一区域图片,如图3所示,图3是本发明一实施例提供的第一区域图片位置示意图,第一区域图片的左上角为网格中的第3行、第2列个格子,右下角为网格中的第3行、第7列个格子。即L_row=3,L_col=2,R_row=3,R_col=7。所以根据ROI区域的边界坐标,能够完全包裹ROI区域,进而准确地得到第一区域图片。
找到第一区域图片的位置后,对第一图片进行提取得到第一区域图片,如图4所示,图4是本发明一实施例提供的第一区域图片示意图。由图4可得,第一区域图片中目标单元格的直线有明显倾斜。所以需要对第一区域图片进行倾斜矫正处理,以得到第二区域图片。
首先,对所述第一区域图片进行预处理,得到第一二值图;根据第一二值图进行横向识别并得到第一横向识别结果,如图5所示,图5是本发明一实施例提供的第一横向识别结果示意图。由图5可得,第一横向识别结果为目标单元格的横向直线,即为只包含横向直线信息的第一二值图。
对第一二值图进行倾斜矫正处理后,得到第二二值图,如图6所示,图6是本发明一实施例提供的第二二值图。根据第二二值图进行横向识别和纵向识别,分别得到第二横向识别结果和第二纵向识别结果,如图7和图8所示,图7是本发明一实施例提供的第二横向识别结果示意图,图8是本发明一实施例提供的第二纵向识别结果示意图。
对第二横向识别结果和第二纵向识别结果进行求交处理,即可得到目标单元格的坐标,如图9所示,图9是本发明一实施例提供的求交处理示意图。
根据目标单元格的坐标,便可从第二区域图片中提取目标单元格图片,如图10所示,图10是本发明一实施例提供的目标单元格图片示意图。由图10可得,目标单元格即为包含表格关键信息的单元格。
为了进一步扫描件存档装置,请参照图11,图11是本发明一实施例提供的一种扫描件存档装置的结构示意图,包括:获取模块1101、处理模块1102和存档模块1103。
其中,所述获取模块1101用于获取第一图片后,根据预设坐标从所述第一图片中获取第一区域图片;其中,所述第一图片为同类表格扫描件,所述第一区域图片为包含目标单元格的图片;
所述处理模块1102用于对所述第一区域图片进行倾斜矫正处理,得到第二区域图片后,对所述第二区域图片进行第一识别处理,得到所述目标单元格图片;
所述存档模块1103用于根据所述目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据所述目标内容识别结果对所述第一图片命名后进行存档。
本发明实施例先通过获取模块1101获取第一图片后,根据预设坐标从第一图片中获取第一区域图片;其中,第一图片为同类表格扫描件,第一区域图片为包含目标单元格的图片;再通过处理模块1102对第一区域图片进行倾斜矫正处理,得到第二区域图片后,对第二区域图片进行第一识别处理,得到目标单元格图片;最后通过存档模块1103根据目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据目标内容识别结果对第一图片命名后进行存档。
本发明实施例根据预设坐标,先从第一图片获取包含目标单元格的第一区域图片,然后对第一区域图片进行倾斜校正处理后进行第一识别处理,准确得到目标单元格图片后,对目标单元格图片进行第二识别处理,根据目标内容识别结果对第一图片命名后进行存档,能够准确得到每个同类表格扫描件的目标内容识别结果,并根据目标识别结果进行扫描件命名存档,能够提高扫描件命名的准确率。而不再像现有技术一样:需要在电脑上逐个打开、人工查找大量表格扫描件的目标单元格以及目标内容、人工根据目标内容对第一图片进行命名存档,工作强度、难度高,耗时长,工作人员极易因视觉疲劳与肌肉记忆效应导致命名错误,且出错误难以检查。而且,扫描件种类繁多,不同类型扫描件命名要求不同,人工命名容易混淆,错误率较高。所以本发明实施例提出的一种扫描件存档方法及装置,避免了人工干涉而导致的失误和难度,能够有效提高扫描件命名存档的准确性。
此外,相比于人工查找、命名和存档,本发明实施例提出的一种扫描件存档方法及装置对于同类表格扫描件,只需人工设置一次预设坐标,便可实现同类表格扫描件批量识别、命名和存档,有效降低了因为人为失误导致的命名错误,提高了效率。而且单个表格扫描件识别所需时间不到1秒,综合工况下,效率约为手工的50-100倍。
最后,可以通过多种命名规则,结合不同的预设坐标实现对同一表格扫描件的多种信息提取,提高了系统的柔性,能胜任各种复杂环境的识别及归档工作。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种扫描件存档方法,其特征在于,包括:
获取第一图片后,根据预设坐标从所述第一图片中获取第一区域图片;其中,所述第一图片为同类表格扫描件,所述第一区域图片为包含目标单元格的图片;
对所述第一区域图片进行倾斜矫正处理,得到第二区域图片后,对所述第二区域图片进行第一识别处理,得到所述目标单元格图片;
根据所述目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据所述目标内容识别结果对所述第一图片命名后进行存档。
2.根据权利要求1所述的一种扫描件存档方法,其特征在于,所述对所述第一区域图片进行倾斜矫正处理,具体为:
对所述第一区域图片进行预处理,得到第一二值图;
根据所述第一二值图进行横向识别并得到第一横向识别结果后,对所述第一横向识别结果进行霍夫变换,得到所述第一二值图中的第一直线及其斜率;
根据所述第一直线的斜率,计算得到第一角度;
当所述第一角度的绝对值大于第一预设数值时,对所述第一区域图片和所述第一二值图进行倾斜矫正处理,分别得到所述第二区域图片和第二二值图。
3.根据权利要求2所述的一种扫描件存档方法,其特征在于,所述对所述第二区域图片进行第一识别处理,得到所述目标单元格图片,具体为:
根据所述第二二值图进行横向识别和纵向识别,分别得到第二横向识别结果和第二纵向识别结果;
对所述第二横向识别结果和所述第二纵向识别结果进行求交处理,得到所述目标单元格的坐标;
根据所述目标单元格的坐标从所述第二区域图片中提取所述目标单元格图片,完成第一识别处理。
4.根据权利要求3所述的一种扫描件存档方法,其特征在于,所述根据所述目标内容识别结果对所述第一图片命名后进行存档,具体为:
根据字符串替换方法,对所述目标内容识别结果进行过滤处理,得到过滤结果;
根据所述过滤结果,并结合命名规则对所述第一图片命名后进行存档。
5.根据权利要求4所述的一种扫描件存档方法,其特征在于,所述根据所述过滤结果,并结合命名规则对所述第一图片命名,具体为:
所述命名规则包括:覆盖规则、前缀规则和后缀规则;
当所述命名规则为所述覆盖规则时,提取所述第一图片的后缀名,将所述第一图片命名为第一名称;其中,所述第一名称包括:所述过滤结果和所述后缀名;
当所述命名规则为所述前缀规则时,提取所述第一图片的原文件名,将所述第一图片命名为第二名称;其中,所述第二名称包括:所述过滤结果、分隔符和所述原文件名;
当所述命名规则为所述后缀规则时,提取所述第一图片的后缀名和原文件名,将所述第一图片命名为第三名称;其中,所述第三名称包括:所述原文件名、所述分隔符、所述过滤结果和所述后缀名。
6.根据权利要求5所述的一种扫描件存档方法,其特征在于,还包括:
判断所述第一名称、所述第二名称或者所述第三名称是否与现有名称重合,若是,则更新所述第一名称、所述第二名称或者所述第三名称后进行存档;若否,则根据所述第一名称、所述第二名称或者所述第三名称直接存档。
7.根据权利要求6所述的一种扫描件存档方法,其特征在于,所述根据预设坐标从所述第一图片中获取第一区域图片,具体为:
根据所述预设坐标,并结合图片分割法,对所述第一图片进行切割后提取所述第一区域图片。
8.根据权利要求7所述的一种扫描件存档方法,其特征在于,所述根据所述目标单元格图片进行第二识别处理,得到目标内容识别结果,具体为:
将所述目标单元格图片输入至光学字符识别服务器中,以使所述光学字符识别服务器对所述目标单元格图片进行第二识别处理并输出所述目标内容识别结果。
9.根据权利要求8所述的一种扫描件存档方法,其特征在于,所述获取第一图片,具体为:
获取初始图片,并将所述初始图片按照预设比例进行等比缩放后,得到预设像素图片;
在所述预设像素图片上设置m行n列的网格,得到所述第一图片并获取;其中,m和n均为正整数。
10.一种扫描件存档装置,其特征在于,包括:获取模块、处理模块和存档模块;
其中,所述获取模块用于获取第一图片后,根据预设坐标从所述第一图片中获取第一区域图片;其中,所述第一图片为同类表格扫描件,所述第一区域图片为包含目标单元格的图片;
所述处理模块用于对所述第一区域图片进行倾斜矫正处理,得到第二区域图片后,对所述第二区域图片进行第一识别处理,得到所述目标单元格图片;
所述存档模块用于根据所述目标单元格图片进行第二识别处理,得到目标内容识别结果,并根据所述目标内容识别结果对所述第一图片命名后进行存档。
CN202111247707.9A 2021-10-26 2021-10-26 一种扫描件存档方法及装置 Pending CN114064961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111247707.9A CN114064961A (zh) 2021-10-26 2021-10-26 一种扫描件存档方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111247707.9A CN114064961A (zh) 2021-10-26 2021-10-26 一种扫描件存档方法及装置

Publications (1)

Publication Number Publication Date
CN114064961A true CN114064961A (zh) 2022-02-18

Family

ID=80235519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111247707.9A Pending CN114064961A (zh) 2021-10-26 2021-10-26 一种扫描件存档方法及装置

Country Status (1)

Country Link
CN (1) CN114064961A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114821551A (zh) * 2022-04-27 2022-07-29 深圳元戎启行科技有限公司 遗留物检测以及模型训练方法、装置和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114821551A (zh) * 2022-04-27 2022-07-29 深圳元戎启行科技有限公司 遗留物检测以及模型训练方法、装置和存储介质

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
CN110516208B (zh) 一种针对pdf文档表格提取的系统及方法
US5048099A (en) Polygon-based method for automatic extraction of selected text in a digitized document
CN110032998B (zh) 自然场景图片的文字检测方法、系统、装置和存储介质
EP2572317B1 (en) Recognition of digital images
CN112115774A (zh) 结合rpa和ai的文字识别方法、装置、电子设备和存储介质
CN114004204B (zh) 基于计算机视觉的表格结构重建与文字提取方法和系统
JPH01253077A (ja) 文字列検出方法
CN112861736B (zh) 基于图像处理的文献表格内容识别与信息提取方法
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN112036294B (zh) 一种纸质表格结构自动识别的方法及装置
CN112949455A (zh) 一种增值税发票识别系统及方法
CN115618847B (zh) 一种解析pdf文档的方法、装置和可读存储介质
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
CN113177899A (zh) 医药影印件文本倾斜矫正方法、电子设备和可读储存介质
CN114121179B (zh) 化学结构式的提取方法及提取装置
CN116071774A (zh) 表格图像单元格行列信息索引方法、计算机装置及存储介质
CN101840499B (zh) 一种条码解码方法及其二值化方法
CN114064961A (zh) 一种扫描件存档方法及装置
CN117115840A (zh) 信息提取方法、装置、电子设备和介质
CN113901950A (zh) 一种高准确率的表格ocr识别方法及系统
CN114038000A (zh) 一种图像表格的结构化方法、系统和电子设备
CN110263597B (zh) 一种快速准确的qr码校正方法及系统
CN113837119A (zh) 一种基于灰度图像识别易混淆字符的方法及设备
CN113792677A (zh) 一种表格识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination