CN112926568A - 联锁表蓝图识别方法、装置、电子设备及存储介质 - Google Patents

联锁表蓝图识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112926568A
CN112926568A CN202110247225.7A CN202110247225A CN112926568A CN 112926568 A CN112926568 A CN 112926568A CN 202110247225 A CN202110247225 A CN 202110247225A CN 112926568 A CN112926568 A CN 112926568A
Authority
CN
China
Prior art keywords
word
picture
matching
recognized
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110247225.7A
Other languages
English (en)
Other versions
CN112926568B (zh
Inventor
肖登宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRSC Research and Design Institute Group Co Ltd
Original Assignee
CRSC Research and Design Institute Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CRSC Research and Design Institute Group Co Ltd filed Critical CRSC Research and Design Institute Group Co Ltd
Priority to CN202110247225.7A priority Critical patent/CN112926568B/zh
Publication of CN112926568A publication Critical patent/CN112926568A/zh
Application granted granted Critical
Publication of CN112926568B publication Critical patent/CN112926568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本申请公开了一种联锁表蓝图识别方法、装置、电子设备及存储介质。将联锁表图片按预设规则进行划分,得到至少一个待识别图片;确定与所述待识别图片对应的字库,以及获取所述字库中各字词对应的词语样本图;采用模板匹配法,对所述待识别图片和所述词语样本图进行匹配,确定所述待识别图片中的词语以及所述词语在所述待识别图片中的位置,并遍历所有待识别图片;根据针对各待识别图片确定的所述词语和所述词语在所述待识别图片中的位置,生成联锁表文件。通过上述技术方案,解决了现有技术中联锁表识别准确率低的问题,进而为后续联锁表的自动化测试提供了保障。

Description

联锁表蓝图识别方法、装置、电子设备及存储介质
技术领域
本申请实施例涉及图像识别技术,尤其涉及一种联锁表蓝图识别方法、装置、电子设备及存储介质。
背景技术
即便是在电子交互技术蓬勃发展的当今,纸质文档依旧作为传统信息保持与交流的重要媒介,在人们日常的生产与生活中发挥着重要作用。在铁路信号领域中,最为重要的纸质文档便是铁路信号施工蓝图,其中联锁表作为“两图一表”的重要组成部分,仍然是确定计算机联锁编制信息的交付性文档。
在联锁测试领域,需要将联锁表中的道岔、进路始终端按钮、信号机及其显示信号手工录入到计算机中生成电子表格,才能进行相关产品的自动化测试。需要大量的人工工时,且效率不高,当线路站场情况复杂时,存在一定程度的漏填错填的情况。
目前针对特定格式的文档自动识别算法研究较多,如邮政编码自动识别、快递单据识别、车牌识别等。但是,联锁表识别和通用用于普通打印白纸的打印字体识别有以下区别:部分联锁表字体粘黏;联锁表中的打印字体是上游单位(例如,铁路设计院)设定,只知道字体的型号不知道其他配置信息;在联锁表蓝图晒制过程中底噪大,例如采用的硫酸法晒制的蓝图字体边缘模糊。因此,导致联锁表的识别准确率低,进而影响后续联锁表的自动化测试。
发明内容
本申请提供一种联锁表蓝图识别方法、装置、电子设备及存储介质,以提高联锁表蓝图的识别准确率。
第一方面,本申请实施例提供了一种联锁表蓝图识别方法,所述方法包括:
将联锁表图片按预设规则进行划分,得到至少一个待识别图片;
确定与所述待识别图片对应的字库,以及获取所述字库中各字词对应的词语样本图;
采用模板匹配法,对所述待识别图片和所述词语样本图进行匹配,确定所述待识别图片中的词语以及所述词语在所述待识别图片中的位置,并遍历所有待识别图片;
根据针对各待识别图片确定的所述词语和所述词语在所述待识别图片中的位置,生成联锁表文件。
第二方面,本申请实施例还提供了一种联锁表蓝图识别装置,所述装置包括:
待识别图片得到模块,用于将联锁表图片按预设规则进行划分,得到至少
一个待识别图片;
词语样本图确定模块,用于确定与所述待识别图片对应的字库,以及获取所述字库中各字词对应的词语样本图;
词语和位置确定模块,用于采用模板匹配法,对所述待识别图片和所述词语样本图进行匹配,确定所述待识别图片中的词语以及所述词语在所述待识别图片中的位置,并遍历所有待识别图片;
联锁表文件生成模块,用于根据针对各待识别图片确定的所述词语和所述词语在所述待识别图片中的位置,生成联锁表文件。
第三方面,本申请实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请任一实施例所提供的联锁表蓝图识别方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请任一实施例所提供的联锁表蓝图识别方法。
本申请通过将联锁表图片按预设规则进行划分,得到至少一个待识别图片;确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图;采用模板匹配法,对待识别图片和词语样本图进行匹配,确定待识别图片中的词语以及词语在待识别图片中的位置,并遍历所有待识别图片;根据针对各待识别图片确定的词语和词语在待识别图片中的位置,生成联锁表文件。通过上述技术方案,解决了现有技术中联锁表识别准确率低的问题,为联锁表蓝图的识别提高了一种新思路,进而为后续联锁表的自动化测试提供了保障。
附图说明
图1为本申请实施例一提供的一种联锁表蓝图识别方法的流程图;
图2为本申请实施例二提供的一种联锁表蓝图识别方法的流程图;
图3为本申请实施例三提供的一种联锁表蓝图识别方法的流程图;
图4为本申请实施例四提供的一种联锁表蓝图识别装置的结构示意图;
图5为本申请实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
实施例一
图1为本申请实施例一提供的一种联锁表蓝图识别方法的流程图;本实施例可适用于联锁表蓝图识别的情况,该方法可以由联锁表蓝图识别装置来执行,该装置可采用硬件和/或软件的方式实现,并可集成于联锁表蓝图识别功能的电子设备中,例如电脑中等。
如图1所示,该方法具体可以包括:
S110、将联锁表图片按预设规则进行划分,得到至少一个待识别图片。
其中,联锁表是根据车站信号平面布置图所展示的线路、岔道、信号机、轨道区段等情况,表示出了进路、岔道、信号机之间的基本联锁内容。示例性的,联锁表以进路为主体,逐条地把排列进路需顺序按压的按钮、防护该进路的信号机名称和显示、进路要求检查并所比的岔道编号和位置、进路应检查的轨道区段名称以及与所排进路敌对的信号等填写清楚。具体的,联锁表可以是根据线路(例如进路)、排列进路按钮、岔道、信号机名称、轨道区段、显示、敌对信号、迎面进路-列车,迎面进路-调车等情况,按规定的原则和格式编制。
本实施例中,获取联锁表蓝图的扫描图片,对联锁表图片按预设规则进行划分,得到待识别图片。其中,预设规则是本领域技术人员根据实际情况设定的。具体的,将联锁表图片按列进行划分,得到至少一个待识别图片。
S120、确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图。
其中,字库包括但不限于固定的0-9字符字典、调车按钮和列车按钮字典、信号机名称字典、固定显示字典、标准道岔和指定带动道岔集合、敌对信号字典和条件道岔集合、轨道区段字典和和条件道岔集合和轨道区段字典。
对于字库的构建,首先,响应用户输入的信息,例如列车信号机名称(例如:XII)、调车信号机名称(例如:D10)列车按钮名称(例如:XIILA)调车按钮名称(例如D10A)、道岔名称(例如3,5/7)、区段名称(例如:17-29DG)、灯显示为固定显示字典(例如L、LU、U、UU、USU、B、L\L、L\LU\U、L/L、L/LU/U)、指定带动道岔(例如{(5/7)})、指定超限条件(例如:<6/8>78DG)。然后,对输入的信息进行预处理,例如,对敌对信号名称的预处理可以是给列车信号后加D或L以及调车信号名称后加L和列车信号名称全部还有调车信号名称一起构成敌对信号字典;又如,对岔道字符串的预处理可以是以下几种方式:
①将所有道岔名称外加括号,生成反位名称,例如3/5->(3/5);
②将所有正/反位名称前后加{}和[]生成带动名称和防护名称,以3/5举例则一个道岔有3/5,(3/5),{3/5},{(3/5)},[3/5],[(3/5)]六个名称,所有的道岔都如此处理为“标准道岔集合”;
③如果指定带动道岔(即以大括号包括的)则使用指定的带动道岔;
④将正/反位名称及双动道岔(名称中有/分隔的道岔)以“/”拆分成两个道岔,加“<>”符号,以3/5举例需要生成:“<3/5>,<(3/5),<3>,<(3)>,<5>,<(5)>”,所有道岔均按此处理为“条件道岔集合”。
需要说明的是,联锁表表格区域与字库的对应关系可以是:进路号码对应字库中的0-9字符字典;排列进路按钮对应字库中的调车按钮和列车按钮字典;信号机名称对应字库中的信号机名称字典;灯显示对应字库中的固定显示字典;道岔对应字库中的标准道岔和指定带动道岔集合;敌对信号对应字库中的敌对信号字典和条件道岔集合;轨道区段对应字库中的轨道区段字典和和条件道岔集合;迎面进路-列车和迎面进路-调车对应字库中的轨道区段字典。
本实施例中,确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图,可以通过如下方式:
首先,确定待识别图片的特征数据参数,其中特征数据参数包括:字体压缩比参数、字体间距参数、高斯参数、加深倍率参数和/或形态腐蚀参数。字体压缩比用于控制字体横向的胖瘦;字体间距参数用于控制字体与字体之间的间隔;高斯参数用于字体在晒制过程中的边缘模糊程度;加深倍率参数用于调整字体的亮度;形态腐蚀参数用于控制字体的粗细。
示例性地,待识别图片的特征数据参数的确定可通过以下几步完成:
第一步,从待识别图片中获取目标区域,进而获取目标区域的目标字符图片,采用匹配搜索方法,确定目标字符图片的单字拟合参数,其中,单字指单个字体的配置信息,包括但不限于目标单字压缩比、目标单字高斯参数、目标单字加深倍率参数和/或目标单字形态腐蚀参数。
具体的,获取晒制蓝图的图片,确定图片的目标区域;响应于字符串输入操作,生成字符串的标准图片;基于字符串,利用在预设区间中的各单字压缩比,生成与各单字压缩比对应的原始图片,作为原始图片集;针对原始图片集中的各原始图片,采用大致缩放比进行缩放,得到各缩放图片;从目标区域中获取目标字符图片,根据目标字符图片与各缩放图片的匹配结果确定最优图片;并将与最优图片对应的压缩比作为单字拟合参数中目标单字压缩比;在预设区间范围内,对最优图片和目标字符图片进行组合暴力匹配,得到匹配度最高的单字拟合参数中的目标单字高斯参数、目标单字加深倍率参数和/或目标单字形态腐蚀参数。
第二步,基于单字拟合参数,确定目标区域的特征参数范围,其中特征参数范围包括但不限于高斯参数范围、加深倍率参数范围、形态腐蚀参数范围、字体压缩比参数范围。
第三步,在目标区域的特征参数范围内,对最优图片和目标字符图片进行暴力匹配搜索,确定目标区域的特征参数,将目标区域的特征参数作为待识别区域的特征数据参数。
需要说明的是,对于同一本联锁表蓝图册,对蓝图特征数据参数的确定过程只进行一次。
然后,识别待识别图片在联锁表图片的列名称,根据列名称确定待识别图片对应的字库。具体的,获取待识别图片在联锁表图片的列名称(例如进路),相应的,确定待识别图片对应的字库(例如轨道区段字典)。
最后,根据特征数据参数和待识别图片对应的字库,确定字库中每一字词对应的词语样本图。具体的,利用Qt的字体图片引擎,结合特征数据参数,以及待识别图片对应的字库,确定字库中每一字词对应的词语样本图。
S130、采用模板匹配法,对待识别图片和词语样本图进行匹配,确定待识别图片中的词语以及词语在待识别图片中的位置,并遍历所有待识别图片。
本实施例中,针对每个待识别图片,采用模板匹配法,例如相似度匹配算法,对待识别图片和词语样本图进行匹配,确定待识别图片中的词语以及词语在待识别图片中的位置。
S140、根据针对各待识别图片确定的词语和词语在待识别图片中的位置,生成联锁表文件。
本实施例中,针对各待识别图片确定的词语和词语在待识别图片中的位置,以及待识别图片中填写在Excel表格文件中,生成联锁表文件。
本申请的技术方案,通过将联锁表图片按预设规则进行划分,得到至少一个待识别图片;确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图;采用模板匹配法,对待识别图片和词语样本图进行匹配,确定待识别图片中的词语以及词语在待识别图片中的位置,并遍历所有待识别图片;根据针对各待识别图片确定的词语和词语在待识别图片中的位置,生成联锁表文件。通过上述技术方案,解决了现有技术中联锁表识别准确率低的问题,为联锁表蓝图的识别提高了一种新思路,进而为后续联锁表的自动化测试提供了保障。
在上述技术方案的基础上,为了保证待识别图片中的文字更加清晰,对联锁表图片进行预处理操作。首先对联锁表图片进行角点选择,并进行仿射变换;然后对变换后的图片进行灰度变换;对灰度化处理后的图片进行线性滤波;将线性化后图片进行表格线提取,选取联锁表的列信息,生成对应的待识别图片。
示例性地,对联锁表图片进行线性滤波可以是:若联锁表图片为彩色图片,则将联锁表图片转换成灰度图片;利用最大类间差方法,对灰度图片进行处理,得到灰度图片的最大类间差灰度值、前景灰度值和背景灰度值;根据最大类间差灰度值、前景灰度值和背景灰度值,确定线性滤波的边界值;根据边界值,对灰度图片进行线性滤波。具体的,线性滤波的边界值可以通过如下公式计算:
Up=(2g+uO)/3;
Down=(g+u1)/2;
其中,Up表示线性滤波的上边界值,Down表示线性滤波的下边界值,g表示最大间类方差灰度值,u0表示前景平均灰度值,u1表示前景平均灰度值。
示例性地,若联锁表图片是倾斜的,对联锁表图片进行仿射变换。具体可以是:选择倾斜图片的四个顶点;以顶点作外接矩形;使用opencv中getPerspectiveTransform函数计算框选矩形和外接矩形的透射变换矩阵;使用opencv中透射变换函数warpPerspective对原图进行处理,并裁减图片至表格部分。
示例性地,线性化后图片进行表格线提取,具体可以是:对图片进行二值变化,其中,将分割边界值设定为128;使用Hough算法计算出所有表格线,其中,垂直筛选角度为95-85度,水平筛选角度为-5至5度;合并识别线,其中,标准为线间距差在20以内以及线角度在2度以内;检查表格的上下左右边线是否识别出,若否,则对未识别出的边线进行补边线处理;对这些边线进行排序,确定出待识别区域。
实施例二
图2为本申请实施例二提供的一种联锁表蓝图识别方法的流程图;在上述实施例的基础上,对“采用模板匹配法,对所述待识别图片和所述词语样本图进行匹配,确定所述待识别图片中的词语以及所述词语在所述待识别图片中的位置”进行了优化。
如图2所示,该方法具体可以包括:
S210、将联锁表图片按预设规则进行划分,得到至少一个待识别图片。
S220、确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图。
S230、针对词语样本图,采用模板匹配法对待识别图片和词语样本图进行匹配,得到词语匹配结果。
其中,词语匹配结果包括词语匹配结果图和词语匹配结果图中各像素点的匹配分数值。其中,匹配结果图是背景为黑色,其中有一些白色的点,白色的点的亮度越高,则说明该点的匹配分数值越高;匹配分数值用于表征词语样本图中的各像素点在待识别图片中的匹配度,匹配分数值越高,则该像素点所匹配到的待识别图片中的像素点的准确率越高,匹配分数值的数值范围是-1到1。
本实施例中,针对每个词语样本图,采用模板匹配法,对待识别图片和词语样本图进行匹配比对,得到匹配结果。
S240、若词语匹配结果图中各像素点的匹配分数值满足第一预设匹配规则,则确定匹配成功,并确定词语匹配结果图的内容为待识别图片中的词语,以及确定词语匹配结果图的位置为词语在待识别图片中的位置。
本实施例中,若词语结果图中个像素点的匹配分数值大于预设阈值,则确定匹配成功,并将该匹配结果图的内容,也就是样本图对应的词语,作为待识别图片中的词语,以及将匹配结果图中词语所在的位置,作为词语在待识别图片中的位置。
示例性地,若词语匹配结果图中各像素点的匹配分数值满足第一预设匹配规则,则确定匹配成功,可以通过以下四步实现:
第一步,若词语匹配结果图的各像素点中,最大极值点的匹配分数值大于第一预设阈值,则以最大极值点为中心,确定第一预设区域;其中,第一预设阈值是本领域技术人员根据实际情况确定的,例如第一预设阈值的取值范围可以是0.84-0.86。第一预设区域是该词语可能在待识别图片中的位置。
具体的,若词语匹配结果图的各像素点中,最大极值点的匹配分数值大于第一预设阈值,则以该最大极值点为中心,以字高的一半,来确定一个矩形区域,作为第一预设区域。
第二步,将第一预设区域内的匹配分数值大于第一预设阈值的像素点确定为第一临近点;其中,第一临近点的数量为至少一个。其中,第一预设阈值是本领域技术人员根据实际情况确定的。具体的,针对第一预设区域内的每个像素点,若该像素点的匹配分数值大于第一预设阈值,则将该像素点作为第一临近点。
第三步,将第一临近点的词语匹配分数值取倒数平均值,作为词语样本图的词语匹配评价值。其中,词语评价值用于评判词语与待识别图片的匹配程度。
第四步,若样本图的词语匹配评价值满足预设条件,则确定匹配成功。具体的,若样本图的词语匹配评价值大于预设评价值,则确定匹配成功,其中,预设评价值是本领域技术人员根据实际情况确定的。
在实际中,在待识别图片的同一位置处,可能出现多个词语样本图匹配成功,此时需要再次判断在待识别图片的该位置处,应该是多个样本图中的哪一个,例如在待识别图片的同一位置处,出现了词语样本图“138”、词语样本图“13”和词语样本图“18”都匹配成功的情况,此时,需要进一步判断该位置处,具体是哪一个词语样本图匹配成功。因此,为解决上述问题,作为本申请实施例的一种可选方式,计算匹配成功的多个词语样本图的第一邻近区域的相交面积,将该相交面积与匹配成功的多个词语样本图中的每个词语样本图的第一邻近区域的面积进行比较,若该相交面积大于任意一个词语样本图的第一邻近区域的面积的90%,则将该词语样本图作为候选词语样本图;计算候选词语样本图中每个词语样本图的候选匹配评价值;比较每个词语样本图的候选匹配评价值,将候选匹配评价值最高的词语样本图作为最终的词语样本图。
示例性地,计算候选词语样本图中,每个词语样本图的候选匹配评价值,可以是将词语样本图的词语匹配评价值与词语样本图中单字字数的设定次数方的乘积,作为词语样本图的候选匹配评价值。其中,设定次数方是本领域技术人员根据实际情况确定的,例如三分之一次方。
S250、根据针对各待识别图片确定的词语和词语在待识别图片中的位置,生成联锁表文件。
本申请的技术方案,通过针对词语样本图,采用模板匹配法对待识别图片和词语样本图进行匹配,得到词语匹配结果;其中,词语匹配结果包括词语匹配结果图和词语匹配结果图中各像素点的匹配分数值;若词语匹配结果图中各像素点的匹配分数值满足第一预设匹配规则,则确定匹配成功,并确定词语匹配结果图的内容为待识别图片中的词语,以及确定词语匹配结果图的位置为词语在待识别图片中的位置。通过上述技术方案,采用词语整体识别待识别图片中的词语以及位置,可以提高联锁表识别的速度以及准确度,进而为后续联锁表的自动化测试提供了保障。
实施例三
图3为本申请实施例三提供的一种联锁表蓝图识别方法的流程图;在上述实施例的基础上,对“若所述词语匹配结果图中各像素点的匹配分数值满足第一预设匹配规则,则确定匹配成功”进行了优化,以优化词语匹配的准确率。
如图3所示,该方法具体可以包括:
S310、将联锁表图片按预设规则进行划分,得到至少一个待识别图片。
S320、确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图。
S330、采用模板匹配法,对待识别图片和词语样本图进行匹配,确定待识别图片中的词语以及词语在待识别图片中的位置。
S340、将词语样本图进行单字拆分,得到单字样本图。
在词语匹配过程中,由于词语会出现大部分相同的情况,不确实是哪一词语,例如词语样本图是(13-57),由于13-57和(13-57)的大部分是相同的,不确定待识别图片中的词语是(13-57)还是13-57,从而使得匹配结果不够准确。因此,本实施例中,将词语样本进行单子拆分,确定出单字样本图,例如词语样本图(13-57)的单字样本图分别为“(”、“1”、“3”、“-”、“5”、“7”、“)”。
S350、针对单字样本图,采用模板匹配法对词语样本图和单字样本图进行匹配,得到单字匹配结果。
其中,单字匹配结果包括单字匹配结果图和单字匹配分数值。其中,单字匹配结果图是背景为黑色,其中有一些白色的点,白色的点的亮度越高,则说明该点的匹配分数值越高;单字匹配分数值用于表征单字样本图中的各像素点在词语样本图中的匹配度,匹配分数值越高,则该像素点所匹配到的词语样本图中的像素点的准确率越高,匹配分数值的数值范围是-1到1。
本实施例中,针对每个单字样本图,采用模板匹配法,对词语样本图和单字本图进行匹配比对,得到单字匹配结果。
S360、若单字匹配结果图中各像素点的单字匹配分数值满足第二预设匹配规则,则确定匹配成功,并确定单字匹配结果图的内容为词语样本图中的单字,以及确定单字匹配结果图的位置为单字在词语样本图中的位置。
示例性地,若单字匹配结果图中各像素点的单字匹配分数值满足第二预设匹配规则,则确定匹配成功,可以通过以下几步实现:
第一步,若单字匹配结果图的各像素点中,最大极值点的单字匹配分数值大于第二预设阈值,则以最大极值点为中心,确定第二预设区域;其中,第二预设阈值是该单字样本图所属的词语样本图中的词语匹配分数值确定的,具体是将词语匹配分数值与词语中单字的字数的设定次数方的乘积,作为标准值;将标准值与词语中单字的字数的设定次数方的商,再乘以0.8的结果作为第二预设阈值,其中,其中,设定次数方是本领域技术人员根据实际情况确定的,例如三分之一次方。第二预设区域是该单字可能在词语样本图的位置。
具体的,若单字匹配结果图的各像素点中,最大极值点的匹配分数值大于第二预设阈值,则以该最大极值点为中心,以设定高度和设定宽度,来确定一个矩形区域,作为第二预设区域,其中,设定高度和设定宽度是本领域技术人员根据实际需求设定的。
第二步,将第二预设区域内单字匹配分数值大于第二预设阈值的像素点确定为第二临近点;其中,第二临近点的数量为至少一个。其中,第二预设阈值是本领域技术人员根据实际情况确定的。具体的,针对第二预设区域内的每个像素点,若该像素点的匹配分数值大于第二预设阈值,则将该像素点作为第二临近点。
第三步,将第二临近点的单字匹配分数值取倒数平均值,作为单字样本图的单字匹配评价值;其中,单字词语评价值用于评判单字与词语样本图的匹配程度。
第四步,针对每一单字样本图,若单字样本图的单字匹配评价值大于词语样本图的词语匹配评价值的预设倍数,则确定单字样本图匹配成功,并保留该单字样本图。其中,预设倍数是本领域技术人员根据实际情况确定的,例如可以是0.75。
例如,词语样本图(13-57)中的“1”、“3”、“-”、“5”、“7”的单字匹配评价值大于词语样本图(13-57)的词语评价值的0.75倍,则保留单字“1”、“3”、“-”、“5”、“7”,则词语样本图在待识别图片中匹配成功的词语为13-57。
S370、根据针对各待识别图片确定的词语和词语在待识别图片中的位置,生成联锁表文件。
本申请的技术方案,通过将词语样本图进行单字拆分,得到单字样本图;针对单字样本图,采用模板匹配法对词语样本图和单字样本图进行匹配,得到单字匹配结果;其中,单字匹配结果包括单字匹配结果图和单字匹配分数值;若单字匹配结果图中各像素点的单字匹配分数值满足第二预设匹配规则,则确定匹配成功,并确定单字匹配结果图的内容为词语样本图中的单字,以及确定单字匹配结果图的位置为单字在词语样本图中的位置。通过上述技术方案,进一步确保了词语匹配的准确率,进而为后续联锁表的自动化测试提供了保障。
实施例四
图4为本申请实施例四提供了一种联锁表蓝图识别装置的结构示意图;本实施例可适用于联锁表蓝图识别的情况,该装置可采用硬件和/或软件的方式实现,并可集成于联锁表蓝图识别功能的电子设备中,例如电脑中等。
如图4所示,该装置包括待识别图片得到模块410、词语样本图确定模块420、词语和位置确定模块430和联锁表文件生成模块440,其中,
待识别图片得到模块410,用于将联锁表图片按预设规则进行划分,得到至少一个待识别图片;
词语样本图确定模块420,用于确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图;
词语和位置确定模块430,用于采用模板匹配法,对待识别图片和词语样本图进行匹配,确定待识别图片中的词语以及词语在待识别图片中的位置,并遍历所有待识别图片;
联锁表文件生成模块440,用于根据针对各待识别图片确定的词语和词语在待识别图片中的位置,生成联锁表文件。
本申请通过将联锁表图片按预设规则进行划分,得到至少一个待识别图片;确定与待识别图片对应的字库,以及获取字库中各字词对应的词语样本图;采用模板匹配法,对待识别图片和词语样本图进行匹配,确定待识别图片中的词语以及词语在待识别图片中的位置,并遍历所有待识别图片;根据针对各待识别图片确定的词语和词语在待识别图片中的位置,生成联锁表文件。通过上述技术方案,解决了现有技术中联锁表识别准确率低的问题,为联锁表蓝图的识别提高了一种新思路,进而为后续联锁表的自动化测试提供了保障。
进一步地,词语样本图确定模块420包括参数确定单元、字库确定单元和词语样本图确定单元,其中,
参数确定单元,用于确定待识别图片的特征数据参数;其中特征数据参数包括:字体压缩比参数、字体间距参数、高斯参数、加深倍率参数和/或形态腐蚀参数;
字库确定单元,用于识别待识别图片在联锁表图片的列名称,根据列名称确定待识别图片对应的字库;
词语样本图确定单元,用于根据特征数据参数和待识别图片对应的字库,确定字库中每一字词对应的词语样本图。
进一步地,词语和位置确定模块430包括词语匹配结果得到单元和词语和位置确定单元,其中,
词语匹配结果得到单元,用于针对词语样本图,采用模板匹配法对待识别图片和词语样本图进行匹配,得到词语匹配结果;其中,词语匹配结果包括词语匹配结果图和词语匹配结果图中各像素点的匹配分数值;
词语和位置确定单元,用于若词语匹配结果图中各像素点的匹配分数值满足第一预设匹配规则,则确定匹配成功,并确定词语匹配结果图的内容为待识别图片中的词语,以及确定词语匹配结果图的位置为词语在待识别图片中的位置。
进一步地,词语和位置确定单元包括第一预设区域确定子单元、第一临近点确定子单元、词语匹配评价值确定子单元和第一匹配成功确定子单元,其中,
第一预设区域确定子单元,用于若词语匹配结果图的各像素点中,最大极值点的匹配分数值大于第一预设阈值,则以最大极值点为中心,确定第一预设区域;
第一临近点确定子单元,用于将第一预设区域内的匹配分数值大于第一预设阈值的像素点确定为第一临近点;其中,第一临近点的数量为至少一个;
词语匹配评价值确定子单元,用于将第一临近点的词语匹配分数值取倒数平均值,作为词语样本图的词语匹配评价值;
第一匹配成功确定子单元,用于若样本图的词语匹配评价值满足预设条件,则确定匹配成功。
进一步地,词语和位置确定模块430还包括单字样本图得到单元、单字匹配结果得到单元以及单字和单字位置确定单元,其中,
单字样本图得到单元,用于将词语样本图进行单字拆分,得到单字样本图;
单字匹配结果得到单元,用于针对单字样本图,采用模板匹配法对词语样本图和单字样本图进行匹配,得到单字匹配结果;其中,单字匹配结果包括单字匹配结果图和单字匹配分数值;
单字和单字位置确定单元,用于若单字匹配结果图中各像素点的单字匹配分数值满足第二预设匹配规则,则确定匹配成功,并确定单字匹配结果图的内容为词语样本图中的单字,以及确定单字匹配结果图的位置为单字在词语样本图中的位置。
进一步地,单字和单字位置确定单元包括第二预设区域确定子单元、第二临近点确定子单元、单字匹配评价值确定子单元和第二匹配成功确定子单元,其中,
第二预设区域确定子单元,用于若单字匹配结果图的各像素点中,最大极值点的单字匹配分数值大于第二预设阈值,则以最大极值点为中心,确定第二预设区域;
第二临近点确定子单元,用于将第二预设区域内单字匹配分数值大于第二预设阈值的像素点确定为第二临近点;其中,第二临近点的数量为至少一个;
单字匹配评价值确定子单元,用于将第二临近点的单字匹配分数值取倒数平均值,作为单字样本图的单字匹配评价值;
第二匹配成功确定子单元,用于针对每一单字样本图,若单字样本图的单字匹配评价值大于词语样本图的词语匹配评价值的预设倍数,则确定单字样本图匹配成功,并保留该单字样本图。
进一步地,上述装置还包括灰度图片确定模块、处理模块、边界值确定模块和线性滤波模块,其中,
灰度图片确定模块,用于若联锁表图片为彩色图片,则将联锁表图片转换成灰度图片;
处理模块,用于利用最大类间差方法,对灰度图片进行处理,得到灰度图片的最大类间差灰度值、前景灰度值和背景灰度值;
边界值确定模块,用于根据最大类间差灰度值、前景灰度值和背景灰度值,确定线性滤波的边界值;
线性滤波模块,用于根据边界值,对灰度图片进行线性滤波。
上述联锁表蓝图识别装置可执行本申请任意实施例所提供的联锁表蓝图识别方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5为本申请实施例五提供的一种电子设备的结构示意图,图5示出了适于用来实现本申请实施例实施方式的示例性设备的框图。图5显示的设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请实施例各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请实施例所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的联锁表蓝图识别方法。
实施例六
本申请实施例六还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时用于执行本申请实施例所提供的联锁表蓝图识别方法。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请实施例进行了较为详细的说明,但是本申请实施例不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (10)

1.一种联锁表蓝图识别方法,其特征在于,所述方法包括:
将联锁表图片按预设规则进行划分,得到至少一个待识别图片;
确定与所述待识别图片对应的字库,以及获取所述字库中各字词对应的词语样本图;
采用模板匹配法,对所述待识别图片和所述词语样本图进行匹配,确定所述待识别图片中的词语以及所述词语在所述待识别图片中的位置,并遍历所有待识别图片;
根据针对各待识别图片确定的所述词语和所述词语在所述待识别图片中的位置,生成联锁表文件。
2.根据权利要求1所述的方法,其特征在于,确定与所述待识别图片对应的字库,以及获取所述字库中各字词对应的词语样本图,包括:
确定所述待识别图片的特征数据参数;其中所述特征数据参数包括:字体压缩比参数、字体间距参数、高斯参数、加深倍率参数和/或形态腐蚀参数;
识别待识别图片在所述联锁表图片的列名称,根据所述列名称确定所述待识别图片对应的字库;
根据所述特征数据参数和所述待识别图片对应的字库,确定所述字库中每一字词对应的词语样本图。
3.根据权利要求1所述的方法,其特征在于,采用模板匹配法,对所述待识别图片和所述词语样本图进行匹配,确定所述待识别图片中的词语以及所述词语在所述待识别图片中的位置,包括:
针对所述词语样本图,采用模板匹配法对所述待识别图片和所述词语样本图进行匹配,得到词语匹配结果;其中,所述词语匹配结果包括词语匹配结果图和所述词语匹配结果图中各像素点的匹配分数值;
若所述词语匹配结果图中各像素点的匹配分数值满足第一预设匹配规则,则确定匹配成功,并确定所述词语匹配结果图的内容为所述待识别图片中的词语,以及确定所述词语匹配结果图的位置为所述词语在所述待识别图片中的位置。
4.根据权利要求3所述的方法,其特征在于,若所述词语匹配结果图中各像素点的匹配分数值满足第一预设匹配规则,则确定匹配成功,包括:
若所述词语匹配结果图的各像素点中,最大极值点的匹配分数值大于第一预设阈值,则以所述最大极值点为中心,确定第一预设区域;
将所述第一预设区域内的匹配分数值大于所述第一预设阈值的像素点确定为第一临近点;其中,所述第一临近点的数量为至少一个;
将所述第一临近点的词语匹配分数值取倒数平均值,作为所述词语样本图的词语匹配评价值;
若所述样本图的词语匹配评价值满足预设条件,则确定匹配成功。
5.根据权利要求4所述的方法,其特征在于,在确定所述词语匹配结果图的内容为所述待识别图片中的词语,以及确定所述词语匹配结果图的位置为所述词语在所述待识别图片中的位置之后,所述方法还包括:
将所述词语样本图进行单字拆分,得到单字样本图;
针对所述单字样本图,采用模板匹配法对所述词语样本图和单字样本图进行匹配,得到单字匹配结果;其中,所述单字匹配结果包括单字匹配结果图和单字匹配分数值;
若所述单字匹配结果图中各像素点的单字匹配分数值满足第二预设匹配规则,则确定匹配成功,并确定所述单字匹配结果图的内容为所述词语样本图中的单字,以及确定所述单字匹配结果图的位置为所述单字在所述词语样本图中的位置。
6.根据权利要求5所述的方法,其特征在于,若所述单字匹配结果图中各像素点的单字匹配分数值满足第二预设匹配规则,则确定匹配成功,包括:
若所述单字匹配结果图的各像素点中,最大极值点的单字匹配分数值大于第二预设阈值,则以所述最大极值点为中心,确定第二预设区域;
将所述第二预设区域内单字匹配分数值大于所述第二预设阈值的像素点确定为第二临近点;其中,所述第二临近点的数量为至少一个;
将所述第二临近点的单字匹配分数值取倒数平均值,作为所述单字样本图的单字匹配评价值;
针对每一单字样本图,若单字样本图的单字匹配评价值大于所述词语样本图的词语匹配评价值的预设倍数,则确定单字样本图匹配成功,并保留该单字样本图。
7.根据权利要求1所述的方法,其特征在于,在将联锁表图片按预设规则进行划分,得到至少一个待识别图片之前,所述方法还包括:
若所述联锁表图片为彩色图片,则将所述联锁表图片转换成灰度图片;
利用最大类间差方法,对所述灰度图片进行处理,得到所述灰度图片的最大类间差灰度值、前景灰度值和背景灰度值;
根据所述最大类间差灰度值、所述前景灰度值和所述背景灰度值,确定线性滤波的边界值;
根据所述边界值,对所述灰度图片进行线性滤波。
8.一种联锁表蓝图识别装置,其特征在于,所述装置包括:
待识别图片得到模块,用于将联锁表图片按预设规则进行划分,得到至少一个待识别图片;
词语样本图确定模块,用于确定与所述待识别图片对应的字库,以及获取所述字库中各字词对应的词语样本图;
词语和位置确定模块,用于采用模板匹配法,对所述待识别图片和所述词语样本图进行匹配,确定所述待识别图片中的词语以及所述词语在所述待识别图片中的位置,并遍历所有待识别图片;
联锁表文件生成模块,用于根据针对各待识别图片确定的所述词语和所述词语在所述待识别图片中的位置,生成联锁表文件。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的联锁表蓝图识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的联锁表蓝图识别方法。
CN202110247225.7A 2021-03-05 2021-03-05 联锁表蓝图识别方法、装置、电子设备及存储介质 Active CN112926568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110247225.7A CN112926568B (zh) 2021-03-05 2021-03-05 联锁表蓝图识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110247225.7A CN112926568B (zh) 2021-03-05 2021-03-05 联锁表蓝图识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112926568A true CN112926568A (zh) 2021-06-08
CN112926568B CN112926568B (zh) 2024-02-13

Family

ID=76171673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110247225.7A Active CN112926568B (zh) 2021-03-05 2021-03-05 联锁表蓝图识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112926568B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114359023A (zh) * 2022-01-10 2022-04-15 成都智元汇信息技术股份有限公司 基于复杂度将图片分流调度到中心的方法、设备及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065146A (zh) * 2012-12-24 2013-04-24 广东电网公司电力调度控制中心 用于电力通信机房哑设备标识牌的文字识别方法
CN109766885A (zh) * 2018-12-29 2019-05-17 北京旷视科技有限公司 一种文字检测方法、装置、电子设备及存储介质
CN112329641A (zh) * 2020-11-06 2021-02-05 上海恒生聚源数据服务有限公司 一种表格识别方法、装置、设备及可读存储介质
CN112364862A (zh) * 2020-12-08 2021-02-12 杭州电子科技大学 一种基于直方图相似度的扰动变形汉字图片匹配的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065146A (zh) * 2012-12-24 2013-04-24 广东电网公司电力调度控制中心 用于电力通信机房哑设备标识牌的文字识别方法
CN109766885A (zh) * 2018-12-29 2019-05-17 北京旷视科技有限公司 一种文字检测方法、装置、电子设备及存储介质
CN112329641A (zh) * 2020-11-06 2021-02-05 上海恒生聚源数据服务有限公司 一种表格识别方法、装置、设备及可读存储介质
CN112364862A (zh) * 2020-12-08 2021-02-12 杭州电子科技大学 一种基于直方图相似度的扰动变形汉字图片匹配的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114359023A (zh) * 2022-01-10 2022-04-15 成都智元汇信息技术股份有限公司 基于复杂度将图片分流调度到中心的方法、设备及系统
CN114359023B (zh) * 2022-01-10 2022-11-18 成都智元汇信息技术股份有限公司 基于复杂度将图片分流调度到中心的方法、设备及系统

Also Published As

Publication number Publication date
CN112926568B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
WO2020259060A1 (zh) 试卷信息提取方法、系统及计算机可读存储介质
US6754385B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
CN110942074B (zh) 字符切分识别方法、装置、电子设备、存储介质
CN113158808B (zh) 中文古籍字符识别、组段与版面重建方法、介质和设备
CN108509881A (zh) 一种无切分的脱机手写汉字文本识别方法
JPH0652354A (ja) スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置
US11893765B2 (en) Method and apparatus for recognizing imaged information-bearing medium, computer device and medium
CN110598703B (zh) 一种基于深度神经网络的ocr识别方法及装置
Al-Badr et al. Segmentation-free word recognition with application to Arabic
CN113705576B (zh) 一种文本识别方法、装置、可读存储介质及设备
CN112364834A (zh) 一种基于深度学习和图像处理的表格识别的还原方法
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质
CN113780276A (zh) 一种结合文本分类的文本检测和识别方法及系统
CN112926568A (zh) 联锁表蓝图识别方法、装置、电子设备及存储介质
CN113887375A (zh) 一种文本识别方法、装置、设备及存储介质
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
CN116343237A (zh) 基于深度学习和知识图谱的票据识别方法
CN111832551A (zh) 文本图像处理方法、装置、电子扫描设备和存储介质
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
Maity et al. An approach for detecting circular callouts in architectural, engineering and constructional drawing documents
CN113792780B (zh) 基于深度学习和图像后处理的集装箱号识别方法
CN111103987B (zh) 公式录入方法及计算机存储介质
CN112183538B (zh) 一种满文识别方法及系统
CN115410209B (zh) 一种基于图像处理的煤矿工单识别方法
CN114118010A (zh) 一种文件转换方法、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant