CN116434258A - 一种表格数据的自动识别方法 - Google Patents

一种表格数据的自动识别方法 Download PDF

Info

Publication number
CN116434258A
CN116434258A CN202310434915.2A CN202310434915A CN116434258A CN 116434258 A CN116434258 A CN 116434258A CN 202310434915 A CN202310434915 A CN 202310434915A CN 116434258 A CN116434258 A CN 116434258A
Authority
CN
China
Prior art keywords
text box
image
target terminal
terminal
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310434915.2A
Other languages
English (en)
Inventor
谌永庭
黄春霞
王勃
陈宁
陈丽云
肖继华
程凉
周勇
刘智才
黄鑫
周勉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hualian Century Engineering Consulting Co ltd
Original Assignee
Hualian Century Engineering Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hualian Century Engineering Consulting Co ltd filed Critical Hualian Century Engineering Consulting Co ltd
Priority to CN202310434915.2A priority Critical patent/CN116434258A/zh
Publication of CN116434258A publication Critical patent/CN116434258A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/95Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种表格数据的自动识别方法,涉及图像识别技术领域,包括:获取文档和CAD图纸等文件,并将所述文档和CAD图纸转化为图像格式;对各个图像识别终端的算力占用情况进行监测分析,选取算力充余系数KY最大的图像识别终端作为目标终端,对所述文档和CAD图纸转化的图像进行表格数据识别,从而提高数据识别效率;目标终端基于深度学习算法对所述文档和CAD图纸转化的图像进行文本框位置检测和文本框内容识别,获取所述图像中每个文本框的文本框位置信息,以及和每个文本框位置信息对应的文本框内容信息;基于所述文本框位置信息对所述文本框进行排序,输出经过排布后的所述图像的结构化文本信息;识别精度高。

Description

一种表格数据的自动识别方法
技术领域
本发明涉及图像识别技术领域,具体是一种表格数据的自动识别方法。
背景技术
CAD图纸中涉及大量表格,表格格式多样化,表格有边框无边框,少量边框等形式多样,自动识别表格是表格信息与图形信息联动的基础,对表格识别之前,需要先对文档进行版面分析,提取出文档中的表格,然后对表格进行定位,最后根据定位结果识别出表格中的文本。
在物体检测和定位方面,常用的技术有:边缘检测技术(canny边缘检测)和rcnn/faster-rcnn/yolo/ssd等技术;在OCR(光学字符识别)方面,主要技术有:基于监督学习的文字分类、cnn(卷积神经网络)和CRNN+CTC等;然而随着表格类别的增多,识别效率也会逐渐降低;如果样本集缺乏代表性和普遍性,这就会造成系统学习不到某些模式,最终导致模型对某些表格定位失败,基于以上不足,本发明提出一种表格数据的自动识别方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种表格数据的自动识别方法。
为实现上述目的,根据本发明的第一方面的实施例提出一种表格数据的自动识别方法,包括如下步骤:
步骤一:获取文档和CAD图纸等文件,并将所述文档和CAD图纸转化为图像格式,所述图像格式包括:jpg、png;
步骤二:对各个图像识别终端的算力占用情况进行监测分析,计算得到算力充余系数KY;选取算力充余系数KY最大的图像识别终端作为目标终端,对所述文档和CAD图纸转化的图像进行表格数据识别;
步骤三:目标终端对所述文档和CAD图纸转化的图像进行表格数据识别,具体识别步骤包括:
基于深度学习算法对所述文档和CAD图纸转化的图像进行文本框位置检测和文本框内容识别,获取所述图像中每个文本框的文本框位置信息,以及和每个文本框位置信息对应的文本框内容信息;
对所述图像中的表格整体单元格进行检测,检测出所述表格整体单元格的所有横线和所有竖线;基于检测出的所有横线和所有竖线获取所述表格整体单元格中所有小单元格的小单元格位置信息;
基于所述文本框位置信息和所述小单元格位置信息,判断所述文本框是否与所述小单元格相对应;
当判断出所述文本框与所述小单元格相对应时,基于所述文本框位置信息对所述文本框进行排序,获取排序后的文本框内容信息;
基于排序后的文本框内容信息确定所述表格整体单元格的内容排布,输出经过排布后的所述图像的结构化文本信息;
步骤四:对目标终端进行数据识别监测,对数据识别过程中目标终端的状态偏离值进行评估;若状态偏离值ZP大于预设偏离阈值,则生成偏离预警信号,以提醒管理人员对目标终端进行检修。
进一步地,对各个图像识别终端的算力占用情况进行监测分析,具体监测分析步骤包括:
从初始时刻起,按照预设间隔采集图像识别终端的算力占用率并标记为Nc,建立算力占用率Nc随时间变化的曲线图;
当曲线图处于上升阶段时,对曲线图进行求导获取占用率变化速率曲线图;将图像识别终端的实时算力占用率变化速率标记为Vt;
将Vt与预设速率阈值相比较;若Vt>预设速率阈值,则表示图像识别终端忙于数据识别,在对应的曲线图中截取对应的曲线段进行标注;
在预设时间内,统计标注曲线段的数量为R1,将所有的标注曲线段对时间进行积分得到标注参考能量WE,利用公式WR=R1×d1+WE×d2计算得到图像识别终端的运算热度值WR,其中d1、d2均为系数因子;
获取图像识别终端的当前算力占用率为Nt,利用公式KY=(1-Nt)×d3/(WR×d4)计算得到图像识别终端的算力充余系数KY,其中d3、d4均为系数因子。
进一步地,对目标终端进行数据识别监测,对数据识别过程中目标终端的状态偏离值进行评估,具体为:
当监测到目标终端进行表格数据识别时,每间隔R2时间采集目标终端的状态参数,状态参数包括访问节点连接数、CPU负载率、带宽负载率和实时网络速率;其中R2为预设值;
将访问节点连接数、CPU负载率、带宽负载率和实时网络速率依次标记为Q1、Q2、Q3、Q4;利用公式ZX=(Q1×b1+Q4×b4)/(Q2×b2+Q3×b3)计算得到目标终端的状态系数ZX,其中b1、b2、b3、b4为系数因子;
将状态系数ZX与设定阈值相比较,若状态系数ZX小于设定阈值,则生成偏离信号;根据偏离信号的时空变化趋势,计算得到状态偏离值ZP。
进一步地,状态偏离值ZP的具体计算方法为:
当监测到偏离信号时,自动倒计时,倒计时时长为Td时间,Td为预设值;在倒计时阶段继续对偏离信号进行监测,若再次监测到偏离信号,则倒计时自动归为原值,重新按照Td进行倒计时;
统计倒计时阶段偏离信号的出现次数为C1;当监测到偏离信号时,将对应的状态系数ZX与设定阈值进行差值计算,并将所有的差值进行求和得到偏离总值CT,统计倒计时阶段的持续时长为Tc;
利用公式ZP=(C1×b1+CT×b2)/(Tc×b3)计算得到状态偏离值ZP,其中b1、b2、b3为系数因子。
进一步地,对所述图像中的表格整体单元格进行检测,检测出所述表格整体单元格的所有横线和所有竖线;具体包括:
将所述图像进行归一化处理,使得所述图像调整为预定尺寸;
将调整后的所述图像转化为灰度模式,并进行腐蚀处理;
通过中值滤波过滤掉经过腐蚀处理的所述图像的噪声干扰;
分别确定所述图像的X方向和Y方向的梯度,并进行阈值化处理,通过霍夫直线检测初步筛选出所有横线和所有竖线;分别对筛选出的所有横线和所有竖线进行排序和合并处理。
进一步地,当判断出所述文本框与所述小单元格位置不完全重合时,分别计算所述文本框与所述小单元格的面积;
计算所述文本框与所述小单元格的交集面积与所述文本框与所述小单元格的并集面积的比值;当计算出的比值满足预设范围时,确定所述文本框与所述小单元格相对应。
与现有技术相比,本发明的有益效果是:
1、本发明中首先获取文档和CAD图纸等文件,并将文档和CAD图纸转化为图像格式;对各个图像识别终端的算力占用情况进行监测分析,计算得到算力充余系数KY;选取KY最大的图像识别终端作为目标终端,提高数据识别效率;当监测到目标终端进行表格数据识别时,每间隔R2时间采集目标终端的状态参数,对数据识别过程中目标终端的状态偏离值进行评估,若状态偏离值ZP大于预设偏离阈值,则生成偏离预警信号,以提醒管理人员对目标终端进行检修,从而提高数据识别效率;
2、本发明中目标终端对文档和CAD图纸转化的图像进行表格数据识别,首先基于深度学习算法对文档和CAD图纸转化的图像进行文本框位置检测和文本框内容识别,获取图像中每个文本框的文本框位置信息,以及和每个文本框位置信息对应的文本框内容信息;对图像中的表格整体单元格进行检测,检测出表格整体单元格的所有横线和所有竖线;基于检测出的所有横线和所有竖线获取表格整体单元格中所有小单元格的小单元格位置信息;当判断出文本框与小单元格相对应时,基于文本框位置信息对文本框进行排序,获取排序后的文本框内容信息;基于排序后的文本框内容信息确定表格整体单元格的内容排布,输出经过排布后的图像的结构化文本信息,识别精度高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种表格数据的自动识别方法的原理框图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种表格数据的自动识别方法,包括如下步骤:
步骤一:获取文档和CAD图纸等文件,并将文档和CAD图纸转化为图像格式,图像格式包括:jpg、png;
步骤二:对各个图像识别终端的算力占用情况进行监测分析,计算得到算力充余系数KY;选取算力充余系数KY最大的图像识别终端作为目标终端,对文档和CAD图纸转化的图像进行表格数据识别,提高数据识别效率;具体监测分析的过程如下:
从初始时刻起,按照预设间隔采集图像识别终端的算力占用率并标记为Nc,建立算力占用率Nc随时间变化的曲线图;
当曲线图处于上升阶段时,对曲线图进行求导获取占用率变化速率曲线图;将图像识别终端的实时算力占用率变化速率标记为Vt;
将Vt与预设速率阈值相比较;若Vt>预设速率阈值,则表示图像识别终端忙于数据识别,在对应的曲线图中截取对应的曲线段进行标注;
在预设时间内,统计标注曲线段的数量为R1,将所有的标注曲线段对时间进行积分得到标注参考能量WE,利用公式WR=R1×d1+WE×d2计算得到图像识别终端的运算热度值WR,其中d1、d2均为系数因子;
获取图像识别终端的当前算力占用率为Nt,利用公式KY=(1-Nt)×d3/(WR×d4)计算得到图像识别终端的算力充余系数KY,其中d3、d4均为系数因子;
本发明通过对各个图像识别终端的算力占用情况进行监测分析,能够选取算力充余系数KY最大的图像识别终端作为目标终端,对文档和CAD图纸转化的图像进行表格数据识别,有效提高数据识别效率;
步骤三:目标终端对文档和CAD图纸转化的图像进行表格数据识别,具体识别步骤包括:
基于深度学习算法对文档和CAD图纸转化的图像进行文本框位置检测和文本框内容识别,获取图像中每个文本框的文本框位置信息,以及和每个文本框位置信息对应的文本框内容信息;
本发明不同于传统OCR识别技术,采用了深度学习技术实现文本位置检测和文本内容识别,具体算法根据场景不同可进行调整。例如,为了提高检测速度,文本检测模型可采用DBNet,为了提高检测精度,文本检测模型可采用Yolo系列模型;对于文本识别,主要采用CRNN模型,为了提高识别速度,主干网络可采用MobileNet,为了提高识别精度,主干网络可采用ResNet。
对图像中的表格整体单元格进行检测,检测出表格整体单元格的所有横线和所有竖线;基于检测出的所有横线和所有竖线获取表格整体单元格中所有小单元格的小单元格位置信息;
基于文本框位置信息和小单元格位置信息,判断文本框是否与小单元格相对应;
当判断出文本框与小单元格相对应时,基于文本框位置信息对文本框进行排序,获取排序后的文本框内容信息;
基于排序后的文本框内容信息确定表格整体单元格的内容排布,输出经过排布后的图像的结构化文本信息;
步骤四:对目标终端进行数据识别监测,对数据识别过程中目标终端的状态偏离值进行评估,具体为:
当监测到目标终端进行表格数据识别时,每间隔R2时间采集目标终端的状态参数,状态参数包括访问节点连接数、CPU负载率、带宽负载率和实时网络速率;其中R2为预设值;
将访问节点连接数、CPU负载率、带宽负载率和实时网络速率依次标记为Q1、Q2、Q3、Q4;利用公式ZX=(Q1×b1+Q4×b4)/(Q2×b2+Q3×b3)计算得到目标终端的状态系数ZX,其中b1、b2、b3、b4为系数因子;
将状态系数ZX与设定阈值相比较,若状态系数ZX小于设定阈值,则生成偏离信号;根据偏离信号的时空变化趋势,计算得到状态偏离值ZP;
将状态偏离值ZP与预设偏离阈值相比较,若ZP大于预设偏离阈值,则生成偏离预警信号,以提醒管理人员对目标终端进行检修,从而提高数据识别效率;
其中,根据偏离信号的时空变化趋势,计算得到状态偏离值ZP,具体为:
当监测到偏离信号时,自动倒计时,倒计时时长为Td时间,Td为预设值;在倒计时阶段继续对偏离信号进行监测,若再次监测到偏离信号,则倒计时自动归为原值,重新按照Td进行倒计时;
统计倒计时阶段偏离信号的出现次数为C1;当监测到偏离信号时,将对应的状态系数ZX与设定阈值进行差值计算,并将所有的差值进行求和得到偏离总值CT,统计倒计时阶段的持续时长为Tc;
利用公式ZP=(C1×b1+CT×b2)/(Tc×b3)计算得到状态偏离值ZP,其中b1、b2、b3为系数因子;
在本实施例中,对图像中的表格整体单元格进行检测,检测出表格整体单元格的所有横线和所有竖线;具体包括:
将图像进行归一化处理,使得图像调整为预定尺寸;
将调整后的图像转化为灰度模式,并进行腐蚀处理;
通过中值滤波过滤掉经过腐蚀处理的图像的噪声干扰;
分别确定图像的X方向和Y方向的梯度,并进行阈值化处理,通过霍夫直线检测初步筛选出所有横线和所有竖线;分别对筛选出的所有横线和所有竖线进行排序和合并处理;
在本实施例中,该方法还包括:当判断出文本框与小单元格位置不完全重合时,分别计算文本框与小单元格的面积;
计算文本框与小单元格的交集面积与文本框与小单元格的并集面积的比值;当计算出的比值满足预设范围时,确定文本框与小单元格相对应。
上述公式均是去除量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最接近真实情况的一个公式,公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者大量数据模拟获得。
本发明的工作原理:
一种表格数据的自动识别方法,在工作时,首先获取文档和CAD图纸等文件,并将文档和CAD图纸转化为图像格式;对各个图像识别终端的算力占用情况进行监测分析,计算得到算力充余系数KY;选取KY最大的图像识别终端作为目标终端,对文档和CAD图纸转化的图像进行表格数据识别,提高数据识别效率;当监测到目标终端进行表格数据识别时,每间隔R2时间采集目标终端的状态参数,对数据识别过程中目标终端的状态偏离值进行评估,若状态偏离值ZP大于预设偏离阈值,则生成偏离预警信号,以提醒管理人员对目标终端进行检修,从而提高数据识别效率;
目标终端对文档和CAD图纸转化的图像进行表格数据识别,首先基于深度学习算法对文档和CAD图纸转化的图像进行文本框位置检测和文本框内容识别,获取图像中每个文本框的文本框位置信息,以及和每个文本框位置信息对应的文本框内容信息;对图像中的表格整体单元格进行检测,检测出表格整体单元格的所有横线和所有竖线;基于检测出的所有横线和所有竖线获取表格整体单元格中所有小单元格的小单元格位置信息;当判断出文本框与小单元格相对应时,基于文本框位置信息对文本框进行排序,获取排序后的文本框内容信息;基于排序后的文本框内容信息确定表格整体单元格的内容排布,输出经过排布后的图像的结构化文本信息,识别精度高。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (6)

1.一种表格数据的自动识别方法,其特征在于,包括如下步骤:
步骤一:获取文档和CAD图纸文件,并将所述文档和CAD图纸转化为图像格式,所述图像格式包括:jpg、png;
步骤二:对各个图像识别终端的算力占用情况进行监测分析,计算得到算力充余系数KY;选取算力充余系数KY最大的图像识别终端作为目标终端,对所述文档和CAD图纸转化的图像进行表格数据识别;
步骤三:目标终端对所述文档和CAD图纸转化的图像进行表格数据识别,具体识别步骤包括:
基于深度学习算法对所述文档和CAD图纸转化的图像进行文本框位置检测和文本框内容识别,获取所述图像中每个文本框的文本框位置信息,以及和每个文本框位置信息对应的文本框内容信息;
对所述图像中的表格整体单元格进行检测,检测出所述表格整体单元格的所有横线和所有竖线;基于检测出的所有横线和所有竖线获取所述表格整体单元格中所有小单元格的小单元格位置信息;
基于所述文本框位置信息和所述小单元格位置信息,判断所述文本框是否与所述小单元格相对应;当判断出所述文本框与所述小单元格相对应时,基于所述文本框位置信息对所述文本框进行排序,获取排序后的文本框内容信息;
基于排序后的文本框内容信息确定所述表格整体单元格的内容排布,输出经过排布后的所述图像的结构化文本信息;
步骤四:对目标终端进行数据识别监测,对数据识别过程中目标终端的状态偏离值进行评估;若状态偏离值ZP大于预设偏离阈值,则生成偏离预警信号,以提醒管理人员对目标终端进行检修。
2.根据权利要求1所述的一种表格数据的自动识别方法,其特征在于,对各个图像识别终端的算力占用情况进行监测分析,具体包括:
从初始时刻起,按照预设间隔采集图像识别终端的算力占用率并标记为Nc,建立算力占用率Nc随时间变化的曲线图;
当曲线图处于上升阶段时,对曲线图进行求导获取占用率变化速率曲线图;将图像识别终端的实时算力占用率变化速率标记为Vt;
将Vt与预设速率阈值相比较;若Vt>预设速率阈值,则表示图像识别终端忙于数据识别,在对应的曲线图中截取对应的曲线段进行标注;
在预设时间内,统计标注曲线段的数量为R1,将所有的标注曲线段对时间进行积分得到标注参考能量WE,利用公式WR=R1×d1+WE×d2计算得到图像识别终端的运算热度值WR,其中d1、d2均为系数因子;
获取图像识别终端的当前算力占用率为Nt,利用公式KY=(1-Nt)×d3/(WR×d4)计算得到图像识别终端的算力充余系数KY,其中d3、d4均为系数因子。
3.根据权利要求1所述的一种表格数据的自动识别方法,其特征在于,对数据识别过程中目标终端的状态偏离值进行评估,具体为:
当监测到目标终端进行表格数据识别时,每间隔R2时间采集目标终端的状态参数,状态参数包括访问节点连接数、CPU负载率、带宽负载率和实时网络速率;其中R2为预设值;
将访问节点连接数、CPU负载率、带宽负载率和实时网络速率依次标记为Q1、Q2、Q3、Q4;利用公式ZX=(Q1×b1+Q4×b4)/(Q2×b2+Q3×b3)计算得到目标终端的状态系数ZX,其中b1、b2、b3、b4为系数因子;
将状态系数ZX与设定阈值相比较,若状态系数ZX小于设定阈值,则生成偏离信号;根据偏离信号的时空变化趋势,计算得到状态偏离值ZP。
4.根据权利要求3所述的一种表格数据的自动识别方法,其特征在于,根据偏离信号的时空变化趋势,计算得到状态偏离值ZP;具体为:
当监测到偏离信号时,自动倒计时,倒计时时长为Td时间,Td为预设值;在倒计时阶段继续对偏离信号进行监测,若再次监测到偏离信号,则倒计时自动归为原值,重新按照Td进行倒计时;
统计倒计时阶段偏离信号的出现次数为C1;当监测到偏离信号时,将对应的状态系数ZX与设定阈值进行差值计算,并将所有的差值进行求和得到偏离总值CT,统计倒计时阶段的持续时长为Tc;
利用公式ZP=(C1×b1+CT×b2)/(Tc×b3)计算得到状态偏离值ZP,其中b1、b2、b3为系数因子。
5.根据权利要求1所述的一种表格数据的自动识别方法,其特征在于,对所述图像中的表格整体单元格进行检测,检测出所述表格整体单元格的所有横线和所有竖线;具体包括:
将所述图像进行归一化处理,使得所述图像调整为预定尺寸;
将调整后的所述图像转化为灰度模式,并进行腐蚀处理;
通过中值滤波过滤掉经过腐蚀处理的所述图像的噪声干扰;
分别确定所述图像的X方向和Y方向的梯度,并进行阈值化处理,通过霍夫直线检测初步筛选出所有横线和所有竖线;分别对筛选出的所有横线和所有竖线进行排序和合并处理。
6.根据权利要求5所述的一种表格数据的自动识别方法,其特征在于,当判断出所述文本框与所述小单元格位置不完全重合时,分别计算所述文本框与所述小单元格的面积;
计算所述文本框与所述小单元格的交集面积与所述文本框与所述小单元格的并集面积的比值;当计算出的比值满足预设范围时,确定所述文本框与所述小单元格相对应。
CN202310434915.2A 2023-04-21 2023-04-21 一种表格数据的自动识别方法 Pending CN116434258A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310434915.2A CN116434258A (zh) 2023-04-21 2023-04-21 一种表格数据的自动识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310434915.2A CN116434258A (zh) 2023-04-21 2023-04-21 一种表格数据的自动识别方法

Publications (1)

Publication Number Publication Date
CN116434258A true CN116434258A (zh) 2023-07-14

Family

ID=87085219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310434915.2A Pending CN116434258A (zh) 2023-04-21 2023-04-21 一种表格数据的自动识别方法

Country Status (1)

Country Link
CN (1) CN116434258A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117953533A (zh) * 2024-03-26 2024-04-30 北京鸿鹄云图科技股份有限公司 用于文档页面的高效提取方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111752361A (zh) * 2019-03-29 2020-10-09 北京比特大陆科技有限公司 算力自适应方法和装置、设备和存储介质及程序产品
US20210027485A1 (en) * 2019-07-24 2021-01-28 Squadle, Inc. Status monitoring using machine learning and machine vision
CN114445839A (zh) * 2021-12-23 2022-05-06 航天信息股份有限公司 一种用于对公文中表格内容进行识别的方法及系统
CN114882676A (zh) * 2022-07-12 2022-08-09 云南华尔贝光电技术有限公司 基于智能杆的多场景下智能监控预警方法及系统
CN115257889A (zh) * 2022-09-26 2022-11-01 长沙润伟机电科技有限责任公司 一种铁路调车用动态测距系统
CN115442375A (zh) * 2022-11-08 2022-12-06 深圳市亲邻科技有限公司 一种基于云边协同技术的物业数字化管理系统
CN115631351A (zh) * 2022-09-21 2023-01-20 山鹰国际控股股份公司 一种利用x射线对废散纸进行杂质识别的装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111752361A (zh) * 2019-03-29 2020-10-09 北京比特大陆科技有限公司 算力自适应方法和装置、设备和存储介质及程序产品
US20210027485A1 (en) * 2019-07-24 2021-01-28 Squadle, Inc. Status monitoring using machine learning and machine vision
CN114445839A (zh) * 2021-12-23 2022-05-06 航天信息股份有限公司 一种用于对公文中表格内容进行识别的方法及系统
CN114882676A (zh) * 2022-07-12 2022-08-09 云南华尔贝光电技术有限公司 基于智能杆的多场景下智能监控预警方法及系统
CN115631351A (zh) * 2022-09-21 2023-01-20 山鹰国际控股股份公司 一种利用x射线对废散纸进行杂质识别的装置
CN115257889A (zh) * 2022-09-26 2022-11-01 长沙润伟机电科技有限责任公司 一种铁路调车用动态测距系统
CN115442375A (zh) * 2022-11-08 2022-12-06 深圳市亲邻科技有限公司 一种基于云边协同技术的物业数字化管理系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YING-XUN LAI等: "multi-appliance recognition system with hybrid SVM/GMM classifier in ubiquitous smart home", 《INFORMATION SCIENCES》, vol. 230, pages 39 - 55, XP028981146, DOI: 10.1016/j.ins.2012.10.002 *
陆进威: "在线非侵入式负荷识别算法研究", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》, no. 2023, pages 042 - 1952 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117953533A (zh) * 2024-03-26 2024-04-30 北京鸿鹄云图科技股份有限公司 用于文档页面的高效提取方法及系统
CN117953533B (zh) * 2024-03-26 2024-05-28 北京鸿鹄云图科技股份有限公司 用于文档页面的高效提取方法及系统

Similar Documents

Publication Publication Date Title
CN106557764B (zh) 一种基于二进制编码字符水尺和图像处理的水位识别方法
CN109977808A (zh) 一种晶圆表面缺陷模式检测与分析方法
CN108711148B (zh) 一种基于深度学习的轮胎缺陷智能检测方法
CN105574550A (zh) 一种车辆识别方法及装置
CN111709465B (zh) 大坝安全监测数据粗差智能识别方法
CN110598693A (zh) 一种基于Faster-RCNN的船牌识别方法
CN111784633A (zh) 一种面向电力巡检视频的绝缘子缺损自动检测算法
CN113205063A (zh) 一种输电导线缺陷的视觉识别及定位方法
CN115019158B (zh) 一种基于图像识别的海洋污染区域识别方法及系统
CN116434258A (zh) 一种表格数据的自动识别方法
CN114140669A (zh) 焊接缺陷识别模型训练方法、装置和计算机终端
CN111461010B (zh) 一种基于模板跟踪的电力设备识别效率优化方法
CN115995056A (zh) 一种基于深度学习的桥梁病害自动识别方法
CN113203954A (zh) 一种基于时频图像处理的电池故障诊断方法
CN115294033A (zh) 一种基于语义分割网络的轮胎带束层差级和错边缺陷检测方法
CN112132088B (zh) 一种巡检点位漏巡识别方法
CN111563886A (zh) 基于非监督特征学习的隧道钢轨表面病害检测方法及装置
CN115830302A (zh) 一种多尺度特征提取融合配电网设备定位识别方法
CN110674827A (zh) 一种融合深度学习与形态学滤波的设备状态视觉检测方法
CN115106615A (zh) 一种基于工况智能识别的焊偏实时检测方法及系统
CN114581407A (zh) 一种光伏模块的自适应缺陷检测方法
CN114821617A (zh) 门窗洞的识别方法、装置、设备及可读存储介质
CN110084190B (zh) 一种基于ann的剧烈光照环境下实时非结构化道路检测方法
CN112966724B (zh) 一种图像单类别分类的方法及装置
CN117115175B (zh) 一种溢油在线监测预警方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230714