CN116090422A - 一种电力业扩表单的录入方法及装置 - Google Patents
一种电力业扩表单的录入方法及装置 Download PDFInfo
- Publication number
- CN116090422A CN116090422A CN202211667482.7A CN202211667482A CN116090422A CN 116090422 A CN116090422 A CN 116090422A CN 202211667482 A CN202211667482 A CN 202211667482A CN 116090422 A CN116090422 A CN 116090422A
- Authority
- CN
- China
- Prior art keywords
- expansion
- identified
- information
- expansion form
- power business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 230000011218 segmentation Effects 0.000 claims description 40
- 238000012549 training Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000003709 image segmentation Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000011084 recovery Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 6
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种电力业扩表单的录入方法及装置,方法包括:获取待识别电力业扩表单;提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。通过训练后的表单识别模型对电力业扩表单进行快速识别,解决现有的电力业表单录入时不能实现快速智能录入的问题。
Description
技术领域
本发明涉及OCR系统技术技域,尤其涉及一种电力业扩表单的录入方法及装置。
背景技术
电力业扩表单主要为用电申请客户办理的纸质资料,由客户手工填写,表单类别包括:客户身份证明资料、物业权属证明材料、用电业务申请表、高压客户现场勘查情况表、供电方案协议、客户受电工程竣工检验意见书、装拆工作单及接电确认书等。
现阶段电力业扩表单的录入过程有填写、拍照及扫描等大量需要用户手动操作的环节,导致录入效率低。
发明内容
本发明提供了一种电力业扩表单的录入方法及装置,通过训练后的表单识别模型对电力业扩表单进行快速识别,解决现有的电力业表单录入时不能实现快速智能录入的问题。
第一方面,本发明提供的一种电力业扩表单的录入方法,包括:
获取待识别电力业扩表单;
提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;
将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;
根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;
按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。
可选地,提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息,包括:
对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单;
对所述划分后的扩表单进行字符切割及字符识别,得到所述文字信息;
对所述划分后的扩表单进行版面恢复,并根据所述文字信息的上下文关系,对所述文字信息进行校对。
可选地,提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息,包括:
对所述表格结构信息进行图像分割,得到多个扩表单分割图;
分别对所述扩表单分割图进行拟合折线并合并形成框线,得到校正后的分割图,并基于所述框线,对所述扩表单分割图中的单元进行合并,得到所述表格结构信息;
调用OCR识别所述校正后的分割图中的文本信息及所述文本信息中每个字符的坐标信息;
将所述坐标信息和所述表格结构信息匹配,确定所述表格内容信息。
可选地,对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单之前,还包括:
预处理所述待识别电力业扩表单。
可选地,所述表单识别模型的构建方法包括:
从预先构建的扩表单数据库中获取扩表单训练样本,所述扩表单训练样本包括样本扩表单图片及对应的扩表单类别标签;
基于所述样本扩表单图片及对应的扩表单类别标签,构建所述表单识别模型。
第二方面,本发明还提供了一种电力业扩表单的录入装置,包括:
获取模块,用于获取待识别电力业扩表单;
提取模块,用于提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;
输入模块,用于将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;
表单标签确定模块,用于根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;
录入模块,用于按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。
可选地,所述提取模块包括:
版面分析子模块,用于对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单;
文字信息确定子模块,用于对所述划分后的扩表单进行字符切割及字符识别,得到所述文字信息;
校对模块,用于对所述划分后的扩表单进行版面恢复,并根据所述文字信息的上下文关系,对所述文字信息进行校对。
可选地,所述提取模块包括:
图像分割子模块,用于对所述表格结构信息进行图像分割,得到多个扩表单分割图;
表格结构信息确定子模块,用于分别对所述扩表单分割图进行拟合折线并合并形成框线,得到校正后的分割图,并基于所述框线,对所述扩表单分割图中的单元进行合并,得到所述表格结构信息;
坐标信息确定子模块,用于调用OCR识别所述校正后的分割图中的文本信息及所述文本信息中每个字符的坐标信息;
表格内容信息确定子模块,用于将所述坐标信息和所述表格结构信息匹配,确定所述表格内容信息。
可选地,还包括:
预处理模块,用于预处理所述待识别电力业扩表单。
可选地,还包括:模型构建模块,所述模型构建模块包括:
样本获取子模块,用于从预先构建的扩表单数据库中获取扩表单训练样本,所述扩表单训练样本包括样本扩表单图片及对应的扩表单类别标签;
模型构建子模块,用于基于所述样本扩表单图片及对应的扩表单类别标签,构建所述表单识别模型
本申请第三方面提供了一种电子设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所述的电力业扩表单的录入方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的电力业扩表单的录入方法。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过获取待识别电力业扩表单;提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。通过训练后的表单识别模型对电力业扩表单进行快速识别,解决现有的电力业表单录入时不能实现快速智能录入的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图;
图1为本发明的一种电力业扩表单的录入方法实施例一的步骤流程图;
图2为本发明的一种电力业扩表单的录入方法实施例二的步骤流程图;
图3为本发明的一种电力业扩表单的录入装置实施例的结构框图。
具体实施方式
本发明实施例提供了一种电力业扩表单的录入方法及装置,通过训练后的神经网络模型对电力业扩表单进行快速识别,解决现有的电力业表单录入时不能实现快速智能录入的问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明的一种电力业扩表单的录入方法实施例一的步骤流程图,具体可以包括如下步骤:
S101,获取待识别电力业扩表单;
S102,提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;
S103,将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;
S104,根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;
S105,按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。
本发明实施例通过获取待识别电力业扩表单;提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。通过训练后的表单识别模型对电力业扩表单进行快速识别,解决现有的电力业表单录入时不能实现快速智能录入的问题。
请参阅图2,为本发明的一种电力业扩表单的录入方法实施例二的步骤流程图,具体包括:
步骤S201,获取待识别电力业扩表单;
在本发明实施例中,通过高速扫描仪,对电力业扩表单资料进行高速扫描,得到文件格式为.pdf或.jpg的待识别电力业扩表单。
步骤S202,对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单;
在一个可选实施例中,对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单之前,还包括:
预处理所述待识别电力业扩表单。
在本发明实施例中,预处理步骤包括二值化处理、噪声去除处理及倾斜校正处理等。
其中,二值化处理即只保留待识别电力业扩表单的前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色。
噪声去除处理即根据燥声的特征,进行待识别电力业扩表单去燥。
而另外,由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要进行较正。
在本发明实施例中,在对待识别电力业扩表单进行预处理后,即可对其进行版面分析,即将待识别电力业扩表单的内容进行分行分段,得到划分后的扩表单。
步骤S203,对所述划分后的扩表单进行字符切割及字符识别,得到所述文字信息;
在本发明实施中,划分后的扩表单也不能避免其中内容的字符粘连或断笔情况,因此需要进行字符切割和字符识别。
需要说明的是,字符识别包括字符模板匹配和字符特征提取等方法,本发明实施例在此不做限制。
步骤S204,对所述划分后的扩表单进行版面恢复,并根据所述文字信息的上下文关系,对所述文字信息进行校对;
为了使得提取后的待识别电力业扩表单的段落和位置不受影响,在提取完成后,进行版面恢复,并对提取结果进行校正。
步骤S205,对所述表格结构信息进行图像分割,得到多个扩表单分割图;
步骤S206,分别对所述扩表单分割图进行拟合折线并合并形成框线,得到校正后的分割图,并基于所述框线,对所述扩表单分割图中的单元进行合并,得到所述表格结构信息;
步骤S207,调用OCR识别所述校正后的分割图中的文本信息及所述文本信息中每个字符的坐标信息;
步骤S208,将所述坐标信息和所述表格结构信息匹配,确定所述表格内容信息;
在本发明实施例中,对表格结构信息应用深度学习进行图像分割,得到多个扩表单分割图,其中,分割的目的是对表格线部分进行标注:横向的线,竖向的线,横向的不可见线,以及竖向的不可见线。对扩表单分割图分别拟合折线再合并形成框线,使用投影变换进行校正,使得横框线校至水平,竖框线校至竖直,同时,对校正后的分割图调用OCR,识别其中的文本信息,以及每个字符的坐标。根据框线,对扩表单分割图中的单元进行合并,得到所述表格结构信息。最后,将表格结构信息,与字符坐标信息进行匹配,从而确定表格内信息。
步骤S209,将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;
在一个可选实施例中,所述表单识别模型的构建方法包括:
从预先构建的扩表单数据库中获取扩表单训练样本,所述扩表单训练样本包括样本扩表单图片及对应的扩表单类别标签;
基于所述样本扩表单图片及对应的扩表单类别标签,构建所述表单识别模型。
在本发明实施例中,对于表单识别模型所涉及的扩表单训练样本,可采用大量的人造数据进行预训练,以及在预训练的基础上,用标注数据进行训练。
步骤S210,根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;
在本发明实施例中,在文字信息识别的基础上,结合表单预测类型进行实体/要素识别和关系抽取,确定待识别电力业扩表单对应的表单标签。
步骤S211,按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。
在本发明实施例中,存储方式可以是Excel表格存储等。
在本发明实施例所提供的一种电力业扩表单的录入方法,通过获取待识别电力业扩表单;提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。通过训练后的表单识别模型对电力业扩表单进行快速识别,解决现有的电力业表单录入时不能实现快速智能录入的问题。
请参阅图3,示出了一种电力业扩表单的录入装置实施例的结构框图,包括如下模块:
获取模块301,用于获取待识别电力业扩表单;
提取模块302,用于提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;
输入模块303,用于将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;
表单标签确定模块304,用于根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;
录入模块305,用于按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。
在一个可选实施例中,所述提取模块302包括:
版面分析子模块,用于对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单;
文字信息确定子模块,用于对所述划分后的扩表单进行字符切割及字符识别,得到所述文字信息;
校对模块,用于对所述划分后的扩表单进行版面恢复,并根据所述文字信息的上下文关系,对所述文字信息进行校对。
在一个可选实施例中,所述提取模块302包括:
图像分割子模块,用于对所述表格结构信息进行图像分割,得到多个扩表单分割图;
表格结构信息确定子模块,用于分别对所述扩表单分割图进行拟合折线并合并形成框线,得到校正后的分割图,并基于所述框线,对所述扩表单分割图中的单元进行合并,得到所述表格结构信息;
坐标信息确定子模块,用于调用OCR识别所述校正后的分割图中的文本信息及所述文本信息中每个字符的坐标信息;
表格内容信息确定子模块,用于将所述坐标信息和所述表格结构信息匹配,确定所述表格内容信息。
在一个可选实施例中,还包括:
预处理模块,用于预处理所述待识别电力业扩表单。
在一个可选实施例中,还包括:模型构建模块,所述模型构建模块包括:
样本获取子模块,用于从预先构建的扩表单数据库中获取扩表单训练样本,所述扩表单训练样本包括样本扩表单图片及对应的扩表单类别标签;
模型构建子模块,用于基于所述样本扩表单图片及对应的扩表单类别标签,构建所述表单识别模型
本申请还提供了一种电子设备,设备包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行上述方法实施例中的电力业扩表单的录入方法。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述方法实施例中的电力业扩表单的录入方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种电力业扩表单的录入方法,其特征在于,包括:
获取待识别电力业扩表单;
提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;
将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;
根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;
按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。
2.根据权利要求1所述的电力业扩表单的录入方法,其特征在于,提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息,包括:
对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单;
对所述划分后的扩表单进行字符切割及字符识别,得到所述文字信息;
对所述划分后的扩表单进行版面恢复,并根据所述文字信息的上下文关系,对所述文字信息进行校对。
3.根据权利要求2所述的电力业扩表单的录入方法,其特征在于,提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息,包括:
对所述表格结构信息进行图像分割,得到多个扩表单分割图;
分别对所述扩表单分割图进行拟合折线并合并形成框线,得到校正后的分割图,并基于所述框线,对所述扩表单分割图中的单元进行合并,得到所述表格结构信息;
调用OCR识别所述校正后的分割图中的文本信息及所述文本信息中每个字符的坐标信息;
将所述坐标信息和所述表格结构信息匹配,确定所述表格内容信息。
4.根据权利要求2所述的电力业扩表单的录入方法,其特征在于,对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单之前,还包括:
预处理所述待识别电力业扩表单。
5.根据权利要求1所述的电力业扩表单的录入方法,其特征在于,所述表单识别模型的构建方法包括:
从预先构建的扩表单数据库中获取扩表单训练样本,所述扩表单训练样本包括样本扩表单图片及对应的扩表单类别标签;
基于所述样本扩表单图片及对应的扩表单类别标签,构建所述表单识别模型。
6.一种电力业扩表单的录入装置,其特征在于,包括:
获取模块,用于获取待识别电力业扩表单;
提取模块,用于提取所述待识别电力业扩表单的文字信息、表格结构信息及表格内容信息;
输入模块,用于将所述文字信息、所述表格结构信息及所述表格内容信息输入预先训练后的表单识别模型中,得到所述待识别电力业扩表单对应的表单预测类型;
表单标签确定模块,用于根据所述表单预测类型和所述文字信息,对所述待识别电力业扩表单进行要素识别和关系抽取,确定所述待识别电力业扩表单对应的表单标签;
录入模块,用于按照录入指令中的存储方式,将所述待识别电力业扩表单、所述表单预测类型及所述表单标签录入。
7.根据权利要求6所述的电力业扩表单的录入装置,其特征在于,所述提取模块包括:
版面分析子模块,用于对所述待识别电力业扩表单进行版面分析,得到划分后的扩表单;
文字信息确定子模块,用于对所述划分后的扩表单进行字符切割及字符识别,得到所述文字信息;
校对模块,用于对所述划分后的扩表单进行版面恢复,并根据所述文字信息的上下文关系,对所述文字信息进行校对。
8.根据权利要求7所述的电力业扩表单的录入装置,其特征在于,所述提取模块包括:
图像分割子模块,用于对所述表格结构信息进行图像分割,得到多个扩表单分割图;
表格结构信息确定子模块,用于分别对所述扩表单分割图进行拟合折线并合并形成框线,得到校正后的分割图,并基于所述框线,对所述扩表单分割图中的单元进行合并,得到所述表格结构信息;
坐标信息确定子模块,用于调用OCR识别所述校正后的分割图中的文本信息及所述文本信息中每个字符的坐标信息;
表格内容信息确定子模块,用于将所述坐标信息和所述表格结构信息匹配,确定所述表格内容信息。
9.根据权利要求7所述的电力业扩表单的录入装置,其特征在于,还包括:
预处理模块,用于预处理所述待识别电力业扩表单。
10.根据权利要求6所述的电力业扩表单的录入装置,其特征在于,还包括:模型构建模块,所述模型构建模块包括:
样本获取子模块,用于从预先构建的扩表单数据库中获取扩表单训练样本,所述扩表单训练样本包括样本扩表单图片及对应的扩表单类别标签;
模型构建子模块,用于基于所述样本扩表单图片及对应的扩表单类别标签,构建所述表单识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211667482.7A CN116090422A (zh) | 2022-12-23 | 2022-12-23 | 一种电力业扩表单的录入方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211667482.7A CN116090422A (zh) | 2022-12-23 | 2022-12-23 | 一种电力业扩表单的录入方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116090422A true CN116090422A (zh) | 2023-05-09 |
Family
ID=86186094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211667482.7A Pending CN116090422A (zh) | 2022-12-23 | 2022-12-23 | 一种电力业扩表单的录入方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116090422A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257396A (zh) * | 2020-10-20 | 2021-01-22 | 浪潮云信息技术股份公司 | 一种基于人工智能技术的手机端辅助填表方法 |
CN112528863A (zh) * | 2020-12-14 | 2021-03-19 | 中国平安人寿保险股份有限公司 | 表格结构的识别方法、装置、电子设备及存储介质 |
CN112686168A (zh) * | 2020-12-30 | 2021-04-20 | 北京三快在线科技有限公司 | 自动录入表单的方法、装置、电子设备及存储介质 |
CN113569840A (zh) * | 2021-08-31 | 2021-10-29 | 平安医疗健康管理股份有限公司 | 基于自注意力机制的表单识别方法、装置及存储介质 |
CN114356115A (zh) * | 2021-12-31 | 2022-04-15 | 阿里巴巴(中国)有限公司 | 智能录入表单的方法、电子设备及计算机可读存储介质 |
-
2022
- 2022-12-23 CN CN202211667482.7A patent/CN116090422A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257396A (zh) * | 2020-10-20 | 2021-01-22 | 浪潮云信息技术股份公司 | 一种基于人工智能技术的手机端辅助填表方法 |
CN112528863A (zh) * | 2020-12-14 | 2021-03-19 | 中国平安人寿保险股份有限公司 | 表格结构的识别方法、装置、电子设备及存储介质 |
CN112686168A (zh) * | 2020-12-30 | 2021-04-20 | 北京三快在线科技有限公司 | 自动录入表单的方法、装置、电子设备及存储介质 |
CN113569840A (zh) * | 2021-08-31 | 2021-10-29 | 平安医疗健康管理股份有限公司 | 基于自注意力机制的表单识别方法、装置及存储介质 |
CN114356115A (zh) * | 2021-12-31 | 2022-04-15 | 阿里巴巴(中国)有限公司 | 智能录入表单的方法、电子设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256591B (zh) | 用于输出信息的方法和装置 | |
CN110569341B (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
CN112861648B (zh) | 文字识别方法、装置、电子设备及存储介质 | |
CN110807454B (zh) | 基于图像分割的文字定位方法、装置、设备及存储介质 | |
CN108491866B (zh) | 色情图片鉴定方法、电子装置及可读存储介质 | |
CN110765740B (zh) | 一种基于dom树的全类型文本替换方法、系统、装置及存储介质 | |
CN112434690A (zh) | 动态解析文本图像特征现象的元素自动捕获理解方法、系统及存储介质 | |
CN114120299B (zh) | 信息获取方法、装置、存储介质及设备 | |
CN112686243A (zh) | 智能识别图片文字的方法、装置、计算机设备及存储介质 | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
CN113780229A (zh) | 文本识别方法及装置 | |
CN113850060A (zh) | 民航文档数据识别录入方法及系统 | |
CN113627395A (zh) | 文本识别方法、装置、介质及电子设备 | |
CN111753608A (zh) | 信息处理方法及装置、电子设备及存储介质 | |
CN112749649A (zh) | 一种智能识别并生成电子合同的方法及系统 | |
CN112580108A (zh) | 签名和印章完整性验证方法及计算机设备 | |
CN114386013A (zh) | 学籍自动认证方法、装置、计算机设备及存储介质 | |
CN114912417A (zh) | 业务数据处理方法、装置、设备及存储介质 | |
CN106611148B (zh) | 基于图像的离线公式识别方法和装置 | |
CN114821613A (zh) | 一种pdf中表格信息的抽取方法和系统 | |
CN114758340A (zh) | 物流地址智能识别方法、装置、设备及存储介质 | |
CN113936286B (zh) | 图像文本识别方法、装置、计算机设备及存储介质 | |
CN116050379A (zh) | 文档对比方法及存储介质 | |
CN116542221A (zh) | Pdf文件解析预览方法、装置、设备及存储介质 | |
CN115630636A (zh) | 文本识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |