CN116778513A - 一种电力行业票据的智能归档控制方法 - Google Patents

一种电力行业票据的智能归档控制方法 Download PDF

Info

Publication number
CN116778513A
CN116778513A CN202311074351.2A CN202311074351A CN116778513A CN 116778513 A CN116778513 A CN 116778513A CN 202311074351 A CN202311074351 A CN 202311074351A CN 116778513 A CN116778513 A CN 116778513A
Authority
CN
China
Prior art keywords
bill
similarity
input channel
archiving
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311074351.2A
Other languages
English (en)
Other versions
CN116778513B (zh
Inventor
葛令源
张举
卜祥磊
马星
段鹏飞
刘文博
任健萍
甄洋
魏荣
李娜
谭艳妮
王肇莉
武鑫
张合芯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Original Assignee
Taiyuan Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan Power Supply Co of State Grid Shanxi Electric Power Co Ltd filed Critical Taiyuan Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Priority to CN202311074351.2A priority Critical patent/CN116778513B/zh
Publication of CN116778513A publication Critical patent/CN116778513A/zh
Application granted granted Critical
Publication of CN116778513B publication Critical patent/CN116778513B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种电力行业票据的智能归档控制方法,属于数据处理领域,包括:对待归档票据进行数字图像捕获;通过将票据数字图像和票据模板图像进行匹配,获取票据表格相似度、票据形状相似度以及票据文字相似度,从而判断获取票据类型信息;根据识别的票据类型信息、票据流水号和票据开出日期等关键信息构建相应的电子票据,进行电子归档;同时,通过传输带等方式将物理票据发送到相应的档案盒进行物理归档,确保票据资产的安全。解决了现有技术中供电网票据归档效率低和准确性差的技术问题,达到了提高供电网票据归档效率和归档准确性的技术效果。

Description

一种电力行业票据的智能归档控制方法
技术领域
本发明涉及数据处理领域,具体涉及一种电力行业票据的智能归档控制方法。
背景技术
供电网票据作为供电企业日常重要业务活动与资金流转的依据,其管理水平对供电企业的运营效率与数据资产安全至关重要。然而,随着供电网规模的不断扩大,供电网票据的数量和类型也在飞速增加,传统的人工管理方式已经无法满足现代供电企业的需求。
发明内容
本申请通过提供了一种电力行业票据的智能归档控制方法,旨在解决现有技术中供电网票据归档效率低和准确性差的技术问题。
鉴于上述问题,本申请提供了一种电力行业票据的智能归档控制方法。
本申请公开的第一个方面,提供了一种电力行业票据的智能归档控制方法,该方法包括:当待归档票据位于预设区域时,激活扫描成像装置进行扫描,获取票据数字图像;基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,第一输入通道和第二输入通道的网络参数共享;当票据表格相似度满足第一相似度阈值,且票据形状相似度满足第二相似度阈值,将票据模板图像输入二级归档模型的第三输入通道,将票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,第三输入通道和第四输入通道的网络参数共享;当票据文字相似度满足第三相似度阈值,根据票据模板图像获取票据类型信息;基于票据数字图像、票据类型信息、票据流水号和票据开出日期,构建电子票据对待归档票据进行电子归档;基于票据类型信息、票据流水号和票据开出日期,通过传输带移动待归档票据进行物理归档。
本申请公开的另一个方面,提供了一种电力行业票据的智能归档控制系统,该系统包括:票据图像获取模块,用于当待归档票据位于预设区域时,激活扫描成像装置进行扫描,获取票据数字图像;票据一级归档模块,基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,第一输入通道和第二输入通道的网络参数共享;票据二级归档模块,用于当票据表格相似度满足第一相似度阈值,且票据形状相似度满足第二相似度阈值,将票据模板图像输入二级归档模型的第三输入通道,将票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,第三输入通道和第四输入通道的网络参数共享;票据类型获取模块,用于当票据文字相似度满足第三相似度阈值,根据票据模板图像获取票据类型信息;票据电子归档模块,基于票据数字图像、票据类型信息、票据流水号和票据开出日期,构建电子票据对待归档票据进行电子归档;票据物理归档模块,基于票据类型信息、票据流水号和票据开出日期,通过传输带移动待归档票据进行物理归档。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了通过扫描装置对待归档票据进行数字图像捕获;在此基础上,对数字图像进行分析,识别票据表格、票据形状以及票据文字,并与票据模板图像信息综合匹配,最终判断归档路径;当匹配判断结果均满足预设阈值要求时,根据识别的票据类型信息、票据流水号和票据开出日期等关键信息构建相应的电子票据,实现供电网票据的电子化管理;同时,通过传输带等方式将物理票据发送到相应的档案盒进行物理归档,确保票据资产安全的技术方案,解决了现有技术中供电网票据归档效率低和准确性差的技术问题,达到了提高供电网票据归档效率和归档准确性的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例提供了一种电力行业票据的智能归档控制方法的流程示意图;
图2为本申请实施例提供了一种电力行业票据的智能归档控制方法中获取一级归档模型的流程示意图;
图3为本申请实施例提供了一种电力行业票据的智能归档控制方法中一级归档模型的结构示意图;
图4为本申请实施例提供了一种电力行业票据的智能归档控制系统的结构示意图。
附图标记说明:票据图像获取模块11,票据一级归档模块12,票据二级归档模块13,票据类型获取模块14,票据电子归档模块15,票据物理归档模块16。
具体实施方式
本申请提供的技术方案总体思路如下:
本申请实施例提供了一种电力行业票据的智能归档控制方法。首先,通过扫描设备获取票据的数字图像;然后,在深度学习网络中,将票据模板图像和票据数字图像分别输入不同通道进行匹配,判断票据表格相似度、票据形状相似度以及票据文字相似度,最终确定获取票据类型信息;接着,根据获取的数字图像、识别的票据类型、流水号和开票日期等信息构建电子票据,实现供电网票据的电子化管理;同时通过传输装置将物理票据归档保管,完成供电网票据的生命周期管理。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一:如图1所示,本申请实施例提供了一种电力行业票据的智能归档控制方法,该方法包括:
步骤S1000:当待归档票据位于预设区域时,激活扫描成像装置进行扫描,获取票据数字图像;
具体而言,票据数字图像是指通过扫描成像装置对待归档票据进行扫描后获取的高分辨率电子图像。当需要归档的票据,即待归档票据躺放在预设区域时,启动数字化扫描设备进行扫描,获取该待归档票据的数字图像。其中,预设区域为数字化扫描设备的扫描区域;待归档票据为电网企业日常业务中使用的各种票据,如检查作业票单、停通电工单等;扫描成像装置采用CCD图像传感器配合光学透镜组合成的扫描仪设备,当待归档票据进入扫描区域并静止后,通过CCD图像传感器感应面上的光信息,转换为票据数字图像。
步骤S2000:基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将所述票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,所述第一输入通道和所述第二输入通道的网络参数共享;
具体而言,供电网管理端是指电网企业内部管理系统,该系统存储各类票据的模板图像。一级归档模型是指基于卷积神经网络构建的模型,用于识别票据的基本特征。第一输入通道和第二输入通道作为模型输入,采集票据模板图像特征和票据数字图像特征。网络参数共享能降低训练复杂度。
首先,通过电网管理系统,下载票据模板图像并输入归档模型的第一输入通道。同时,将获取到的票据数字图像输入归档模型的第二输入通道。第一输入通道和第二输入通道网络参数共享。第一输入通道对票据模板图像进行图像特征提取,第二输入通道对票据数字图像进行图像特征提取,再采用距离度量算法计算两图像间的相似度,得到票据表格相似度和票据形状相似度。
步骤S3000:当所述票据表格相似度满足第一相似度阈值,且所述票据形状相似度满足第二相似度阈值,将所述票据模板图像输入二级归档模型的第三输入通道,将所述票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,所述第三输入通道和所述第四输入通道的网络参数共享;
具体而言,二级归档模型通过比较模板图像和数字图像内文字的一致性,计算出文字相似度。只有当票据表格相似度满足第一相似度阈值,且票据形状相似度满足第二相似度阈值时,在这种情况下,将票据模板图像输入二级归档模型的第三输入通道,同时将票据数字图像输入二级归档模型的第四输入通道。第三输入通道和第四输入通道的网络参数共享,有助于降低训练复杂度。通过使用大量票据模板图像和数字图像,分别计算出票据表格相似度和形状相似度,将相似度分布画出直方图,根据分布找出合适的阈值点,设为第一相似度阈值和第二相似度阈值。例如,根据直方图选取表格相似度大于0.85的点作为第一相似度阈值,形状相似度大于0.9的点作为第二相似度阈值。
首先,对票据表格相似度和票据形状相似度进行判断,当票据表格相似度大于第一相似度阈值,且票据形状相似度大于第二相似度阈值时,将票据模板图像输入二级归档模型的第三输入通道,将票据数字图像输入二级归档模型的第四输入通道。然后,第三输入通道和第四输入通道通过OCR技术分别从票据模板图像和票据数字图像中提取文字,再对文本进行向量化。接着,计算对应表格框内文字向量之间的匹配程度,得到票据文字相似度。
步骤S4000:当所述票据文字相似度满足第三相似度阈值,根据所述票据模板图像获取票据类型信息;
具体而言,如果票据文字相似度满足了第三相似度阈值,说明票据数字图像与票据模板图像高度匹配,表明这张待归档票据就是票据模板图像这个类型,获取票据模板图像的票据类型信息,包括票据类别、票据种类、票据来源、生效/失效日期等;
首先,将所得票据文字相似度与第三相似度阈值进行比较,当票据文字相似度大于第三相似度阈值时,根据票据模板图像来确认该模板图像的票据类型信息,为待归档票据精确归档提供信息基础。若票据文字相似度未满足阈值,则不能确定这张待归档票据是否属于票据模板图像的类型,也不根据模板图像获取其类型信息,则在供电网管理端继续下载其他的票据模板图像与票据数字图像进行对比,直至获取待归档票据的对应的票据模板图像的票据类型信息。
步骤S5000:基于所述票据数字图像、所述票据类型信息、票据流水号和票据开出日期,构建电子票据对所述待归档票据进行电子归档;
具体而言,根据票据模板图像获取票据类型信息后,即获取了票据数字图像的票据类型信息。然后根据票据模板中的票据流水号和票据开出日期的模板位置,在票据数字图像获取待归档票据的票据流水号和票据开出日期。接着,将识别得到的该待归档票据的票据流水号和开出日期等信息填入电子票据模板相应字段,生成一张该待归档票据对应的电子票据。同时,将票据数字图像嵌入该电子票据以进行记录。最后,将该电子票据按照票据类型存储到电子票据数据库,并建立该电子票据与该待归档票据的对应关系。该电子票据数据库中有不同票据类型的子库,子库中各票据按照票据开出日期进行排序,并且各票据具有唯一的票据流水号。当需要查询该待归档票据信息时,可直接调取该对应电子票据,快速准确地获取该待归档票据的关键信息。
通过构建电子票据,将实物票据信息数字化和电子化,不但可以减轻票据档案管理的工作量,也可以提高票据信息查询和统计的效率。同时,电子归档还可以更好地保护实物票据的安全性和完整性。
步骤S6000:基于所述票据类型信息、所述票据流水号和所述票据开出日期,通过传输带移动所述待归档票据进行物理归档。
具体而言,基于识别得到的该待归档票据的票据类型信息、票据流水号和票据开出日期,通过传输带移动该待归档票据实现物理归档。
首先,获取识别得到的该待归档票据的票据类型信息,例如该票据属于发票类型或收据类型等。然后,获取该待归档票据自身带有的票据流水号和票据开出日期信息。基于以上信息,确定该待归档票据应归档至的物理位置。例如,系统预先设置按照票据类型、开票日期和票据号段等归档规则,来确定该待归档票据归档的箱号、抽屉号、档案袋号等物理位置信息。接着,系统通过控制传输带的输送方向和速度,精准地将该待归档票据输送至归档位置。然后,工作人员将该待归档票据取出并整理归档至相应档案袋或抽屉等进行物理归档保存。
通过获知待归档票据的关键信息,结合预设的归档规则,自动控制传输带实现票据的精确定位和输送,大幅提高了工作效率,减少了人工操作带来的错误率,进一步保障了票据归档的准确性。
进一步的,本申请实施例还包括:
步骤S2100:所述一级归档模型包括所述第一输入通道、所述第二输入通道和相似度评估通道;
步骤S2200:所述第一输入通道包括第一形状特征提取层和第一表格特征提取层,其中,所述第一形状特征提取层和所述第一表格特征提取层在所述第一输入通道并行分布;
步骤S2300:所述第二输入通道包括第二形状特征提取层和第二表格特征提取层,其中,所述第二形状特征提取层和所述第二表格特征提取层在所述第二输入通道并行分布;
步骤S2400:所述相似度评估通道包括形状相似度评估层和表格相似度评估层,其中,所述形状相似度评估层和所述第一形状特征提取层、所述第二形状特征提取层连接,所述表格相似度评估层和所述第一表格特征提取层、所述第二表格特征提取层连接。
具体而言,如图3所示的一级归档模型的结构示意图。该一级归档模型包括第一输入通道、第二输入通道和相似度评估通道,其中,第一输入通道用于输入并处理票据模板图像;第二输入通道用于输入并处理待归档票据的数字图像;相似度评估通道用于评估第一输入通道和第二输入通道处理的图像特征的相似度。
第一输入通道通过卷积神经网络构建,包含两层,分别为第一形状特征提取层和第一表格特征提取层。其中,第一形状特征提取层用于从票据模板图像中提取形状特征;第一表格特征提取层用于从票据模板图像中提取表格特征。这两层并行分布,分别处理票据模板图像的形状特征和表格特征。第一输入通道构建并训练成功后,基于卷积神经网络构建第二输入通道,并按照第一输入通道的网络参数对第二输入通道进行设置。第二输入通道的构建与第一输入通道类似,也包含两层,分别为第二形状特征提取层和第二表格特征提取层。其中,第二形状特征提取层用于从待归档票据的数字图像中提取形状特征;第二表格特征提取层用于从待归档票据的数字图像中提取表格特征。这两层也并行分布,分别处理票据数字图像形状特征和表格特征。
相似度评估通道中包含两层,分别为形状相似度评估层和表格相似度评估层。其中,形状相似度评估层与第一形状特征提取层和第二形状特征提取层连接,用于评估二者的形状特征相似度;表格相似度评估层与第一表格特征提取层和第二表格特征提取层连接,用于评估二者的表格特征相似度。
进一步的,如图2所示,本申请实施例还包括:
步骤S2110:采集票据图像标识数据,基于卷积神经网络,训练所述第一输入通道,当所述第一输入通道收敛时,共享所述第一输入通道的网络参数,生成所述第二输入通道;
步骤S2120:根据形状相似度评估公式,构建所述形状相似度评估层;
步骤S2130:根据表格相似度评估公式,构建所述表格相似度评估层;
步骤S2140:合并所述第一输入通道、所述第二输入通道、所述形状相似度评估层和所述表格相似度评估层,获取所述一级归档模型。
具体而言,首先,采用人工标注的方式采集大量真实的票据图像及其对应的标识信息,包括票据分类、票号、日期、金额等信息。将这些图像及标识信息的数据集作为模型训练和测试的数据源。然后,选择ResNet网络模型作为第一输入通道。接着,使用采集的大量图像及标识数据对该模型进行训练,训练过程中不断调整模型中的网络参数,直到第一输入通道的输出误差满足预设阈值,此时第一输入通道就完成了训练和收敛。随后,直接利用第一输入通道中收敛后的网络参数来生成第二输入通道。第二输入通道的网络结构与第一输入通道相同,网络参数相同,处理不同的票据图像。由于网络参数来自同一数据集训练得到的第一输入通道,所以第二输入通道可以快速收敛,提高了模型的训练速度,节省了计算资源。
之后,根据形状相似度评估公式,如形状匹配算法,构建形状相似度评估层,用于计算两张票据图像之间的形状相似度。同时,根据表格相似度评估公式,如图像匹配算法,构建表格相似度评估层。表格相似度评估公式主要用于计算两张票据图像之间表格内容的相似度。该层可以采用图像匹配算法中的模板匹配技术来实现。
然后,如图3所示,将首先训练得到的第一输入通道和共享网络参数得到的第二输入通道以及构建的形状相似度评估层和表格相似度评估层进行融合,最终得到一级归档模型。该一级归档模型可以同时计算两张票据图像之间的形状相似度、表格内容相似度,为票据的归档提供基础。
进一步的,本申请实施例还包括:
步骤S2121:所述形状相似度评估公式为:;其中,/>表征角点对齐的16种组合方式,/>表征任意一种角点对齐方式,/>表征形状相似度,/>表征用于计算形状相似度的角点对齐方式的角点距离均值,/>表征16种组合方式中的16个角点距离均值的最小值,表征满足/>的角点对齐方式的最大角点距离;
步骤S2131:所述表格相似度评估公式为:;其中,/>表征表格相似度,/>表征形状相似度最大的角点对齐方式下的票据数字图像的自左而右,自上而下排序的n个表格框的中心点坐标,/>表征形状相似度最大的角点对齐方式下的票据模板图像的自左而右,自上而下排序的m个表格框的中心点坐标,/>表征/>的第j个表格框的中心点坐标,/>表征/>的第j个表格框的中心点坐标,z表征预设数据量,/>表征的第j个表格框的中心点坐标和/>的第j个表格框的中心点坐标的欧式距离,表征预设欧式距离,/>表征/>和/>的任意两个对应的表格框的距离大于预设欧式距离的情况,/>表征/>和/>的表格框数量差大于预设数据量的情况,m表征形状相似度最大的角点对齐方式下的票据模板图像的自左而右,自上而下排序的表格框的总数量,n表征形状相似度最大的角点对齐方式下的票据数字图像的自左而右,自上而下排序的表格框的总数量。具体而言,为了评估票据图像和票据模板之间的形状相似度,本申请实施例优选了形状相似度评估公式:;/>;在该形状相似度评估公式中,变量/>代表16种可能的角点对齐方式,变量/>代表某一种具体的角点对齐方式。为了衡量形状的相似度,首先,计算16中对齐方式中每种对齐方式的距离均值/>;其次,选取这16种角点对齐方式中使角点距离均值/>最小的一种方式;然后,计算该角点对齐方式下角点之间的最大距离/>,最后用1除以该方式下的最大角点距离作为形状相似度/>。该公式通过比较不同角点对齐方式下的角点距离,选择角点距离分布最紧凑的一种方式,从而评估出形状的相似度。
同时,为了评估票据图像和票据模板之间的表格相似度,本申请实施例优选了表格相似度评估公式为:;/>;在该表格相似度评估公式中,变量/>代表形状相似度最大的角点对齐方式下,票据数字图像中从左到右、从上到下顺序排列的n个表格框的中心点坐标。变量/>代表形状相似度最大的角点对齐方式下,票据模板图像中从左到右、从上到下顺序排列的m个表格框的中心点坐标。变量/>代表/>中的第j个表格框中心点坐标,变量/>代表/>中的第j个表格框中心点坐标。首先计算/>和/>中对应表格框中心点坐标之间的距离/>,当/>小于或等于预设欧式距离/>,且/>和/>的表格框数量之差不大于/>时,使用公式/>计算表格相似度/>,即先计算m个距离的均值,再对该均值取倒数作为表格相似度/>。若对应表格框中心点坐标之间的距离/>大于预设欧式距离/>或/>和/>的表格框数量之差大于/>时,表格相似度/>为0。该公式通过比较票据数字图像和票据模板图像中表格框中心点的空间分布,选取中心点距离较小且表格框数量差异不大的情况,从而评估出表格的相似度。
通过优选的相似度评估方法,可以有效地计算票据图像和票据模板图像之间的形状相似度和表格相似度,为票据数字图像的归档和分类提供技术支撑。
进一步的,本申请实施例还包括:
步骤S2410:所述第一表格特征提取层还包括第一预处理器和第一特征提取器,其中,所述第一预处理器串联于所述第一特征提取器之前;
步骤S2420:所述第二表格特征提取层还包括第二预处理器和第二特征提取器,其中,所述第二预处理器串联于所述第二特征提取器之前;
步骤S2430:所述第一预处理器和所述第二预处理器用于:
步骤S2431:对图像进行二值化处理,获取二值化处理图像;
步骤S2432:对所述二值化处理图像进行白色横块膨胀,获取第一膨胀图像;
步骤S2433:对所述二值化处理图像进行白色竖块膨胀,获取第二膨胀图像;
步骤S2434:将所述第一膨胀图像和所述第二膨胀图像合并,获取预处理图像。
具体而言,第一表格特征提取层和第二表格特征提取层各自还包括预处理器和特征提取器,其中,预处理器连接在特征提取器之前。预处理器用于对图像进行预处理,以提高特征提取器的提取效果。
其中,预处理器用于对图像进行二值化处理,将图像的像素值转换为0或1,从而将图像变为黑白图像,得到二值化处理图像。二值化处理图像包含表格框架信息,但同时也包含大量噪点,影响后续处理。为了解决此问题,预处理器进一步对二值化处理图像进行白色横块膨胀和白色竖块膨胀,分别得到第一膨胀图像和第二膨胀图像。白色横块膨胀是将图像中的白色区域在横向上扩展,以覆盖文字区域,将文字区域转化为成散乱的点,以将文字的点清除,而表格框架由于连续的,不会被横块膨胀转化为散乱的点而被清楚。白色竖块膨胀是将图像中的白色区域在纵向上扩展,与白色横块膨胀同理,通过膨胀,将散乱的噪点合并,但不会改变表格框架的连续性,以有效去除噪点。最后,对第一膨胀图像和第二膨胀图像逐像素进行逻辑与运算,得到预处理图像。逻辑与运算的结果中,当第一膨胀图像和第二膨胀图像中任意一个的像素值均为1时,预处理图像的对应像素值为1,否则为0,实现对第一膨胀图像和第二膨胀图像的合并,得到预处理图像。预处理图像保留了表格框架信息,并去除了大部分噪点,为特征提取器提供清晰的输入,提高特征提取效果。
通过利用预处理器对图像进行预处理,包括二值化、白色横块膨胀和白色竖块膨胀,有效提取表格框架特征,为票据归档和分类提供技术支撑。
进一步的,本申请实施例还包括:
步骤S3100:所述二级归档模型包括所述第三输入通道、所述第四输入通道和文字相似度评估通道,其中,所述第三输入通道和所述第四输入通道并联于所述文字相似度评估通道之前;
步骤S3200:构建文字相似度评估公式:;/>;其中,/>表征文字相似度,/>表征票据模板图像的具有文字的O个表格框内文字的向量,/>表征票据数字图像中,和票据模板图像相对应的O个表格框内文字的向量,任意一个向量表征唯一语义的一个字,/>表征票据数字图像的第p个表格框内文字向量,/>表征票据模板图像的第p个表格框内文字向量,/>表征相同位置文字向量相同的数量;
步骤S3300:根据所述文字相似度评估公式,构建所述文字相似度评估通道。
具体而言,二级归档模型包括第三输入通道、第四输入通道和文字相似度评估通道。其中,第三输入通道和第四输入通道并列连接在文字相似度评估通道之前;第三输入通道用于提取票据模板图像的文字特征,第四输入通道用于提取票据数字图像的文字特征;第三输入通道和第四输入通道将各自获取的文字特征输入至文字相似度评估通道中,文字相似度评估通道评估票据数字图像和票据模板图像中文字特征的相似度,得到票据文字相似度,进而判断两张图像的相似度。
为了评估票据数字图像和票据模板图像之间的文字相似度,本申请实施例优选了文字相似度评估公式为:;/>;在该文字相似度评估公式中,/>代表了输入的待归档的票据数字图像中的O个表格框内包含的文字信息的向量,每个向量代表唯一的一个字。同样,/>代表了输入的票据模板图像中的O个表格框内包含的文字信息的向量,每个向量代表唯一的一个字。接着,对于/>,其代表了基于文字信息的相似度评估结果,通过/>计算所得,代表所有表格框内文字相同数量之和与表格框总数量的比值,该比值即为基于文字信息的票据数字图像和票据模板图像的相似度。最后,根据该文字相似度评估公式,构建文字相似度评估通道,用于得出票据图像中两个表格框包含的文字信息的相似度,为票据数字图像的归档提供重要依据。
进一步的,本申请实施例还包括:
步骤S5100:基于所述票据数字图像、所述票据类型信息、所述票据流水号和所述票据开出日期,对所述待归档票据进行归档记录查询,获取归档日志信息;
步骤S5200:根据所述归档日志信息对所述待归档票据进行重复归档校验,获取校验结果信息;
步骤S5300:当所述校验结果信息包括未重复归档指令时,对所述待归档票据进行归档。
具体而言,首先,根据票据类型信息,确定查询服务器上存储的哪个票据归档子数据库。例如,如果是发票,则查询发票归档日志子数据库;如果是收据,则查询收据归档日志数据库。然后,在确定的归档子数据库中,使用票据流水号和票据开出日期,进行查询,判断是否存在查询到的归档记录。如果查询到归档记录,则获取该归档记录中的相关信息,如归档记录编号、归档时间、归档用户等,这些信息构成归档日志信息。如果未查询到归档记录,则表明待归档票据属于首次归档,归档日志信息为空。
接着,根据获取的归档日志信息,检验待归档票据是否已经存在于服务器上进行过归档,这一检验过程为重复归档校验,通过该校验可获取校验结果信息。校验结果信息包含两种结果,一种结果指示待归档票据已经存在归档记录,属于重复归档,一种结果指示待归档票据不存在归档记录,属于首次归档。
当校验结果信息包含未重复归档指令时,表明待归档票据未存在归档记录,属于首次归档,这时对待归档票据进行归档操作,并建立其归档记录,该记录用于后续的重复归档校验。
通过对待归档票据进行归档记录查询和重复归档校验,避免票据重复归档的情况发生,确保票据归档的准确性和可靠性,有效提高票据电子归档系统的智能化水平和可靠性。
综上所述,本申请实施例所提供的一种电力行业票据的智能归档控制方法具有如下技术效果:
当待归档票据位于预设区域时,激活扫描成像装置进行扫描,获取票据数字图像,为票据识别和归档提供基础信息;基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,第一输入通道和第二输入通道的网络参数共享,实现票据表格和票据形状的判断,为获取票据具体类型提供支持;当票据表格相似度满足第一相似度阈值,且票据形状相似度满足第二相似度阈值,将票据模板图像输入二级归档模型的第三输入通道,将票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,第三输入通道和第四输入通道的网络参数共享,进一步判断票据信息,为获取票据类型提供依据;当票据文字相似度满足第三相似度阈值,根据票据模板图像获取票据类型信息,为实现票据归档提供归档支持;基于票据数字图像、票据类型信息、票据流水号和票据开出日期,构建电子票据对待归档票据进行电子归档,实现票据信息的电子化管理,保证了票据信息的数字化存储;基于票据类型信息、票据流水号和票据开出日期,通过传输带移动待归档票据进行物理归档,确保票据资产的安全管理,进而达到提高供电网票据归档效率和降低归档错误率的技术效果。
实施例二:基于与前述实施例中一种电力行业票据的智能归档控制方法相同的发明构思,如图4所示,本申请实施例提供了一种电力行业票据的智能归档控制系统,该系统包括:
票据图像获取模块11,用于当待归档票据位于预设区域时,激活扫描成像装置进行扫描,获取票据数字图像;
票据一级归档模块12,基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将所述票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,所述第一输入通道和所述第二输入通道的网络参数共享;
票据二级归档模块13,用于当所述票据表格相似度满足第一相似度阈值,且所述票据形状相似度满足第二相似度阈值,将所述票据模板图像输入二级归档模型的第三输入通道,将所述票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,所述第三输入通道和所述第四输入通道的网络参数共享;
票据类型获取模块14,用于当所述票据文字相似度满足第三相似度阈值,根据所述票据模板图像获取票据类型信息;
票据电子归档模块15,基于所述票据数字图像、所述票据类型信息、票据流水号和票据开出日期,构建电子票据对所述待归档票据进行电子归档;
票据物理归档模块16,基于所述票据类型信息、所述票据流水号和所述票据开出日期,通过传输带移动所述待归档票据进行物理归档。
进一步的,票据一级归档模块12包括以下执行步骤:
所述一级归档模型包括所述第一输入通道、所述第二输入通道和相似度评估通道;
所述第一输入通道包括第一形状特征提取层和第一表格特征提取层,其中,所述第一形状特征提取层和所述第一表格特征提取层在所述第一输入通道并行分布;
所述第二输入通道包括第二形状特征提取层和第二表格特征提取层,其中,所述第二形状特征提取层和所述第二表格特征提取层在所述第二输入通道并行分布;
所述相似度评估通道包括形状相似度评估层和表格相似度评估层,其中,所述形状相似度评估层和所述第一形状特征提取层、所述第二形状特征提取层连接,所述表格相似度评估层和所述第一表格特征提取层、所述第二表格特征提取层连接。
进一步的,票据一级归档模块12还包括以下执行步骤:
采集票据图像标识数据,基于卷积神经网络,训练所述第一输入通道,当所述第一输入通道收敛时,共享所述第一输入通道的网络参数,生成所述第二输入通道;
根据形状相似度评估公式,构建所述形状相似度评估层;
根据表格相似度评估公式,构建所述表格相似度评估层;
合并所述第一输入通道、所述第二输入通道、所述形状相似度评估层和所述表格相似度评估层,获取所述一级归档模型。
进一步的,票据一级归档模块12还包括以下执行步骤:
所述形状相似度评估公式为:;其中,/>表征角点对齐的16种组合方式,/>表征任意一种角点对齐方式,/>表征形状相似度,/>表征用于计算形状相似度的角点对齐方式的角点距离均值,/>表征16种组合方式中的16个角点距离均值的最小值,表征满足/>的角点对齐方式的最大角点距离;
所述表格相似度评估公式为:;其中,/>表征表格相似度,/>表征形状相似度最大的角点对齐方式下的票据数字图像的自左而右,自上而下排序的n个表格框的中心点坐标,/>表征形状相似度最大的角点对齐方式下的票据模板图像的自左而右,自上而下排序的m个表格框的中心点坐标,/>表征/>的第j个表格框的中心点坐标,/>表征/>的第j个表格框的中心点坐标,z表征预设数据量,/>表征的第j个表格框的中心点坐标和/>的第j个表格框的中心点坐标的欧式距离,表征预设欧式距离,/>表征/>和/>的任意两个对应的表格框的距离大于预设欧式距离的情况,/>表征/>和/>的表格框数量差大于预设数据量的情况,m表征形状相似度最大的角点对齐方式下的票据模板图像的自左而右,自上而下排序的表格框的总数量,n表征形状相似度最大的角点对齐方式下的票据数字图像的自左而右,自上而下排序的表格框的总数量。
进一步的,票据一级归档模块12还包括以下执行步骤:
所述第一表格特征提取层还包括第一预处理器和第一特征提取器,其中,所述第一预处理器串联于所述第一特征提取器之前;
所述第二表格特征提取层还包括第二预处理器和第二特征提取器,其中,所述第二预处理器串联于所述第二特征提取器之前;
所述第一预处理器和所述第二预处理器用于:
对图像进行二值化处理,获取二值化处理图像;
对所述二值化处理图像进行白色横块膨胀,获取第一膨胀图像;
对所述二值化处理图像进行白色竖块膨胀,获取第二膨胀图像;
将所述第一膨胀图像和所述第二膨胀图像合并,获取预处理图像。
进一步的,票据二级归档模块13包括以下执行步骤:
所述二级归档模型包括所述第三输入通道、所述第四输入通道和文字相似度评估通道,其中,所述第三输入通道和所述第四输入通道并联于所述文字相似度评估通道之前;
构建文字相似度评估公式:;/>;其中,/>表征文字相似度,/>表征票据模板图像的具有文字的O个表格框内文字的向量,/>表征票据数字图像中,和票据模板图像相对应的O个表格框内文字的向量,任意一个向量表征唯一语义的一个字,/>表征票据数字图像的第p个表格框内文字向量,/>表征票据模板图像的第p个表格框内文字向量,/>表征相同位置文字向量相同的数量;
根据所述文字相似度评估公式,构建所述文字相似度评估通道。
进一步的,票据电子归档模块15包括以下执行步骤:
基于所述票据数字图像、所述票据类型信息、所述票据流水号和所述票据开出日期,对所述待归档票据进行归档记录查询,获取归档日志信息;
根据所述归档日志信息对所述待归档票据进行重复归档校验,获取校验结果信息;
当所述校验结果信息包括未重复归档指令时,对所述待归档票据进行归档。
综上所述的方法的任意步骤都可作为计算机指令或者程序存储在不设限制的计算机存储器中,并可以被不设限制的计算机处理器调用识别用以实现本申请实施例中的任一项方法,在此不做多余限制。
进一步的,综上所述的第一或第二可能不止代表次序关系,也可能代表某项特指概念,和/或指的是多个元素之间可单独或全部选择。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请及其等同技术的范围之内,则本申请意图包括这些改动和变型在内。

Claims (8)

1.一种电力行业票据的智能归档控制方法,其特征在于,包括:
当待归档票据位于预设区域时,激活扫描成像装置进行扫描,获取票据数字图像;
基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将所述票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,所述第一输入通道和所述第二输入通道的网络参数共享;
当所述票据表格相似度满足第一相似度阈值,且所述票据形状相似度满足第二相似度阈值,将所述票据模板图像输入二级归档模型的第三输入通道,将所述票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,所述第三输入通道和所述第四输入通道的网络参数共享;
当所述票据文字相似度满足第三相似度阈值,根据所述票据模板图像获取票据类型信息;
基于所述票据数字图像、所述票据类型信息、票据流水号和票据开出日期,构建电子票据对所述待归档票据进行电子归档;
基于所述票据类型信息、所述票据流水号和所述票据开出日期,通过传输带移动所述待归档票据进行物理归档。
2.如权利要求1所述的一种电力行业票据的智能归档控制方法,其特征在于,基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将所述票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,所述第一输入通道和所述第二输入通道的网络参数共享,包括:
所述一级归档模型包括所述第一输入通道、所述第二输入通道和相似度评估通道;
所述第一输入通道包括第一形状特征提取层和第一表格特征提取层,其中,所述第一形状特征提取层和所述第一表格特征提取层在所述第一输入通道并行分布;
所述第二输入通道包括第二形状特征提取层和第二表格特征提取层,其中,所述第二形状特征提取层和所述第二表格特征提取层在所述第二输入通道并行分布;
所述相似度评估通道包括形状相似度评估层和表格相似度评估层,其中,所述形状相似度评估层和所述第一形状特征提取层、所述第二形状特征提取层连接,所述表格相似度评估层和所述第一表格特征提取层、所述第二表格特征提取层连接。
3.如权利要求2所述的一种电力行业票据的智能归档控制方法,其特征在于,包括:
采集票据图像标识数据,基于卷积神经网络,训练所述第一输入通道,当所述第一输入通道收敛时,共享所述第一输入通道的网络参数,生成所述第二输入通道;
根据形状相似度评估公式,构建所述形状相似度评估层;
根据表格相似度评估公式,构建所述表格相似度评估层;
合并所述第一输入通道、所述第二输入通道、所述形状相似度评估层和所述表格相似度评估层,获取所述一级归档模型。
4.如权利要求3所述的一种电力行业票据的智能归档控制方法,其特征在于,还包括:
所述形状相似度评估公式为:;其中,/>表征角点对齐的16种组合方式,/>表征任意一种角点对齐方式,/>表征形状相似度,/>表征用于计算形状相似度的角点对齐方式的角点距离均值,/>表征16种组合方式中的16个角点距离均值的最小值,表征满足/>的角点对齐方式的最大角点距离;
所述表格相似度评估公式为:;其中,/>表征表格相似度,/>表征形状相似度最大的角点对齐方式下的票据数字图像的自左而右,自上而下排序的n个表格框的中心点坐标,/>表征形状相似度最大的角点对齐方式下的票据模板图像的自左而右,自上而下排序的m个表格框的中心点坐标,/>表征/>的第j个表格框的中心点坐标,/>表征/>的第j个表格框的中心点坐标,z表征预设数据量,/>表征的第j个表格框的中心点坐标和/>的第j个表格框的中心点坐标的欧式距离,表征预设欧式距离,/>表征/>和/>的任意两个对应的表格框的距离大于预设欧式距离的情况,/>表征/>和/>的表格框数量差大于预设数据量的情况,m表征形状相似度最大的角点对齐方式下的票据模板图像的自左而右,自上而下排序的表格框的总数量,n表征形状相似度最大的角点对齐方式下的票据数字图像的自左而右,自上而下排序的表格框的总数量。
5.如权利要求2所述的一种电力行业票据的智能归档控制方法,其特征在于,还包括:
所述第一表格特征提取层还包括第一预处理器和第一特征提取器,其中,所述第一预处理器串联于所述第一特征提取器之前;
所述第二表格特征提取层还包括第二预处理器和第二特征提取器,其中,所述第二预处理器串联于所述第二特征提取器之前;
所述第一预处理器和所述第二预处理器用于:
对图像进行二值化处理,获取二值化处理图像;
对所述二值化处理图像进行白色横块膨胀,获取第一膨胀图像;
对所述二值化处理图像进行白色竖块膨胀,获取第二膨胀图像;
将所述第一膨胀图像和所述第二膨胀图像合并,获取预处理图像。
6.如权利要求1所述的一种电力行业票据的智能归档控制方法,其特征在于,当所述票据表格相似度满足第一相似度阈值,且所述票据形状相似度满足第二相似度阈值,将所述票据模板图像输入二级归档模型的第三输入通道,将所述票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,所述第三输入通道和所述第四输入通道的网络参数共享,包括:
所述二级归档模型包括所述第三输入通道、所述第四输入通道和文字相似度评估通道,其中,所述第三输入通道和所述第四输入通道并联于所述文字相似度评估通道之前;
构建文字相似度评估公式:;/>;其中,/>表征文字相似度,/>表征票据模板图像的具有文字的O个表格框内文字的向量,/>表征票据数字图像中,和票据模板图像相对应的O个表格框内文字的向量,任意一个向量表征唯一语义的一个字,/>表征票据数字图像的第p个表格框内文字向量,/>表征票据模板图像的第p个表格框内文字向量,/>表征相同位置文字向量相同的数量;
根据所述文字相似度评估公式,构建所述文字相似度评估通道。
7.如权利要求1所述的一种电力行业票据的智能归档控制方法,其特征在于,基于所述票据数字图像、所述票据类型信息、票据流水号和票据开出日期,构建电子票据对所述待归档票据进行电子归档,之前还包括:
基于所述票据数字图像、所述票据类型信息、所述票据流水号和所述票据开出日期,对所述待归档票据进行归档记录查询,获取归档日志信息;
根据所述归档日志信息对所述待归档票据进行重复归档校验,获取校验结果信息;
当所述校验结果信息包括未重复归档指令时,对所述待归档票据进行归档。
8.一种电力行业票据的智能归档控制系统,其特征在于,用于实施权利要求1-7任意一项所述的一种电力行业票据的智能归档控制方法,包括:
票据图像获取模块,所述票据图像获取模块用于当待归档票据位于预设区域时,激活扫描成像装置进行扫描,获取票据数字图像;
票据一级归档模块,所述票据一级归档模块基于供电网管理端,下载票据模板图像输入一级归档模型的第一输入通道,将所述票据数字图像输入一级归档模型的第二输入通道,获取票据表格相似度和票据形状相似度,其中,所述第一输入通道和所述第二输入通道的网络参数共享;
票据二级归档模块,所述票据二级归档模块用于当所述票据表格相似度满足第一相似度阈值,且所述票据形状相似度满足第二相似度阈值,将所述票据模板图像输入二级归档模型的第三输入通道,将所述票据数字图像输入二级归档模型的第四输入通道,获取票据文字相似度,其中,所述第三输入通道和所述第四输入通道的网络参数共享;
票据类型获取模块,所述票据类型获取模块用于当所述票据文字相似度满足第三相似度阈值,根据所述票据模板图像获取票据类型信息;
票据电子归档模块,所述票据电子归档模块基于所述票据数字图像、所述票据类型信息、票据流水号和票据开出日期,构建电子票据对所述待归档票据进行电子归档;
票据物理归档模块,所述票据物理归档模块基于所述票据类型信息、所述票据流水号和所述票据开出日期,通过传输带移动所述待归档票据进行物理归档。
CN202311074351.2A 2023-08-24 2023-08-24 一种电力行业票据的智能归档控制方法 Active CN116778513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311074351.2A CN116778513B (zh) 2023-08-24 2023-08-24 一种电力行业票据的智能归档控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311074351.2A CN116778513B (zh) 2023-08-24 2023-08-24 一种电力行业票据的智能归档控制方法

Publications (2)

Publication Number Publication Date
CN116778513A true CN116778513A (zh) 2023-09-19
CN116778513B CN116778513B (zh) 2023-10-27

Family

ID=87993459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311074351.2A Active CN116778513B (zh) 2023-08-24 2023-08-24 一种电力行业票据的智能归档控制方法

Country Status (1)

Country Link
CN (1) CN116778513B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241894A (zh) * 2018-08-28 2019-01-18 南京安链数据科技有限公司 一种基于表格定位和深度学习的针对性票据内容识别系统和方法
CN109508674A (zh) * 2018-11-13 2019-03-22 佳木斯大学 基于区域划分的机载下视异构图像匹配方法
CN110490267A (zh) * 2019-08-23 2019-11-22 四川长虹电器股份有限公司 一种基于深度学习的票据分拣方法
CN110781877A (zh) * 2019-10-28 2020-02-11 京东方科技集团股份有限公司 一种图像识别方法、设备及存储介质
CN112651289A (zh) * 2020-10-19 2021-04-13 广东工业大学 一种增值税普通发票智能识别与校验系统及其方法
US20210200937A1 (en) * 2019-08-30 2021-07-01 Sas Institute Inc. Techniques for extracting contextually structured data from document images
CN115661839A (zh) * 2022-09-22 2023-01-31 国网河北省电力有限公司信息通信分公司 票据归档方法、装置、终端及存储介质
CN115994805A (zh) * 2023-03-17 2023-04-21 北京国电通网络技术有限公司 发票与凭证归档方法、电子设备和计算机可读介质
CN116012184A (zh) * 2023-01-06 2023-04-25 国网江苏省电力有限公司徐州供电分公司 一种财务发票处理方式方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241894A (zh) * 2018-08-28 2019-01-18 南京安链数据科技有限公司 一种基于表格定位和深度学习的针对性票据内容识别系统和方法
CN109508674A (zh) * 2018-11-13 2019-03-22 佳木斯大学 基于区域划分的机载下视异构图像匹配方法
CN110490267A (zh) * 2019-08-23 2019-11-22 四川长虹电器股份有限公司 一种基于深度学习的票据分拣方法
US20210200937A1 (en) * 2019-08-30 2021-07-01 Sas Institute Inc. Techniques for extracting contextually structured data from document images
CN110781877A (zh) * 2019-10-28 2020-02-11 京东方科技集团股份有限公司 一种图像识别方法、设备及存储介质
CN112651289A (zh) * 2020-10-19 2021-04-13 广东工业大学 一种增值税普通发票智能识别与校验系统及其方法
CN115661839A (zh) * 2022-09-22 2023-01-31 国网河北省电力有限公司信息通信分公司 票据归档方法、装置、终端及存储介质
CN116012184A (zh) * 2023-01-06 2023-04-25 国网江苏省电力有限公司徐州供电分公司 一种财务发票处理方式方法
CN115994805A (zh) * 2023-03-17 2023-04-21 北京国电通网络技术有限公司 发票与凭证归档方法、电子设备和计算机可读介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JUANJUAN TIAN等: "Research on artificial intelligence of accounting information processing based on image processing", 《MATHEMATICAL BIOSCIENCES AND ENGINEERING》, vol. 19, no. 8, pages 8411 - 8425 *
MAN-WEN TIAN等: "Research on image recognition method of bank financing bill based on binary tree decision", 《JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION》, vol. 60, pages 123 - 128 *
汤海波: "科研团队的发票管理及项目周边推荐研究与设计", 《中国优秀硕士学位论文全文数据库_信息科技辑》, pages 138 - 2457 *
许振兴: "Radon-Fourier相似不变特征提取", 《中国优秀硕士学位论文全文数据库_信息科技辑》, pages 138 - 1036 *

Also Published As

Publication number Publication date
CN116778513B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN105528604B (zh) 一种基于ocr的票据自动识别与处理系统
CA3027038C (en) Document field detection and parsing
US8520941B2 (en) Method and system for document image classification
US11074442B2 (en) Identification of table partitions in documents with neural networks using global document context
US20210064908A1 (en) Identification of fields in documents with neural networks using global document context
KR20100135872A (ko) 물체 인식용 화상 데이터베이스의 작성 방법, 처리 장치 및 처리용 프로그램
CN102521366A (zh) 融合分类与全局索引的图像检索方法和图像检索系统
CN103295034A (zh) 一种基于dsp的嵌入式图书乱架清点系统及方法
KR102283197B1 (ko) 상품의 유형을 결정하는 방법 및 디바이스
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质
CN116778513B (zh) 一种电力行业票据的智能归档控制方法
CN112100430B (zh) 一种物品溯源方法和装置
CN113066223A (zh) 发票自动验证方法及装置
US20230138491A1 (en) Continuous learning for document processing and analysis
CN114443834A (zh) 一种证照信息提取的方法、装置及存储介质
CN114021716A (zh) 一种模型训练的方法、系统及电子设备
CN112862409A (zh) 提运单核验方法及装置
Sastry et al. A 3d approach for palm leaf character recognition using histogram computation and distance profile features
Graef et al. A novel hybrid optical character recognition approach for digitizing text in forms
JP7470264B1 (ja) レイアウト解析システム、レイアウト解析方法、及びプログラム
RU2787138C1 (ru) Оптимизация структуры и использование кодовых книг для анализа документов
CN111507236B (zh) 文件处理方法、系统、装置及介质
US20240143632A1 (en) Extracting information from documents using automatic markup based on historical data
Xamxidin et al. Off Line Handwritten Signature Verification Based on Feature Fusion
He et al. Digital construction of data traceability based on dynamic recognition algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant