CN115062876B - 基于ocr的流程快速建模方法、系统、设备及存储介质 - Google Patents

基于ocr的流程快速建模方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN115062876B
CN115062876B CN202210989621.1A CN202210989621A CN115062876B CN 115062876 B CN115062876 B CN 115062876B CN 202210989621 A CN202210989621 A CN 202210989621A CN 115062876 B CN115062876 B CN 115062876B
Authority
CN
China
Prior art keywords
approval
application form
user
target
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210989621.1A
Other languages
English (en)
Other versions
CN115062876A (zh
Inventor
李思伟
李锦洲
池沐霖
张旭君
申鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Excellence Information Technology Co ltd
Original Assignee
Excellence Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Excellence Information Technology Co ltd filed Critical Excellence Information Technology Co ltd
Priority to CN202210989621.1A priority Critical patent/CN115062876B/zh
Publication of CN115062876A publication Critical patent/CN115062876A/zh
Application granted granted Critical
Publication of CN115062876B publication Critical patent/CN115062876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063114Status monitoring or status determination for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063118Staff planning in a project environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种计算机应用技术,揭露了一种基于OCR的流程快速建模方法、系统、设备及存储介质。本发明对目标审批流程进行多维度的特征采集,并组建申请表集合,其中包括多类申请表;依次确定各类申请表的审批用户,并构建申请表‑审批用户列表;获得申请表审批任务,并确定所述申请表审批任务中目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;构建任务分配模型并分析确定处理所述申请表审批任务的目标审批用户;基于OCR构建表单识别模型,并获得所述目标申请表的识别信息;生成标准目标申请表并发送至所述目标审批用户进行审批。本发明可优化审批流程,同时提高审批效率,进而提高决策频度和工作质量。

Description

基于OCR的流程快速建模方法、系统、设备及存储介质
技术领域
本发明涉及计算机应用技术领域,特别涉及一种基于OCR的流程快速建模方法、系统、设备及存储介质。
背景技术
随着计算机应用技术的快速发展,各行各业均逐渐向智能化方向转换,从而有效提高整体工作效率,进而提高企业在市场中的综合竞争力。现有技术中采用人工方式进行工作业务审批时存在审批不及时导致审批周期过长,审批内容不完善影响审批质量的问题,以及利用耦合程度高、开发效率低的传统审批系统,因多个无用审批层级导致效率低下的问题。审批涉及多个管理部门之间的协同合作,示范性地,油气田生产、销售管理等领域,均涉及生产、销售、财务等多个部门的审批。因此,研究利用计算机技术对审批流程进行快速建模,提高审批流程的智能化程度,对于规范审批流程、提高审批决策处理能力和工作效率等具有重要意义。
因此,如何优化审批流程,提高审批效率和审批质量,并为后续决策提供基础成为一个亟待解决的问题。
发明内容
本发明的主要目的是提供一种基于OCR的流程快速建模方法、系统、设备及存储介质,旨在提高审批工作效率,进而提高决策频度和工作质量。
为实现上述目的,本发明提出一种基于OCR的流程快速建模方法,包括如下步骤:
组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;
匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;
确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
优选地,所述确定步骤包括:
提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;
根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:
Figure DEST_PATH_IMAGE002
其中,所述
Figure DEST_PATH_IMAGE004
是指所述用户,所述
Figure DEST_PATH_IMAGE006
是指所述用户
Figure DEST_PATH_IMAGE004A
处理完所述实时任 务列表的总时间,即所述实时负载,所述
Figure DEST_PATH_IMAGE008
是指所述实时任务列表中任意一类任务,记作 第
Figure DEST_PATH_IMAGE010
类任务
Figure DEST_PATH_IMAGE008A
,所述
Figure DEST_PATH_IMAGE012
是指所述实时任务列表中共有
Figure DEST_PATH_IMAGE014
类任务,所述
Figure DEST_PATH_IMAGE016
是指 所述用户
Figure DEST_PATH_IMAGE004AA
处理完所述实时任务列表中第
Figure DEST_PATH_IMAGE010A
类任务
Figure DEST_PATH_IMAGE008AA
的总时间,所述
Figure DEST_PATH_IMAGE018
是指所述实时 任务列表中第
Figure DEST_PATH_IMAGE010AA
类任务
Figure DEST_PATH_IMAGE008AAA
的总个数,所述
Figure DEST_PATH_IMAGE020
是指所述实时任务列表中第
Figure DEST_PATH_IMAGE010AAA
类任务
Figure DEST_PATH_IMAGE008AAAA
中 每个任务的处理时间;
将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:
Figure DEST_PATH_IMAGE022
其中,所述
Figure DEST_PATH_IMAGE024
是指所述用户
Figure DEST_PATH_IMAGE004AAA
处理所述实时任务列表和所述申请表审 批任务的总时间,即所述预测负载,所述
Figure DEST_PATH_IMAGE026
是指所述用户
Figure DEST_PATH_IMAGE004AAAA
处理所述申请表审批任 务的时间,所述
Figure DEST_PATH_IMAGE028
是指所述申请表审批任务;
基于所述用户的预测负载,利用粒子群优化算法确定所述目标审批用户。
优选地,在所述利用粒子群优化算法确定所述目标审批用户之前,还包括以下步骤:
基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;
基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;
提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;
基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;
将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户。
优选地,所述获得步骤包括:
构建所述表单识别模型,其中,所述表单识别模型包括预处理层、裁剪层、分割层、识别层;
获得所述目标申请表的图像,并利用所述预处理层对所述图像进行处理,得到预处理图像;
利用所述裁剪层对所述预处理图像进行裁剪,得到内容预处理图像;
利用所述分割层将所述内容预处理图像中的各连续字符依次进行分割,得到多个待识别块;
利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。
优选地,所述得到预处理图像,包括:
将灰度化单元、二值化单元、降噪单元依次内嵌至所述预处理层;
所述灰度化单元基于最大值法对所述图像进行变换,得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图;
基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值;
所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图;
所述降噪单元基于高斯滤波算法原理,对所述二值图进行降噪,得到所述预处理图像。
优选地,在所述组成目标申请表的识别信息之后,还包括以下步骤:
采集审批流程中的签名数据、印章数据,并组建审批通过数据库;
判断所述目标申请表是否为初始申请表,若所述目标申请表不是初始申请表,提取所述目标申请表的审批意见信息;
对所述审批意见信息进行分析,并将分析结果在所述审批通过数据库中进行遍历,根据遍历结果生成智能审批结果。
优选地,所述执行步骤包括:
获得所述目标申请表的标准化表单,并提取所述标准化表单的指标类目,组建标准指标类目集;
基于所述识别信息,依次提取所述标准指标类目集中各标准指标类目的识别数据;
将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。
此外,为实现上述目的,本发明还提出一种基于OCR的流程快速建模系统,所述基于OCR的流程快速建模系统包括存储器和处理器,其特征在于,所述存储器上存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序被所述处理器执行时实现如下步骤:
组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;
匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;
确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
此外,为实现上述目的,本发明还提出一种计算机设备,其中,包括处理器和存储器;
所述处理器,用于处理执行所述的基于OCR的流程快速建模方法;
所述存储器,所述存储器与所述处理器耦合,用于存储所述基于OCR的流程快速建模程序,当所述程序被所述处理器执行时,使系统以执行所述基于OCR的流程快速建模方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,其中,所述计算机可读存储介质存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述任一项所述的基于OCR的流程快速建模方法的步骤。
本发明对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。相较于现有技术,本发明通过任务分配模型智能化匹配任务处理人员,有效提高任务处理效率、最大化人员价值,实现了优化审批流程的技术目标。通过表单识别模型对待审批表单进行智能化识别分析,降低人员处理任务的工作难度,达到了提高决策频度和工作质量的技术效果。因此,本发明可提高审批工作效率和审批质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明基于OCR的流程快速建模方法的流程示意图;
图2为本发明基于OCR的流程快速建模方法中确定目标审批用户的流程示意图;
图3为本发明基于OCR的流程快速建模方法中组成目标申请表的识别信息的流程示意图;
图4为本发明基于OCR的流程快速建模方法中得到预处理图像的流程示意图;
图5为本发明基于OCR的流程快速建模方法中得到标准目标申请表的流程示意图;
图6为本发明基于OCR的流程快速建模程序第二实施例的运行环境示意图;
图7为本发明基于OCR的流程快速建模程序第二实施例的程序模块图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本发明提出一种基于OCR的流程快速建模方法。
如图1所示,图1为本发明基于OCR的流程快速建模方法的流程示意图。
本实施例中,该方法包括:
S100:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
所述目标审批流程是指待用所述基于OCR的流程快速建模方法智能化构建标准化审批流程的流程,示范性的如产品销售中的合同审批、出入口审批、发票审批等。通过对所述目标审批流程的审批内容、适用行业和领域、包括的审批类型以及涉及的审批用户等等进行全方位、多维度的特征信息采集,进而基于多特征采集结果,得到所述目标审批流程中包含的所有审批表类型,并组成所述申请表集合。示范性的如产品销售中的合同签订审批、领料出库审批、生产投用审批、产品入库审批、发货审批、回款确认审批等各类审批表。通过对目标审批流程进行针对性特征采集和分析,得到对应的所有申请表类型,为后续针对性建立标准化的申请表提供基础。
S200:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;
通过多特征采集和分析得到所述目标审批流程中涉及到的所有申请表类型,进一步依次分析各类申请表对应的审批用户,即具有审批各类申请表权限的用户。也就是说,依次确定所述多类申请表中各类申请表的审批用户,并分别组成审批用户集合。其中,所述审批用户集合与各类申请表具有一一对应关系,因此根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表。通过构建申请表-审批用户列表,达到了为后续优化审批流程,确定各审批任务的最佳处理用户等提供分析筛选范围,进而提高系统可靠性的效果。
S300:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;
所述申请表审批任务是指待利用所述基于OCR的流程快速建模系统进行审批任务分配、优化审批流程、提高审批智能化程度的审批任务。其中,所述申请表审批任务可以由相关用户新建添加发起,也可以由相关审批用户审批通过后流转至下一审批层级生成。示范性的如某销售经理新建添加一个销售合同,待上级销售主管、部门领导等审批,或者某部门领导审批完成一个出库发货申请表后,该出库发货申请表自动流转至财务部门员工及领导等。进一步的,对所述申请表审批任务进行具体分析,并在所述申请表集合中遍历,从而确定所述申请表审批任务中申请表的类型,即所述目标申请表的类型。进而,结合所述申请表-审批用户列表匹配得到所述目标申请表的类型的目标审批用户集合。通过遍历、匹配分析确定有权限和责任处理所述申请表审批任务的所有用户人员,并组成目标审批用户集合,为后续确定处理所述申请表审批任务的最佳处理人员提供寻优范围,提高目标审批用户的寻优准确性。
S400:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
所述粒子群优化算法用于在所有有权限和责任处理所述申请表审批任务的目标审批用户集合中寻找当前最适合审批处理所述申请表审批任务的用户,通过基于粒子群优化算法构建任务分配模型。其中,所述任务分配模型通过对所述目标审批用户集合中的各个目标审批用户依次进行分析,对其当前的工作情况等进行量化,从而确定当前最适合处理所述申请表审批任务的用户。其中,适合是指有时间处理所述申请表审批任务,同时由其处理可以有效提高整个审批效率,且各用户工作平衡等。最终确定的处理所述申请表审批任务的用户即为所述目标审批用户。通过任务分配模型的智能化计算和分析,实现了优化任务分配,提高审批效率的目标。
本实施例中,上述步骤S400包括:
第一步:提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;
第二步:根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:
Figure DEST_PATH_IMAGE030
其中,所述
Figure DEST_PATH_IMAGE004_5A
是指所述用户,所述
Figure DEST_PATH_IMAGE006A
是指所述用户
Figure DEST_PATH_IMAGE004_6A
处理完所述实时任 务列表的总时间,即所述实时负载,所述
Figure DEST_PATH_IMAGE008_5A
是指所述实时任务列表中任意一类任务,记作 第
Figure DEST_PATH_IMAGE010AAAA
类任务
Figure DEST_PATH_IMAGE008_6A
,所述
Figure DEST_PATH_IMAGE012A
是指所述实时任务列表中共有
Figure DEST_PATH_IMAGE014A
类任务,所述
Figure DEST_PATH_IMAGE016A
是指 所述用户
Figure DEST_PATH_IMAGE004_7A
处理完所述实时任务列表中第
Figure DEST_PATH_IMAGE010_5A
类任务
Figure DEST_PATH_IMAGE008_7A
的总时间,所述
Figure DEST_PATH_IMAGE018A
是指所述实时 任务列表中第
Figure DEST_PATH_IMAGE010_6A
类任务
Figure DEST_PATH_IMAGE008_8A
的总个数,所述
Figure DEST_PATH_IMAGE020A
是指所述实时任务列表中第
Figure DEST_PATH_IMAGE010_7A
类任务
Figure DEST_PATH_IMAGE008_9A
中 每个任务的处理时间;
第三步:将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:
Figure DEST_PATH_IMAGE032
其中,所述
Figure DEST_PATH_IMAGE024A
是指所述用户
Figure DEST_PATH_IMAGE004_8A
处理所述实时任务列表和所述申请表审 批任务的总时间,即所述预测负载,所述
Figure DEST_PATH_IMAGE026A
是指所述用户
Figure DEST_PATH_IMAGE004_9A
处理所述申请表审批任 务的时间,所述
Figure DEST_PATH_IMAGE028A
是指所述申请表审批任务;
第四步:基于所述用户的预测负载,利用粒子群优化算法确定所述目标审批用户。
所述任务分配模型在对所述目标审批用户集合中各个用户进行分析时,首先任意选择所述目标审批用户集合中的一个用户,并查找得到该用户当前待处理的所有审批任务数据,即所述用户的所述实时任务列表。然后对所述实时任务列表中各个任务进行分析,并计算得到所述用户完成所述实时任务列表中所有任务需要花费的时间,并将其定义为所述用户的实时负载。其中,所述实时负载的计算公式如下:
Figure DEST_PATH_IMAGE034
其中,所述
Figure DEST_PATH_IMAGE004_10A
是指所述用户,所述
Figure DEST_PATH_IMAGE006AA
是指所述用户
Figure DEST_PATH_IMAGE004_11A
处理完所述实时任 务列表的总时间,即所述实时负载,所述
Figure DEST_PATH_IMAGE008_10A
是指所述实时任务列表中任意一类任务,记作 第
Figure DEST_PATH_IMAGE010_8A
类任务
Figure DEST_PATH_IMAGE008_11A
,所述
Figure DEST_PATH_IMAGE012AA
是指所述实时任务列表中共有
Figure DEST_PATH_IMAGE014AA
类任务,所述
Figure DEST_PATH_IMAGE016AA
是指 所述用户
Figure DEST_PATH_IMAGE004_12A
处理完所述实时任务列表中第
Figure DEST_PATH_IMAGE010_9A
类任务
Figure DEST_PATH_IMAGE008_12A
的总时间,所述
Figure DEST_PATH_IMAGE018AA
是指所述实时 任务列表中第
Figure DEST_PATH_IMAGE010_10A
类任务
Figure DEST_PATH_IMAGE008_13A
的总个数,所述
Figure DEST_PATH_IMAGE020AA
是指所述实时任务列表中第
Figure DEST_PATH_IMAGE010_11A
类任务
Figure DEST_PATH_IMAGE008_14A
中 每个任务的处理时间。也就是说,用户当前处理其所有审批任务需要的时间越长,对应其负 载越大。
进一步的,假设将所述申请表审批任务分配给该用户,模型进一步智能化分析,并计算得到所述用户分配到所述申请表审批任务后的负载预测,即所述用户的预测负载,其中,所述预测负载的计算公式如下:
Figure DEST_PATH_IMAGE036
其中,所述
Figure DEST_PATH_IMAGE024AA
是指所述用户
Figure DEST_PATH_IMAGE004_13A
处理所述实时任务列表和所述申请表审 批任务的总时间,即所述预测负载,所述
Figure DEST_PATH_IMAGE026AA
是指所述用户
Figure DEST_PATH_IMAGE004_14A
处理所述申请表审批任 务的时间,所述
Figure DEST_PATH_IMAGE028AA
是指所述申请表审批任务。也就是说,所述用户分配到所述申请表审批 任务后的负载为所述用户完成当前实时任务列表中各任务与完成所述申请表审批任务的 时间之和。最后对比所述目标审批用户集合中各个目标审批用户的预测负载,筛选预测负 载最小的用户作为所述申请表审批任务的处理人,即所述目标审批用户。
通过对各个拥有审批权限和审批义务的用户进行分析,确定各个用户当前的审批工作量,并计算得到各个用户的实时负载,实现对各个用户负载的量化和直观化目标,进而对各用户一旦分配到该审批任务后的审批负载进行计算预测,达到了基于直观数据的优化筛选和确认,保证了目标审批用户的分配合理性,并为提高整体审批效率和审批质量提供基础的技术效果。
如图2所示,图2为本发明基于OCR的流程快速建模方法中确定目标审批用户的流程示意图。本实施例中,上述确定所述目标审批用户的方法包括:
第一步:基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;
第二步:基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;
第三步:提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;
第四步:基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;
第五步:将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户。
根据计算得到的所述目标审批用户集合中各个用户的预测负载数据,筛选分配到所述申请表审批任务后,其任务负载仍处于正常范围,即任务负载不会超过最大负载,出现过饱和情况的用户,将筛选到的符合条件的用户组成所述预选目标审批用户集合。示范性的如相关人员基于公司总审批数量、有审批权限的员工数量、历史人均审核任务负载等综合分析后确定预设负载阈值,从而筛选分配到所述申请表审批任务后,预测负载符合所述预设负载阈值的所有审批用户,作为分配所述申请表审批任务的候选用户,即所述预选目标审批用户集合。
进而,分析所述预选目标审批用户集合中,各个用户处理所述申请表审批任务的前后完整审批流程,从而得到所述申请表审批任务的审批工作流,进一步的,对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图。举例如某出库申请表审批任务,可以分配给生产员工、发货员工、生产主管、部门主管等,其中,当该出库申请表审批任务分配给生产员工后,下级审核还包括生产主管、部门主管;当该出库申请表审批任务分配给发货员工后,下级审核同样还包括生产主管、部门主管;当该出库申请表审批任务分配给生产主管后,下级审核仅包括部门主管;当该出库申请表审批任务分配给部门主管后,此次审批完成。
再进一步的,依次对所述有向无环图中的各个审批流程进行分析,并计算各个流程审批的时间成本,从而根据审批时间成本计算各个流程的适配度指数,反向匹配适配度指数最高的流程对应的审批用户,将其作为所述申请表审批任务的处理人。具体来说,首先提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合。示范性的如某出库申请表审批任务,可以分配给生产员工、发货员工、生产主管、部门主管等,选取当该出库申请表审批任务分配给生产员工后,下级审核还包括生产主管、部门主管的审批流程,因此该审批流程中包括生产员工审批任务、生产主管审批任务、部门主管审批任务,一共三个流程任务。然后基于所述流程任务集合计算所述流程的总时间成本,其中,总时间成本的计算公式如下:
Figure DEST_PATH_IMAGE038
其中,所述
Figure DEST_PATH_IMAGE040
是指完成流程任务集合中所有任务的时间,所述
Figure DEST_PATH_IMAGE042
是指审 批任务在上下级两层审批之间的流转时间,即任务
Figure DEST_PATH_IMAGE010_12A
和任务
Figure DEST_PATH_IMAGE044
之间的流转时间,且
Figure DEST_PATH_IMAGE046
,所述
Figure DEST_PATH_IMAGE048
是指所述流程中所有审批任务的总个数,所述
Figure DEST_PATH_IMAGE050
是指整个流程任务完成 需要的总时间。其中,所述
Figure DEST_PATH_IMAGE040A
的计算公式如下:
Figure DEST_PATH_IMAGE052
其中,所述是指完成流程任务集合中所有任务的时间,所述是指流程任务集合中所有审批用户总数量。
最后,根据所述流程的总时间成本确定所述流程的适配度指数。其中,适配度指数与所述流程的总时间成本为负相关关系,也就是说,总时间成本越高,对应适配度越低。所述适配度指数的计算公式如下:
Figure DEST_PATH_IMAGE054
其中,所述
Figure DEST_PATH_IMAGE056
是指有向无环图中第x个审批流程,所述
Figure DEST_PATH_IMAGE058
是指所述第x 个审批流程的总时间成本,所述
Figure DEST_PATH_IMAGE060
是指有向无环图中总流程个数。通过计算得到向无环 图中各个流程的适配度指数,进而筛选所述适配度指数最大的流程,并确定该流程中的审 批用户,并将该审批用户作为所述目标审批用户。
通过基于适配度函数计算,确定了审批流转时间成本最低、审批效率最高,且任务分配和审批方案合理的目标审批用户,达到了提高审批任务分配合理性,进而提高系统准确性的技术效果。
S500:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
所述OCR是指利用扫描仪或图像采集装置等采集申请表图像信息,并基于图像亮、暗情况分析确定图像上的文字信息,从而智能识别审批申请表的技术。通过所述OCR构建得到所述表单识别模型,并利用所述表单识别模型对所述目标申请表进行智能识别,得到识别信息。通过表单识别模型提高了审批申请表的识别效率和识别准确率,缩短了用户审批时阅读申请表的时间,达到了提高系统性能的效果。
如图3所示,图3为本发明基于OCR的流程快速建模方法中组成目标申请表的识别信息的流程示意图。本实施例中,上述步骤S500包括:
第一步:构建所述表单识别模型,其中,所述表单识别模型包括预处理层、裁剪层、分割层、识别层;
第二步:获得所述目标申请表的图像,并利用所述预处理层对所述图像进行处理,得到预处理图像;
如图4所示,图4为本发明基于OCR的流程快速建模方法中得到预处理图像的流程示意图。本实施例中,上述得到预处理图像的方法包括:
首先:将灰度化单元、二值化单元、降噪单元依次内嵌至所述预处理层;
然后:所述灰度化单元基于最大值法对所述图像进行变换,得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图;
接着:基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值;
接着:所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图;
最后:所述降噪单元基于高斯滤波算法原理,对所述二值图进行降噪,得到所述预处理图像。
第三步:利用所述裁剪层对所述预处理图像进行裁剪,得到内容预处理图像;
第四步:利用所述分割层将所述内容预处理图像中的各连续字符依次进行分割,得到多个待识别块;
第五步:利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。
在利用所述表单识别模型对目标申请表进行智能识别时,首先,通过所述表单识别模型中的预处理层,对相关智能设备采集到的所述目标申请表的图像进行预处理,其中包括通过灰度化单元处理得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图,接着通过所述二值化单元对灰度化单元处理得到的灰度图进行黑白处理得到二值图,再接着利用降噪单元,对二值化单元处理得到的二值图进行智能降噪。其中,基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值,所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图。然后,利用所述裁剪层对所述预处理图像进行裁剪,将空白边缘等进行剪除,从而降低系统处理空白部分的内存消耗和计算浪费,同时也为后续识别文字内容等提供基础,并有效降低识别错误率。进一步的,对裁剪得到的内容预处理图像进行分割,将连续的文字片段裁剪为一块,从而得到有字符信息的多个待识别块。最后,利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。
通过表单识别模型中各智能层的协作处理,实现对目标申请表中内容的智能识别,降低了人工识别手写文字等的困难,有效提高了申请表内容识别效率和识别准确率,达到了基于OCR的快速识别效果。
本实施例中,上述在所述组成目标申请表的识别信息之后,还包括以下步骤:
首先,采集审批流程中的签名数据、印章数据,并组建审批通过数据库;
然后,判断所述目标申请表是否为初始申请表,若所述目标申请表不是初始申请表,提取所述目标申请表的审批意见信息;
最后,对所述审批意见信息进行分析,并将分析结果在所述审批通过数据库中进行遍历,根据遍历结果生成智能审批结果。
在利用表单识别模型对目标申请表中的文字内容进行智能识别,并得到对应识别信息后,系统对所述目标申请表的发起信息进行采集,判断所述目标申请表是否为初始申请表,也就是说,判断所述初始申请表是否为用户新建立添加的申请表。其中,当所述目标申请表不是初始申请表,即不是新建立添加的审批申请表时,系统自动提取所述目标申请表的审批意见信息,并对所述审批意见信息进行分析,得到审批意见分析结果。在此之前,首先对目标审批流程中涉及到的审批意见数据进行采集,并构建审批通过数据库。其中,所述审批通过数据库包括签名通过审批、盖章通过审批。进一步,将分析得到的所述审批意见分析结果在所述审批通过数据库中进行遍历,当遍历得到相同的审批意见分析结果时,说明该目标申请表已经通过了上级审批,同时也说明所述目标申请表不是新建立添加的申请表,而是经由其他审批用户审批通过,自动流转得到的审批任务。
通过对目标申请表进行来源分析,对新建立添加的申请审批直接进行审批处理,而对审批流程中,其他层级审批通过后流转的审批任务进行上一轮审批通过检验,从而智能化得到当前申请表的审批结果,为用户审批提供参考。
S600:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
如图5所示,图5为本发明基于OCR的流程快速建模方法中得到标准目标申请表的流程示意图。本实施例中,上述步骤S600包括:
首先,获得所述目标申请表的标准化表单,并提取所述标准化表单的指标类目,组建标准指标类目集;
然后,基于所述识别信息,依次提取所述标准指标类目集中各标准指标类目的识别数据;
最后,将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。
在智能化生成所述目标申请表的标准目标申请表之前,首先分析所述目标申请表的表单类型,并个性化分析确定该类型表单的审批指标和审批类目,即组建标准指标类目集。然后基于所述标准指标类目集,依次对识别信息进行对应提取,得到所述标准指标类目集中各标准指标类目的识别数据。最后,将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。示范性的如某销售合同审批表中,销售甲方客户名称、销售乙方名称、销售产品名称及规格、销售数量、销售单价、交货时间及方式等,均为销售类合同审批的标准审批指标类目。通过智能化识别各标准指标类目的数据信息,并对应填充至标准化表单,从而实现了智能化生成标准目标申请表的技术目标,同时通过人工校验可以有效提高标准目标申请表的生成准确率,保证审批质量。
本发明对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。相较于现有技术,本发明通过任务分配模型智能化匹配任务处理人员,有效提高任务处理效率、最大化人员价值,实现了优化审批流程的技术目标。通过表单识别模型对待审批表单进行智能化识别分析,降低人员处理任务的工作难度,达到了提高决策频度和工作质量的技术效果。因此,本发明可提高审批工作效率和审批质量。
本发明提出一种基于OCR的流程快速建模系统。
请参阅图6,是本发明基于OCR的流程快速建模程序10第二实施例的运行环境示意图。
在本实施例中,基于OCR的流程快速建模程序10安装并运行于电子装置1中。电子装置1可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置1可包括,但不仅限于,存储器11、处理器12及显示器13。图6仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
存储器11在一些实施例中可以是电子装置1的内部存储单元,例如该电子装置1的硬盘或内存。存储器11在另一些实施例中也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(SecureDigital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11用于存储安装于电子装置1的应用软件及各类数据,例如批量注册行为的识别程序10的程序代码等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行批量注册行为的识别程序10等。
显示器13在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器13用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。电子装置1的部件11-13通过程序总线相互通信。
请参阅图7,是本发明基于OCR的流程快速建模10第二实施例的程序模块图。
在本实施例中,基于OCR的流程快速建模程序10可以被分割成一个或多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明。例如,在图7中,基于OCR的流程快速建模程序10可以被分割成组建模块101、构建模块102、匹配模块103、确定模块104、获得模块105、执行模块106。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述基于OCR的流程快速建模程序10在电子装置1中的执行过程,其中:
组建模块101:用于对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
构建模块102:用于依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;
匹配模块103:用于获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;
确定模块104:用于基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
获得模块105:用于基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
执行模块106:用于根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
本发明还提供一种计算机设备,其中,包括处理器和存储器;
该处理器,用于处理执行上述实施例一中任一项所述基于OCR的流程快速建模方法的步骤;
该存储器,该存储器与该处理器耦合,用于存储程序,当基于OCR的流程快速建模程序被该处理器执行时,使系统以执行上述任一项基于OCR的流程快速建模方法的步骤。
进一步,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序可被至少一个处理器执行,以使所述至少一个处理器执行上述任一实施例中的基于OCR的流程快速建模方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (8)

1.一种基于OCR的流程快速建模方法,其特征在于,包括:
组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;
匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;
确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户,包括:
提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;
根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:
Figure 458599DEST_PATH_IMAGE001
其中,所述
Figure 172477DEST_PATH_IMAGE002
是指所述用户,所述
Figure 217794DEST_PATH_IMAGE003
是指所述用户
Figure 144161DEST_PATH_IMAGE002
处理完所述实时任务列表 的总时间,即所述实时负载,所述
Figure 224113DEST_PATH_IMAGE004
是指所述实时任务列表中任意一类任务,记作第
Figure 328466DEST_PATH_IMAGE005
类任 务
Figure 126658DEST_PATH_IMAGE004
,所述
Figure 856717DEST_PATH_IMAGE006
是指所述实时任务列表中共有
Figure 791175DEST_PATH_IMAGE007
类任务,所述
Figure 50118DEST_PATH_IMAGE008
是指所述用户
Figure 584873DEST_PATH_IMAGE002
处 理完所述实时任务列表中第
Figure 587464DEST_PATH_IMAGE005
类任务
Figure 376429DEST_PATH_IMAGE004
的总时间,所述
Figure 337431DEST_PATH_IMAGE009
是指所述实时任务列表中第
Figure 844636DEST_PATH_IMAGE005
类 任务的
Figure 401650DEST_PATH_IMAGE004
总个数,所述
Figure 310701DEST_PATH_IMAGE010
是指所述实时任务列表中第
Figure 911446DEST_PATH_IMAGE005
类任务
Figure 171526DEST_PATH_IMAGE004
中每个任务的处理时间;
将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:
Figure 515920DEST_PATH_IMAGE011
其中,所述
Figure 279477DEST_PATH_IMAGE012
是指所述用户
Figure 316703DEST_PATH_IMAGE013
处理所述实时任务列表和所述申请表审批任务的 总时间,即所述预测负载,所述
Figure 53627DEST_PATH_IMAGE014
是指所述用户
Figure 201711DEST_PATH_IMAGE013
处理所述申请表审批任务的时间,所 述
Figure 819774DEST_PATH_IMAGE015
是指所述申请表审批任务;
基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;
基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;
提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;
基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;
将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户;
获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
2.根据权利要求1所述的流程快速建模方法,其特征在于,所述获得步骤包括:
构建所述表单识别模型,其中,所述表单识别模型包括预处理层、裁剪层、分割层、识别层;
获得所述目标申请表的图像,并利用所述预处理层对所述图像进行处理,得到预处理图像;
利用所述裁剪层对所述预处理图像进行裁剪,得到内容预处理图像;
利用所述分割层将所述内容预处理图像中的各连续字符依次进行分割,得到多个待识别块;
利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。
3.根据权利要求2所述的流程快速建模方法,其特征在于,所述得到预处理图像,包括:
将灰度化单元、二值化单元、降噪单元依次内嵌至所述预处理层;
所述灰度化单元基于最大值法对所述图像进行变换,得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图;
基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值;
所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图;
所述降噪单元基于高斯滤波算法原理,对所述二值图进行降噪,得到所述预处理图像。
4.根据权利要求2所述的流程快速建模方法,其特征在于,在所述组成目标申请表的识别信息之后,还包括以下步骤:
采集审批流程中的签名数据、印章数据,并组建审批通过数据库;
判断所述目标申请表是否为初始申请表,若所述目标申请表不是初始申请表,提取所述目标申请表的审批意见信息;
对所述审批意见信息进行分析,并将分析结果在所述审批通过数据库中进行遍历,根据遍历结果生成智能审批结果。
5.根据权利要求1所述的流程快速建模方法,其特征在于,所述执行步骤包括:
获得所述目标申请表的标准化表单,并提取所述标准化表单的指标类目,组建标准指标类目集;
基于所述识别信息,依次提取所述标准指标类目集中各标准指标类目的识别数据;
将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。
6.一种基于OCR的流程快速建模系统,所述基于OCR的流程快速建模系统包括存储器和处理器,其特征在于,所述存储器上存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序被所述处理器执行时实现如下步骤:
组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表-审批用户列表;
匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表-审批用户列表匹配目标审批用户集合;
确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户,包括:
提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;
根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:
Figure 27902DEST_PATH_IMAGE016
其中,所述
Figure 996995DEST_PATH_IMAGE002
是指所述用户,所述
Figure 683191DEST_PATH_IMAGE003
是指所述用户
Figure 172072DEST_PATH_IMAGE002
处理完所述实时任务列表 的总时间,即所述实时负载,所述
Figure 551101DEST_PATH_IMAGE004
是指所述实时任务列表中任意一类任务,记作第
Figure 7490DEST_PATH_IMAGE005
类任 务
Figure 497377DEST_PATH_IMAGE004
,所述
Figure 90033DEST_PATH_IMAGE006
是指所述实时任务列表中共有
Figure 639963DEST_PATH_IMAGE007
类任务,所述
Figure 567336DEST_PATH_IMAGE008
是指所述用户
Figure 860914DEST_PATH_IMAGE002
处 理完所述实时任务列表中第
Figure 573656DEST_PATH_IMAGE005
类任务
Figure 28908DEST_PATH_IMAGE004
的总时间,所述
Figure 459889DEST_PATH_IMAGE009
是指所述实时任务列表中第
Figure 291579DEST_PATH_IMAGE005
类 任务
Figure 609559DEST_PATH_IMAGE004
的总个数,所述
Figure 501291DEST_PATH_IMAGE010
是指所述实时任务列表中第类
Figure 153990DEST_PATH_IMAGE005
任务中每个任务
Figure 789370DEST_PATH_IMAGE004
的处理时间;
将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:
Figure 945545DEST_PATH_IMAGE017
其中,所述
Figure 8179DEST_PATH_IMAGE012
是指所述用户
Figure 397441DEST_PATH_IMAGE013
处理所述实时任务列表和所述申请表审批任务的 总时间,即所述预测负载,所述
Figure 836513DEST_PATH_IMAGE014
是指所述用户
Figure 112773DEST_PATH_IMAGE013
处理所述申请表审批任务的时间,所 述
Figure 346308DEST_PATH_IMAGE015
是指所述申请表审批任务;
基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;
基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;
提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;
基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;
将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户;
获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
7.一种计算机设备,其特征在于,包括处理器和存储器;
所述处理器,用于处理执行权利要求1-5中任一项所述的方法;
所述存储器,所述存储器与所述处理器耦合,用于存储程序,当所述程序被所述处理器执行时,使所述处理器以执行权利要求1-5中任一项所述方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-5中的任一项所述的基于OCR的流程快速建模方法的步骤。
CN202210989621.1A 2022-08-18 2022-08-18 基于ocr的流程快速建模方法、系统、设备及存储介质 Active CN115062876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210989621.1A CN115062876B (zh) 2022-08-18 2022-08-18 基于ocr的流程快速建模方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210989621.1A CN115062876B (zh) 2022-08-18 2022-08-18 基于ocr的流程快速建模方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115062876A CN115062876A (zh) 2022-09-16
CN115062876B true CN115062876B (zh) 2022-11-08

Family

ID=83208204

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210989621.1A Active CN115062876B (zh) 2022-08-18 2022-08-18 基于ocr的流程快速建模方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115062876B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116823152A (zh) * 2023-05-31 2023-09-29 杭州微宏科技有限公司 一种线下表单的自动线上化方法、系统、装置和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264288A (zh) * 2019-05-20 2019-09-20 深圳壹账通智能科技有限公司 基于信息识别技术的数据处理方法及相关装置
CN111612166A (zh) * 2020-04-23 2020-09-01 中国科学院计算机网络信息中心 一种基于机器学习的报销时间预测方法
CN112598366A (zh) * 2020-11-27 2021-04-02 北京理工大学 一种资产管理审批流程自动化规划方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012146106A (ja) * 2011-01-12 2012-08-02 Hitachi Ltd 代理承認機能付きワークフローシステム
US20170329506A1 (en) * 2016-05-13 2017-11-16 Servicenow, Inc. Visual workflow model
US20190114574A1 (en) * 2017-10-17 2019-04-18 Api Healthcare Corporation Machine-learning model trained on employee workflow and scheduling data to recognize patterns associated with employee risk factors

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264288A (zh) * 2019-05-20 2019-09-20 深圳壹账通智能科技有限公司 基于信息识别技术的数据处理方法及相关装置
CN111612166A (zh) * 2020-04-23 2020-09-01 中国科学院计算机网络信息中心 一种基于机器学习的报销时间预测方法
CN112598366A (zh) * 2020-11-27 2021-04-02 北京理工大学 一种资产管理审批流程自动化规划方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
工作流技术在工程项目合同审批中的应用研究;未红霞等;《计算机应用与软件》;20130815(第08期);1748-1754 *
成本最优化工作流技术驱动的研发协同软件即服务应用;武星等;《计算机集成制造系统》;20130815(第08期);155-157、177 *

Also Published As

Publication number Publication date
CN115062876A (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN109543096B (zh) 数据查询方法、装置、计算机设备和存储介质
CN110704572B (zh) 疑似非法集资风险的预警方法、装置、设备和存储介质
CN111985937A (zh) 交易商价值信息评估方法、系统、存储介质、计算机设备
CN115062876B (zh) 基于ocr的流程快速建模方法、系统、设备及存储介质
Adebiyi Exploring the impact of predictive analytics on accounting and auditing expertise: A regression analysis of LinkedIn survey data
CN107133862A (zh) 动态产生增强信用评估的详细交易支付经历的方法和系统
CN115578167A (zh) 一种基于大数据的财税核算处理系统
CN116843481A (zh) 知识图谱分析方法、装置、设备及存储介质
CN115936895A (zh) 基于人工智能的风险评估方法、装置、设备及存储介质
CN115018513A (zh) 数据巡检方法、装置、设备及存储介质
CN117875320A (zh) 基于人工智能的数据处理方法、装置、设备及存储介质
CN116012019B (zh) 一种基于大数据分析的金融风控管理系统
CN117635185A (zh) 一种基于大数据的造价在线管理方法及服务器
CN116862699A (zh) 一种智能财务结算机器人系统及设备
Shino et al. Implementation of Data Mining with Naive Bayes Algorithm for Eligibility Classification of Basic Food Aid Recipients
CN110796381A (zh) 建模数据评价指标的处理方法、装置、终端设备及介质
CN116720118A (zh) 标签质量智能分析方法、装置、电子设备及存储介质
Sebt et al. Implementing a data mining solution approach to identify the valuable customers for facilitating electronic banking
KR102543211B1 (ko) 비정형 기업 데이터를 이용한 기업성장 예측 시스템
CN111242341A (zh) 一种线路定价方法、装置、设备和存储介质
CN115237970A (zh) 数据预测方法、装置、设备、存储介质及程序产品
CN113312482A (zh) 问题分类方法、装置、电子设备及可读存储介质
Lee Robotics Process Automation (RPA) And The Import/Export Customs Declaration Process
CN115759875B (zh) 一种公共资源交易的供应商分类分级管理方法及系统
JP5592861B2 (ja) 債権評価支援システム、債権評価支援方法及び債権評価支援プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant