WO2021047182A1

WO2021047182A1 - 基于ocr的图片数据识别方法、装置、及计算机设备

Info

Publication number: WO2021047182A1
Application number: PCT/CN2020/087132
Authority: WO
Inventors: 张�杰
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-09-11
Filing date: 2020-04-27
Publication date: 2021-03-18
Also published as: CN110781726A

Abstract

本申请公开了基于OCR的图片数据识别方法、装置、计算机设备及存储介质。该方法包括将待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新得到标准化待识别图片集；获取各标准化待识别图片分别对应的图片类型；通过图像识别获取各标准化待识别图片中指定区域分别对应的识别数值；将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值。该方法实现了将非正向图片均进行旋转得到标准正向图片后，通过图像识别技术识别发票金额和进行核算，提高了核算效率，而且计算准确率高。

Description

基于OCR的图片数据识别方法、装置、及计算机设备

本申请要求于2019年9月11日提交中国专利局、申请号为201910858699.8，发明名称为“基于OCR的图片数据识别方法、装置、及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像识别技术领域，尤其涉及一种基于OCR的图片数据识别方法、装置、计算机设备及存储介质。

背景技术

在财务报销的时候，报销人员需要填写报销表格和粘贴发票，然后由财务人员审核、计算发票的金额和表格中金额是否一致，发票金额必须>＝表格中所报销的金额才能进行后续报销流程。

目前，已出现了在线的办公协同系统，其中也存在在线报销的功能模块。用户在系统上报销时需填写报销信息，并上传报销所提供发票的扫描文件。但是财务人员在使用在线报销的功能模块时，发明人意识到报销人员所填写的报销信息，以及扫描文件均只是保存于在线的办公协同系统的服务器中以供用户查询历史数据，并未利用其中的信息进行金额的自动核算，仍需人工根据报销表格和所粘贴发票核算，而人工核算的过程比较繁琐，这就导致核算效率低下，而且易出错。

发明内容

本申请实施例提供了一种基于OCR的图片数据识别方法、装置、计算机设备及存储介质，旨在解决现有技术中在线的办公协同系统的线报销的功能模块中，报销人员所填写的报销信息，以及扫描文件均只是保存以供用户查询历史数据，仍需人工根据报销表格和所粘贴发票核算，而人工核算的过程比较繁琐，导致核算效率低下，而且易出错的问题。

第一方面，本申请实施例提供了一种基于OCR的图片数据识别方法，其包括：接收上传端所上传的待识别图片集；将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及将所述实际总和值发送至上传端。

第二方面，本申请实施例提供了一种基于OCR的图片数据识别装置，其包括：

图片集接收单元，用于接收上传端所上传的待识别图片集；

图片标准化单元，用于将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；

图片类型获取单元，用于获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；

识别数值获取单元，用于通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；

总数据表获取单元，用于获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；

求和单元，用于将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及

和值发送单元，用于将所述实际总和值发送至上传端。

第三方面，本申请实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现一种基于OCR的图片数据识别方法，其包括：接收上传端所上传的待识别图片集；将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及将所述实际总和值发送至上传端。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行一种基于OCR的图片数据识别方法，其包括：接收上传端所上传的待识别图片集；将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及将所述实际总和值发送至上传端。

本申请实施例提供了一种基于OCR的图片数据识别方法、装置、计算机设备及存储介质。该方法实现了将非正向图片均进行旋转得到标准正向图片后，通过图像识别技术识别发票金额和进行核算，提高了核算效率，而且计算准确率高。

附图说明

图1为本申请实施例提供的基于OCR的图片数据识别方法的应用场景示意图；

图2为本申请实施例提供的基于OCR的图片数据识别方法的流程示意图；

图3为本申请实施例提供的基于OCR的图片数据识别方法的另一流程示意图；

图4a为本申请实施例提供的基于OCR的图片数据识别方法中非正向图片的示意图；

图4b为本申请实施例提供的基于OCR的图片数据识别方法中标准正向图片的示意图；

图5为本申请实施例提供的基于OCR的图片数据识别方法的子流程示意图；

图6为本申请实施例提供的基于OCR的图片数据识别装置的示意性框图；

图7为本申请实施例提供的基于OCR的图片数据识别装置的另一示意性框图；

图8为本申请实施例提供的基于OCR的图片数据识别装置的子单元示意性框图；

图9为本申请实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1和图2，图1为本申请实施例提供的基于OCR的图片数据识别方法的应用场景示意图；图2为本申请实施例提供的基于OCR的图片数据识别方法的流程示意图，该基于OCR的图片数据识别方法应用于服务器中，该方法通过安装于服务器中的应用软件进行执行。

如图2所示，该方法包括步骤S110～S170。

S110、接收上传端所上传的待识别图片集。

在本实施例中，具体的应用场景为财务报销时，需操作上传端(如智能手机、平板电脑等)在线上直接上传发票扫描文件或照片至服务器，之后还可以选填所需报销的期望金额。由服务器根据所上传的发票扫描文件或照片进行报销金额的计算，无需用户人工核算。

S120、将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集。

在本实施例中，由于所述待识别图片集中可能存在扫描方向不是正方向的图片，此时需服务器统一对所述待识别图片集中非正向图片均进行旋转得到标准正向图片，从而实现所有待识别图片的标准正向化。

在一实施例中，如图3所示，步骤S120之前还包括：

S1201、判断所述待识别图片集中是否存在非正向图片；若所述待识别图片集中存在非正向图片，执行步骤S1202；若所述待识别图片集中不存在非正向图片，执行步骤S130；

S1202、根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度。

在本实施例中，上传端上传了所述待识别图片集时，可能其中包括的发票扫描文件的扫描方向并不是正方向(发票扫描文件的正方向是指票头各文字的中心点连线得到的方向线与扫描文件的页面的底边的夹角为0，也即两者是平行的，而且票头位于扫描文件的最上方)，此时需要对其中非正向图片对应进行旋转，例如如图4a所示的非正向图片。

此时，可根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度。例如如图4a所示的非正向图片中识别得到的首行文字为“第X联：XX联”；上述这些文字是在非正向图片上侧的中部。而参考如图4b中的标准正向图片中“第X联：XX联”这些相同文字对应位置是在标准正向图片中右侧中部。

在一实施例中，步骤S1201中包括：

通过图像识别获取待识别图片集中各待识别图片的首行文字，若有待识别图片的首行文字不包括预先设置的第一关键词列表中的关键词，将对应的待识别图片作为非正向图片。

在本实施例中，通过OCR图像识别模型先识别待识别图片集中各待识别图片的首行文字，是利用OCR技术的逐行从左至右的扫描原理。

OCR技术是光学字符识别的缩写(Optical Character Recognition)，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。

若首行文字中不包括预先设置的第一关键词列表中的关键词(如先设置的第一关键词列表中包括专用发票、普通发票、定额发票等关键词)，表示该待识别图片为非正向图片。

结合图4a和图4b，根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度时，可知该旋转角度为-90度(其中非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取实际角度为逆时针方向90度，若记逆时针方向为正方向，那为了将非正向图片旋转为标准正向图片，需要顺时针旋转90度)，将所述待识别图片集中的非正向图片根据对应的旋转角度进行图片旋转，得到标准化待识别图片集。

S130、获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型。

在本实施例中，请参考图4b，例如出租车的车载端所打出来的发票就是机打发票，一般纳税人给个人或其他一般纳税人开具的发票为增值税专用发票或增值税普通发票，停车票为定额发票。发票内容一般包括：票头、字轨号码、联次及用途、客户名称、银行开户账号、商(产)品名称或经营项目、计量单位、数量、单价、金额，以及大小写金额、经手人、单位印章、开票日期等。实行增值税的单位所使用的增值税专用发票还应有税种、税率、税额等内容。在对所述标准化待识别图片集中各标准化待识别图片进行图片类型的识别时，即可根据票头实现准确识别。

在一实施例中，步骤S130包括：

通过OCR图像识别模型识别各标准化待识别图片的票头，以得到各标准化待识别图片分别对应的图片类型。

在本实施例中，获取所述待识别图片集中各待识别图片分别对应的图片类型时，可以通过OCR图像识别模型识别各标准化待识别图片的票头，即可获取所述待识别图片集中各待识别图片分别对应的图片类型。例如某一标准化待识别图片票头为XXX增值税专用发票，表示该标准化待识别图片的图片类型为第一图片类型。

S140、通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值。

在本实施例中，通过OCR图像识别模型识别各标准化待识别图片的图片内容文本后，其中包括有合计这一关键词，或者价税合计这一关键词。在定位了各标准化待识别图片分别对应的图片内容文本中合计或价税合计的关键词位置后，即可获知合计或价税合计的关键词之后的识别数值(例如图4b中的价税合计栏之后所示的这一数值)。通过对标准化待识别图片中预设的指定区域的文本识别，即可准确获取对应的识别数值。

在一实施例中，如图5所示，步骤S140包括：

S141、获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片内容文本；

S142、定位获取各标准化待识别图片的图片内容文本中与预设的第二关键词列表中关键词相同的文本内容，以文本内容之后对应的数值作为各标准化待识别图片对应的识别数值。

在本实施例中，先通过OCR图像识别模型识别各标准化待识别图片的图片内容文本后，在各图片内容文本中分别定位“价税合计”这一设置于第二关键词列表中的关键词，在定位到“价税合计”这一关键词之后，分别获取该关键词之后的数值(如300、14)，以文本内容之后对应的数值作为各标准化待识别图片对应的识别数值。通过这一图像识别的方式，能有效且高效识别各标准化待识别图片对应的识别数值。

S150、获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表。

在本实施例中，创建与每一图片类型对应的子数据表是为了对应存储该类型的标准化待识别图片的识别数值，便于后续求和使用。例如第一图片类型的标准化待识别图片有10张，分别识别后得到10个识别数值，则在与第一图片类型对应的第一子数据表中存储上述10个识别数值；同样的方式获取了第二图片类型对应的第二子数据表，及第三图片类型对应的第三子数据表，由第一子数据表、第二子数据表、第三子数据表组成总数据表。

S160、将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值。

在本实施例中，对各子数据表的识别数值分别求和再累加求和，即可获取所述标准化待识别图片集中各标准化待识别图片对应的识别数值的总和，即得到了所有上传的发票扫描文件的发票总额，记为实际总和值。

S170、将所述实际总和值发送至上传端。

在本实施例中，当服务器中根据所上传的待识别图片集完成了发票总金额核算时，可以将所述实际总和值发送至上传端，以通知服务器已完成发票金额的自动核实，用户可进行下一步操作。

在一实施例中，步骤S170之后还包括：

接收上传端所上传的目标数值；

判断所述实际总和值是否小于所述目标数值；

若所述实际总和值大于或等于所述目标数值，将用于通知审核通过的第一通知信息发送至上传端；

若所述实际总和值小于所述目标数值，将用于通知审核未通过的第二通知信息发送至上传端。

在本实施例中，当上传端接收到了所述实际总和值之后，也可选择设置期望报销的期望金额(理解为目标数值)，这一目标数值是直接上传至服务器后与之前计算得到的所述实际总和值进行比较。若所述实际总和值大于或等于所述目标数值，表示期望报销的期望金额小于或等于实际总和值，是可以通过审核并继续报销流程。若所述实际总和值小于所述目标数值，表示期望报销的期望金额大于实际总和值，是无法审核并提示用户继续上传另一待识别图片集或是减小所述目标数值直至小于或等于所述实际总和值之后，方可继续报销流程。

该方法实现了将非正向图片均进行旋转得到标准正向图片后，通过图像识别技术识别发票金额和进行核算，提高了核算效率，而且计算准确率高。

本申请实施例还提供一种基于OCR的图片数据识别装置，该基于OCR的图片数据识别装置用于执行前述基于OCR的图片数据识别方法的任一实施例。具体地，请参阅图6，图6是本申请实施例提供的基于OCR的图片数据识别装置的示意性框图。该基于OCR的图片数据识别装置100可以配置于服务器中。

如图6所示，基于OCR的图片数据识别装置100包括图片集接收单元110、图片标准化单元120、图片类型获取单元130、识别数值获取单元140、总数据表获取单元150、求和单元160、和值发送单元170。

图片集接收单元110，用于接收上传端所上传的待识别图片集。

图片标准化单元120，用于将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集。

在一实施例中，如图7所示，基于OCR的图片数据识别装置100还包括：

非正向图片判断单元1201，用于判断所述待识别图片集中是否存在非正向图片；若所述待识别图片集中存在非正向图片，执行根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度的步骤；若所述待识别图片集中不存在非正向图片，执行获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型的步骤；

旋转角度获取单元1202，用于根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度。

在一实施例中，非正向图片判断单元1201还用于：

图片类型获取单元130，用于获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型。

在一实施例中，图片类型获取单元130还用于：

识别数值获取单元140，用于通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值。

在一实施例中，如图8所示，识别数值获取单元140包括：

图片内容文本获取单元141，用于获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片内容文本；

关键词定位单元142，用于定位获取各标准化待识别图片的图片内容文本中与预设的第二关键词列表中关键词相同的文本内容，以文本内容之后对应的数值作为各标准化待识别图片对应的识别数值。

总数据表获取单元150，用于获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表。

求和单元160，用于将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值。

和值发送单元170，用于将所述实际总和值发送至上传端。

在一实施例中，基于OCR的图片数据识别装置100还包括：

目标数值获取单元，用接收上传端所上传的目标数值；

数值判断单元，用于判断所述实际总和值是否小于所述目标数值；

第一通知单元，用于若所述实际总和值大于或等于所述目标数值，将用于通知审核通过的第一通知信息发送至上传端；

第二通知单元，用于若所述实际总和值小于所述目标数值，将用于通知审核未通过的第二通知信息发送至上传端。

该装置实现了将非正向图片均进行旋转得到标准正向图片后，通过图像识别技术识别发票金额和进行核算，提高了核算效率，而且计算准确率高。

上述基于OCR的图片数据识别装置可以实现为计算机程序的形式，该计算机程序可以在如图9所示的计算机设备上运行。

请参阅图9，图9是本申请实施例提供的计算机设备的示意性框图。该计算机设备500是服务器，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图9，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行基于OCR的图片数据识别方法。

该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行基于OCR的图片数据识别方法。

该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现本申请实施例公开的基于OCR的图片数据识别方法。

本领域技术人员可以理解，图9中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备可以仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图9所示实施例一致，在此不再赘述。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(Central Processing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性或者可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序被处理器执行时实现本申请实施例公开的基于OCR的图片数据识别方法。

在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种基于OCR的图片数据识别方法，其中，包括：

接收上传端所上传的待识别图片集；

将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；

获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；

通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；

获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；

将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及

将所述实际总和值发送至上传端。
根据权利要求1所述的基于OCR的图片数据识别方法，其中，所述将所述实际总和值发送至上传端之后，还包括：

接收上传端所上传的目标数值；

判断所述实际总和值是否小于所述目标数值；

若所述实际总和值大于或等于所述目标数值，将用于通知审核通过的第一通知信息发送至上传端；

若所述实际总和值小于所述目标数值，将用于通知审核未通过的第二通知信息发送至上传端。
根据权利要求1所述的基于OCR的图片数据识别方法，其中，所述将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集之前，还包括：

判断所述待识别图片集中是否存在非正向图片；若所述待识别图片集中存在非正向图片，执行根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度的步骤；若所述待识别图片集中不存在非正向图片，执行获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型的步骤；

根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度。
根据权利要求3所述的基于OCR的图片数据识别方法，其中，所述判断所述待识别图片集中是否存在非正向图片，包括：

通过图像识别获取待识别图片集中各待识别图片的首行文字，若有待识别图片的首行文字不包括预先设置的第一关键词列表中的关键词，将对应的待识别图片作为非正向图片。
根据权利要求1-4任一项所述的基于OCR的图片数据识别方法，其中，所述通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值，包括：

获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片内容文本；

定位获取各标准化待识别图片的图片内容文本中与预设的第二关键词列表中关键词相同的文本内容，以文本内容之后对应的数值作为各标准化待识别图片对应的识别数值。
根据权利要求1-4任一项所述的基于OCR的图片数据识别方法，其中，所述获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型，包括：

通过OCR图像识别模型识别各标准化待识别图片的票头，以得到各标准化待识别图片分别对应的图片类型。
一种基于OCR的图片数据识别装置，其中，包括：

图片集接收单元，用于接收上传端所上传的待识别图片集；

图片标准化单元，用于将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；

图片类型获取单元，用于获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；

识别数值获取单元，用于通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；

总数据表获取单元，用于获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；

求和单元，用于将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及

和值发送单元，用于将所述实际总和值发送至上传端。
根据权利要求7所述的基于OCR的图片数据识别装置，其中，还包括：

目标数值获取单元，用接收上传端所上传的目标数值；

数值判断单元，用于判断所述实际总和值是否小于所述目标数值；

第一通知单元，用于若所述实际总和值大于或等于所述目标数值，将用于通知审核通过的第一通知信息发送至上传端；

第二通知单元，用于若所述实际总和值小于所述目标数值，将用于通知审核未通过的第二通知信息发送至上传端。
一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现一种基于OCR的图片数据识别方法，其中，包括：

接收上传端所上传的待识别图片集；

将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；

获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；

通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；

获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；

将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及

将所述实际总和值发送至上传端。
根据权利要求9所述的一种计算机设备，其中，所述将所述实际总和值发送至上传端之后，还包括：

接收上传端所上传的目标数值；

判断所述实际总和值是否小于所述目标数值；

若所述实际总和值大于或等于所述目标数值，将用于通知审核通过的第一通知信息发送至上传端；

若所述实际总和值小于所述目标数值，将用于通知审核未通过的第二通知信息发送至上传端。
根据权利要求9所述的计算机设备，其中，所述将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集之前，还包括：

判断所述待识别图片集中是否存在非正向图片；若所述待识别图片集中存在非正向图片，执行根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度的步骤；若所述待识别图片集中不存在非正向图片，执行获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型的步骤；

根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度。
根据权利要求11所述的计算机设备，其中，所述判断所述待识别图片集中是否存在非正向图片，包括：

通过图像识别获取待识别图片集中各待识别图片的首行文字，若有待识别图片的首行文字不包括预先设置的第一关键词列表中的关键词，将对应的待识别图片作为非正向图片。
根据权利要求9-12任一项所述的计算机设备，其中，所述通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值，包括：

获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片内容文本；

定位获取各标准化待识别图片的图片内容文本中与预设的第二关键词列表中关键词相同的文本内容，以文本内容之后对应的数值作为各标准化待识别图片对应的识别数值。
根据权利要求9-12任一项所述的计算机设备，其中，所述获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型，包括：

通过OCR图像识别模型识别各标准化待识别图片的票头，以得到各标准化待识别图片分别对应的图片类型。15、一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行一种基于OCR的图片数据识别方法，其中，包括：

接收上传端所上传的待识别图片集；

将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；

获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；

通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；

获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；

将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及

将所述实际总和值发送至上传端。16、根据权利要求15所述的存储介质，其中，所述将所述实际总和值发送至上传端之后，还包括：

接收上传端所上传的目标数值；

判断所述实际总和值是否小于所述目标数值；

若所述实际总和值大于或等于所述目标数值，将用于通知审核通过的第一通知信息发送至上传端；

若所述实际总和值小于所述目标数值，将用于通知审核未通过的第二通知信息发送至上传端。
根据权利要求15所述的存储介质，其中，所述将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集之前，还包括：

判断所述待识别图片集中是否存在非正向图片；若所述待识别图片集中存在非正向图片，执行根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度的步骤；若所述待识别图片集中不存在非正向图片，执行获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型的步骤；

根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度。
根据权利要求17所述的存储介质，其中，所述判断所述待识别图片集中是否存在非正向图片，包括：

通过图像识别获取待识别图片集中各待识别图片的首行文字，若有待识别图片的首行文字不包括预先设置的第一关键词列表中的关键词，将对应的待识别图片作为非正向图片。
根据权利要求15-18任一项所述的存储介质，其中，所述通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值，包括：

获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片内容文本；

定位获取各标准化待识别图片的图片内容文本中与预设的第二关键词列表中关键词相同的文本内容，以文本内容之后对应的数值作为各标准化待识别图片对应的识别数值。
根据权利要求15-18任一项存储介质，其中，所述获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型，包括：

通过OCR图像识别模型识别各标准化待识别图片的票头，以得到各标准化待识别图片分别对应的图片类型。