WO2022100452A1

WO2022100452A1 - Ocr系统的评估方法、装置、设备及可读存储介质

Info

Publication number: WO2022100452A1
Application number: PCT/CN2021/127185
Authority: WO
Inventors: 高超; 徐国强
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2020-11-16
Filing date: 2021-10-28
Publication date: 2022-05-19
Also published as: CN112100431B; CN112100431A

Abstract

提供了一种OCR系统的评估方法、装置、设备及可读存储介质，方法包括：获取训练图像，并将训练图像输入至初始OCR系统中，以对初始OCR系统进行训练，得到训练完成初始OCR系统后对应的OCR系统（S10）；将待识别图像输入至OCR系统中，以基于OCR系统确定待识别图像对应的文字识别结果（S20）；基于文字识别结果以及待识别图像对应的实际标注数据，确定OCR系统对应的文字召回率以及OCR系统对应的文字识别精确率，并基于文字召回率和文字识别精确率计算OCR系统的评估指标，以基于评估指标评估OCR系统的性能（S30）。解决了现有技术中将文字检测和文字识别分开独立评价而导致评估指标不能客观反映OCR系统整体性能的问题。

Description

OCR系统的评估方法、装置、设备及可读存储介质

本申请要求于2020年11月16日在中国专利局提交的、申请号为202011275415.1、申请名称为“OCR系统的评估方法、装置、设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及光学字符识别技术领域，尤其涉及一种OCR系统的评估方法、装置、设备及可读存储介质。

背景技术

OCR(光学字符识别)技术能够将图像中印刷文字转换为计算机可处理的文本格式，OCR技术中的录入、校验被广泛应用在数据比对等场景中，成为国民经济各行业信息化和数字化应用的关键环节。随着大数据和深度学习技术的不断发展，OCR技术取得了突破性的进展，OCR技术被广泛地应用在印刷文档扫描件识别的应用上。

目前，对OCR系统识别准确率的评价，通常包含：文本检测、文本识别两个环节。现有技术中，文本检测主要以IOU＝0.5为阈值时检测框与标注框的得分作为评价指标，而文本识别则使用字符准确率或者字段准确率作为评价指标。实际上，在OCR系统中，文本识别对文本检测定位结果有依赖性，有时较高的检测指标反而会带来识别指标的下降，因此导致现有的对OCR系统的评估技术难以反映OCR系统整体性能的问题。

上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

技术问题

本申请的主要目的在于提供一种OCR系统的评估方法、装置、设备及可读存储介质，旨在解决现有的对OCR系统的评估技术难以反映OCR系统整体性能的技术问题。

技术解决方案

为解决上述技术问题，本申请实施例采用的技术方案是：

本申请实施例的第一方面提供了一种OCR系统的评估方法，所述OCR系统的评估方法包括以下步骤：

获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；

将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；

基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。

本申请实施例的第二方面提供了一种OCR系统的评估装置，所述OCR系统的评估装置包括：

训练模块，用于获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；

识别模块，用于将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；

评估模块，用于基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。

本申请实施例的第三方面提供了一种OCR系统的评估设备，所述OCR系统的评估设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的OCR系统的评估程序，所述OCR系统的评估程序被所述处理器执行时实现如下步骤：

本申请实施例的第四方面提供了一种可读存储介质，所述可读存储介质上存储有OCR系统的评估程序，所述OCR系统的评估程序被处理器执行时实现如下步骤：

有益效果

本申请的有益效果在于：

在本申请实施例提出的技术方案中，本申请的OCR系统的评估方法可以有效避免误判，使模型的评估更加客观公正。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的OCR系统的评估设备结构示意图；

图2为本申请OCR系统的评估方法第一实施例的流程示意图；

图3为本申请OCR系统的评估方法第二实施例的流程示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本发明的实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。

本申请实施例OCR系统的评估设备可以是PC，也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。

如图1所示，该OCR系统的评估设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，OCR系统的评估设备还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在OCR系统的评估设备移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)。

本领域技术人员可以理解，图1中示出的OCR系统的评估设备结构并不构成对OCR系统的评估设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及OCR系统的评估程序。

在图1所示的OCR系统的评估设备中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的OCR系统的评估程序。

在本实施例中，OCR系统的评估设备包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的OCR系统的评估程序，其中，处理器1001调用存储器1005中存储的OCR系统的评估程序时，并执行以下操作：

进一步地，处理器1001可以调用存储器1005中存储的OCR系统的评估程序，还执行以下操作：

将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型；

基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型。

标注所述训练图像，以确定所述训练图像中文本框的预设标注位置，并将包含所述预设标注位置的所述训练图像输入至第一深度学习模型，确定所述训练图像对应的学习标注位置；

基于所述预设标注位置和所述学习标注位置，确定所述第一深度学习模型对应的第一梯度信息；

基于所述第一梯度信息优化所述第一深度学习模型，以确定所述文字检测模型，其中，所述文字检测模型为优化完成的所述第一深度学习模型。

获取文本条图像，并将所述文本条图像输入至所述文字检测模型，得到标注文字位置的所述文本条图像；

将标注文字位置的所述文本条图像输入至第二深度学习模型，得到所述文本条图像对应的学习文字内容；

基于所述学习文字内容，确定所述第二深度学习模型对应的第二梯度信息，并基于所述第二梯度信息优化所述第二深度学习模型，以确定所述文字识别模型，其中，所述文字识别检测模型为优化完成的所述第二深度学习模型。

当接收到图像存储请求时，获取所述图像存储请求对应的待存储图像；

在所述OCR系统的性能达标时，将所述待存储图像输入至所述OCR系统，基于所述OCR系统确定所述待存储图像中是否存在身份证信息；

若所述待存储图像中不存在身份证信息，则执行所述图像存储请求对应的图像存储操作。

若所述待存储图像中存在身份证信息，则查询与所述身份证信息关联的第一目标账户，将所述第一目标账户与本地设备对应的第二目标账户进行匹配；

若所述第一目标账户与所述第二目标账户匹配，则执行所述图像存储请求对应的图像存储操作；

若所述第一目标账户与所述第二目标账户不匹配，则向所述第一目标账户发送验证信息，并在接收到所述验证信息对应的反馈信息时，执行所述图像存储请求对应的图像存储操作。

若所述OCR系统的评估指标达预设阈值，则所述OCR系统的性能达标。

本申请还提供一种OCR系统的评估方法，参照图2，图2为本申请OCR系统的评估方法第一实施例的流程示意图。

步骤S10，获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；

本申请所提出的OCR系统的评估方法应用于OCR系统，OCR系统为光学字符识别系统，能够识别图像中的文字，并提取图像中的文字，以将图像中的文字转换成计算机可处理的格式，其中，该OCR系统包括文字检测模型和文字识别模型。其中，文字检测模型和文字识别模型均为深度学习模型，深度学习模型可以是卷积神经网络或者循环神经网络等网络模型，深度学习模型所属的网络类型在本实施例中不作限定。其中，文字检测模型用于将图片中文字的位置识别出来，文字识别模型则是用于对识别出来的各个文字的位置进行识别其中的文字内容，即识别各个文字位置所包含的文字内容。

在本实施例中，训练OCR系统的过程，先获取初始OCR系统，以及获取训练图像，之后将训练图像输入至初始OCR模型中，以基于训练图像对该初始OCR模型进行训练；在训练完成初始OCR系统之后，得到训练完成初始OCR系统后对应的OCR系统。其中，初始OCR系统为训练OCR系统之前的初始状态，初始OCR系统包括第一深度学习模型和第二深度学习模型，第一深度学习模型用于训练文字检测模型，第二深度学习模型用于训练文字识别模型，也就是说，第一深度学习模型为初始文字检测模型，第二深度学习模型为初始文字识别模型。

步骤S20，将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；

在本实施例中，在训练完成初始OCR系统得到OCR系统后，OCR系统包括文字检测模型和文字识别模型，之后，进行对OCR系统的评估过程。首先获取待识别图像，并将待识别图像输入该OCR系统中，以基于训练完成后OCR系统中的文字检测模型和文字识别模型确定待识别图像对应的文字识别结果。具体地，将待识别图像输入至文字检测模型中，基于文字检测模型的第一模型参数，确定待识别图像对应的中间识别结果，其中，中间识别结果为识别待识别图像得到的文本框；得到中间识别结果之后，将包含中间识别结果的待识别图像输入至文字识别模型中，得到文字识别结果。其中，为了提升评估OCR系统的准确度，待识别图像为与训练图像不一致的包含文字内容的图像，待识别图像用于评估OCR系统。

需要说明的是，将待识别图像输入至文字检测模型中，以使文字检测模型确定待识别图像的文字位置，也就是说，文字检测模型所确定待识别图像对应的文本框为待识别图像中的文字位置。将包含中间识别结果的待识别图像输入至训练完成的文字识别模型中，以使文字识别模型基于中间识别结果以及待识别图像中的图像信息，识别待识别图像的图像信息中的文字内容，从而得到文字识别结果，也就是说，文字识别结果为文字识别模型对待识别图像进行识别后得到的文字内容。

步骤S30，基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。

在本实施例中，文字召回率为被正确识别的字符数与实际字符数之间的比值，文字识别精确率为文字识别结果中正确的字符数与文字识别结果中所有字符数之间的比值。recall是文字召回率，precision是文字识别精确率，文字召回率recall和文字识别精确率precision的计算公式分别如下：

其中，N _gt代表待识别图像的标注答案中所有字符数，N _gp代表待识别图像的标注答案被正确识别的字符数，N _pred代表待识别图像的文字识别结果中所有字符数，N _pp代表待识别图像的文字识别结果中正确的字符数。

得到文字召回率和文字识别的精确率后，进行对OCR系统的评估，具体地，基于OCR系统对待识别图像进行识别的文字召回率和文字识别的精确率，进行计算OCR系统的评估指标，以供后续基于评估指标评估OCR系统的性能。本方案以得分作为OCR系统的评估指标，评估指标f1的计算公式如下：

进一步地，若OCR系统的评估指标达预设阈值，则OCR系统的性能达标。

本实施例提出的OCR系统的评估方法，通过获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；然后，将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；最后，基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。本实施例中通过计算OCR系统对应的文字召回率和文字识别精确率，基于文字召回率和文字识别精确率计算OCR系统的评估师表从而对OCR系统进行整体的评价，解决了现有技术中将文字检测和文字识别分开独立评价而导致评估指标不能客观反映OCR系统整体性能的问题。进一步地，本申请的OCR系统的评估方法使用单一指标来评价OCR系统的优劣或者性能，并且可以帮助用户选择更优质的OCR服务，促进各行业信息化和数字化的发展。并且，由于图像存在文本框断裂、粘连导致答案框与检测框有一对多、多对一、多对多匹配的复杂情况，现有技术基于IOU的评价方式会对此类情况进行误判，而本申请的OCR系统的评估方法可以有效避免误判，使模型的评估更加客观公正。

基于第一实施例，提出本申请OCR系统的评估方法的第二实施例，参照图3，在本实施例中，步骤S10包括：

步骤S11，将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型；

步骤S12，基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型。

在本实施例中，先对初始OCR系统中的第一深度学习模型进行训练，完成第一深度学习模型后得到文字检测模型，之后联合文字检测模型和第二深度学习模型一起进行训练。其中，OCR系统包括文字检测模型和文字识别模型。具体地，先将训练图像输入至初始OCR系统中的第一深度学习模型进行训练，训练完成第一深度学习模型后，得到文字检测模型；得到文字检测模型之后，联合文字检测模型和第二深度学习模型一起进行训练，训练完成第二深度学习模型之后，得到文字识别模型。其中，训练完成第一深度学习模型或第二深度学习模型的条件可以是训练步骤达到最大迭代步骤或梯度下降法对应的梯度达到最小梯度值。

进一步地，所述将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型的步骤包括：

在本实施例中，训练文字检测模型的过程具体如下：先对训练图像进行标注，将训练图像中的文本框标注出来，从而确定训练图像中文本框的预设标注位置；之后，将包含预设标注位置的训练图像输入至第一深度学习模型进行训练和学习，第一深度学习模型输出训练图像对应的学习标注位置。在训练文字检测模型的过程中，基于梯度下降法对第一深度学习模型进行优化，即在得到第一深度学习模型输出的学习标注位置之后，基于第一梯度信息对深度学习模型的第一模型参数进行优化；基于第一梯度信息对该第一深度学习模型进行优化，直至第一梯度信息满足第一预设条件时，训练第一深度学习模型完成，得到文字检测模型。其中，第一预设条件可以是第一梯度信息达到第一最小梯度值，第一最小梯度值可以按照需要进行设置。

进一步地，所述基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型的步骤包括：

在本实施例中，训练文字识别模型的过程如下：收集大量单条文本条图像，并确定文本条图像的预设文字内容，将文本条图像输入至已优化完成的文字检测模型，以供文字检测模型输出标注了所检测到的文字位置的文本条图像；之后，将标注文字位置的文本条图像输入第二深度学习模型进行训练，第二深度学习模型输出文本条图像对应的文字内容，即输出识别文本条图像中的文字内容；之后，使用梯度下降法对第二深度学习模型进行优化，基于第二梯度信息对第一深度学习模型进行优化，直至第二深度学习模型对应的第二梯度信息满足第二预设条件时，优化该第二深度学习模型完成，最终得到文字识别模型。其中，第二预设条件可以是第二梯度信息达到第二最小梯度值，第二最小梯度值可以按照需要进行设置。

进一步地，所述基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能的步骤之后，还包括：

其中，身份证信息包括客户的身份证号码、地址、性别或籍贯等。需要说明的是，客户在使用一些终端设备或者平台系统时在一些情况下需要上传客户的身份证信息，因此这些终端设备或者平台系统在有客户上传身份证信息时可以获取并存储客户的身份证信息，从而有机会窃取客户的身份证信息，导致客户的个人信息和隐私泄露，因此亟需对客户的隐私数据进行保护。

在本实施例中，当终端接收到图像存储请求以存储客户的待存储图像时，获取该图像存储请求对应的待存储图像，可以基于训练完成的OCR系统对待存储图像执行图像识别操作，以对准备进行存储的待存储图像进行识别，目的是识别待存储图像是否包含客户的隐私数据。因此，无论终端发起任何图像的图像存储请求时，均获取该图像存储请求对应的待存储图像进行识别，以识别待存储图像中是否包含身份证信息，从而可以实现实时监控终端当前的图像存储操作，以监测当前的存储操作是否涉嫌泄露客户的隐私数据。若OCR系统识别到待存储图像中未包含身份证信息，则执行该图像存储请求对应的图像存储操作。

进一步地，所述基于所述OCR系统确定所述待存储图像中是否存在身份证信息的步骤之后，还包括：

其中，目标账户可以是数字蜂窝移动电话的用户识别卡、数字蜂窝移动电话的系统账户或PC端的电脑系统账户等，在本实施例中，目标账户不作限定，进一步地，目标账户的账户信息可以包括国际移动用户识别号码或者个人账号等。

在本实施例中，若OCR系统识别到待存储图像中包含身份证信息，则说明当前的图像存储操作涉嫌泄露客户的隐私数据，因此对图像存储操作进行防控。具体地，当识别到待存储图像中存在身份证信息时，基于OCR系统获取身份证信息中的身份证号码，通过身份证号码确定与身份证信息关联的第一目标账户，如通过身份证号码确定与身份证号码关联的手机号码等；接着，获取本地设备(客户终端)所绑定的第二目标账户，例如当本地设备为手机时，可以获取本地设备上的SIM卡的电话号码。

之后，将第一目标账户和第二目标账户进行匹配。当第一目标账户与第二目标账户匹配时，说明本地终端为客户持有的安全设备，则允许本地终端执行图像存储请求操作对应的图像存储操作。相反地，若第一目标账户和第二目标账户不匹配，说明本地终端并非客户的设备，属于不安全设备，此时则不能允许本地终端执行图像存储请求操作对应的图像存储操作。取代的是，向第一目标账户发送验证信息，若接收到第一目标账户反馈的反馈信息时，则执行图像存储请求操作对应的图像存储操作。

本实施例提出的OCR系统的评估方法，通过将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型；基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型。本实施例中，先对初始OCR系统中的第一深度学习模型进行训练，训练完成第一深度学习模型后得到文字检测模型，之后联合文字检测模型进行训练得到文字识别模型，从而可以提高文字检测模型和文字识别模型之间的配合度，进一步可以提高OCR系统的精确度。

此外，本申请实施例还提出一种OCR系统的评估装置，所述OCR系统的评估装置包括：

进一步地，所述训练模块，还用于：

进一步地，所述评估模块，还用于：

此外，本申请实施例还提出一种可读存储介质，所述可读存储介质上存储有OCR系统的评估程序，所述OCR系统的评估程序被处理器执行时实现如上述中任一项所述的OCR系统的评估方法的步骤。

本申请可读存储介质具体实施例与上述OCR系统的评估方法的各实施例基本相同，在此不再详细赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种OCR系统的评估方法，其中，所述OCR系统的评估方法包括以下步骤：

获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；

将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；

基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。
如权利要求1所述的OCR系统的评估方法，其中，所述OCR系统包括文字检测模型和文字识别模型，所述将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统的步骤包括：

将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型；

基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型。
如权利要求2所述的OCR系统的评估方法，其中，所述将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型的步骤包括：

标注所述训练图像，以确定所述训练图像中文本框的预设标注位置，并将包含所述预设标注位置的所述训练图像输入至第一深度学习模型，确定所述训练图像对应的学习标注位置；

基于所述预设标注位置和所述学习标注位置，确定所述第一深度学习模型对应的第一梯度信息；

基于所述第一梯度信息优化所述第一深度学习模型，以确定所述文字检测模型，其中，所述文字检测模型为优化完成的所述第一深度学习模型。
如权利要求2所述的OCR系统的评估方法，其中，所述基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型的步骤包括：

获取文本条图像，并将所述文本条图像输入至所述文字检测模型，得到标注文字位置的所述文本条图像；

将标注文字位置的所述文本条图像输入至第二深度学习模型，得到所述文本条图像对应的学习文字内容；

基于所述学习文字内容，确定所述第二深度学习模型对应的第二梯度信息，并基于所述第二梯度信息优化所述第二深度学习模型，以确定所述文字识别模型，其中，所述文字识别检测模型为优化完成的所述第二深度学习模型。
如权利要求1所述的OCR系统的评估方法，其中，所述基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能的步骤之后，还包括：

当接收到图像存储请求时，获取所述图像存储请求对应的待存储图像；

在所述OCR系统的性能达标时，将所述待存储图像输入至所述OCR系统，基于所述 OCR系统确定所述待存储图像中是否存在身份证信息；

若所述待存储图像中不存在身份证信息，则执行所述图像存储请求对应的图像存储操作。
如权利要求5所述的OCR系统的评估方法，其中，所述基于所述OCR系统确定所述待存储图像中是否存在身份证信息的步骤之后，还包括：

若所述待存储图像中存在身份证信息，则查询与所述身份证信息关联的第一目标账户，将所述第一目标账户与本地设备对应的第二目标账户进行匹配；

若所述第一目标账户与所述第二目标账户匹配，则执行所述图像存储请求对应的图像存储操作；

若所述第一目标账户与所述第二目标账户不匹配，则向所述第一目标账户发送验证信息，并在接收到所述验证信息对应的反馈信息时，执行所述图像存储请求对应的图像存储操作。
如权利要求1至6任一项所述的OCR系统的评估方法，其中，所述基于所述评估指标评估所述OCR系统的性能的步骤包括：

若所述OCR系统的评估指标达预设阈值，则所述OCR系统的性能达标。
一种OCR系统的评估装置，其中，所述OCR系统的评估装置包括：

训练模块，用于获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；

识别模块，用于将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；

评估模块，用于基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。
一种OCR系统的评估设备，其中，所述OCR系统的评估设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的OCR系统的评估程序，所述OCR系统的评估程序被所述处理器执行时实现如下步骤：

获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；

将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；

基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。
如权利要求9所述的OCR系统的评估设备，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型；

基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型。
如权利要求10所述的OCR系统的评估设备，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

标注所述训练图像，以确定所述训练图像中文本框的预设标注位置，并将包含所述预设标注位置的所述训练图像输入至第一深度学习模型，确定所述训练图像对应的学习标注位置；

基于所述预设标注位置和所述学习标注位置，确定所述第一深度学习模型对应的第一梯度信息；

基于所述第一梯度信息优化所述第一深度学习模型，以确定所述文字检测模型，其中，所述文字检测模型为优化完成的所述第一深度学习模型。
如权利要求10所述的OCR系统的评估设备，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

获取文本条图像，并将所述文本条图像输入至所述文字检测模型，得到标注文字位置的所述文本条图像；

将标注文字位置的所述文本条图像输入至第二深度学习模型，得到所述文本条图像对应的学习文字内容；

基于所述学习文字内容，确定所述第二深度学习模型对应的第二梯度信息，并基于所述第二梯度信息优化所述第二深度学习模型，以确定所述文字识别模型，其中，所述文字识别检测模型为优化完成的所述第二深度学习模型。
如权利要求9所述的OCR系统的评估设备，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

当接收到图像存储请求时，获取所述图像存储请求对应的待存储图像；

在所述OCR系统的性能达标时，将所述待存储图像输入至所述OCR系统，基于所述OCR系统确定所述待存储图像中是否存在身份证信息；

若所述待存储图像中不存在身份证信息，则执行所述图像存储请求对应的图像存储操作。
如权利要求13所述的OCR系统的评估设备，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

若所述待存储图像中存在身份证信息，则查询与所述身份证信息关联的第一目标账户，将所述第一目标账户与本地设备对应的第二目标账户进行匹配；

若所述第一目标账户与所述第二目标账户匹配，则执行所述图像存储请求对应的图像存储操作；

若所述第一目标账户与所述第二目标账户不匹配，则向所述第一目标账户发送验证信息，并在接收到所述验证信息对应的反馈信息时，执行所述图像存储请求对应的图像存储操作。
如权利要求9-14任意一项所述的OCR系统的评估设备，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

若所述OCR系统的评估指标达预设阈值，则所述OCR系统的性能达标。
一种可读存储介质，其中，所述可读存储介质上存储有OCR系统的评估程序，所述OCR系统的评估程序被处理器执行时实现如下步骤：

获取训练图像，并将所述训练图像输入至初始OCR系统中，以对所述初始OCR系统进行训练，得到训练完成所述初始OCR系统后对应的OCR系统；

将待识别图像输入至所述OCR系统中，以基于所述OCR系统确定所述待识别图像对应的文字识别结果；

基于所述文字识别结果以及所述待识别图像对应的实际标注数据，确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率，并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标，以基于所述评估指标评估所述OCR系统的性能。
如权利要求16所述的可读存储介质，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

将所述训练图像输入至第一深度学习模型，得到训练完成所述第一深度学习模型后对应的文字检测模型；

基于所述文字检测模型进行训练第二深度学习模型，得到训练完成所述第二深度学习模型后对应的所述文字识别模型。
如权利要求17所述的可读存储介质，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

标注所述训练图像，以确定所述训练图像中文本框的预设标注位置，并将包含所述预设标注位置的所述训练图像输入至第一深度学习模型，确定所述训练图像对应的学习标注位置；

基于所述预设标注位置和所述学习标注位置，确定所述第一深度学习模型对应的第一梯度信息；

基于所述第一梯度信息优化所述第一深度学习模型，以确定所述文字检测模型，其中，所述文字检测模型为优化完成的所述第一深度学习模型。
如权利要求18所述的可读存储介质，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

获取文本条图像，并将所述文本条图像输入至所述文字检测模型，得到标注文字位置的所述文本条图像；

将标注文字位置的所述文本条图像输入至第二深度学习模型，得到所述文本条图像对应的学习文字内容；

基于所述学习文字内容，确定所述第二深度学习模型对应的第二梯度信息，并基于所述第二梯度信息优化所述第二深度学习模型，以确定所述文字识别模型，其中，所述文字识别检测模型为优化完成的所述第二深度学习模型。
如权利要求16所述的可读存储介质，其中，所述OCR系统的评估程序被所述处理器执行时实现的步骤还包括：

当接收到图像存储请求时，获取所述图像存储请求对应的待存储图像；

在所述OCR系统的性能达标时，将所述待存储图像输入至所述OCR系统，基于所述OCR系统确定所述待存储图像中是否存在身份证信息；

若所述待存储图像中不存在身份证信息，则执行所述图像存储请求对应的图像存储操作。