CN109784343A

CN109784343A - 一种基于深度学习模型的资源分配方法及终端

Info

Publication number: CN109784343A
Application number: CN201910074257.4A
Authority: CN
Inventors: 周异; 何建华; 陈凯; 杜保发; 周曲; 黄征
Original assignee: Xiamen Shang Ji Network Technology Co Ltd; Shanghai Shenyou Intelligent Technology Co Ltd
Current assignee: Xiamen Shang Ji Network Technology Co Ltd; Shanghai Shenyou Intelligent Technology Co Ltd
Priority date: 2019-01-25
Filing date: 2019-01-25
Publication date: 2019-05-21
Anticipated expiration: 2039-01-25
Also published as: CN109784343B

Abstract

本发明涉及一种基于深度学习模型的资源分配方法及终端，属于数据处理领域。本发明通过可反映同时使用多个OCR深度学习模型识别字符片段图像的置信度和准确率之间关系的性能函数，预估出使用不同的OCR深度学习模型组合识别待识别字符片段图像的准确度；将不同的OCR深度学习模型组合与不同数量的人工识别进一步组合，计算各种机器与人工识别组合的准确度，进而在能达到期望的准确度目标值的所有机器与人工识别的组合中选择一成本最低的组合，并根据所选的组合分配模型数量与工人数量。实现了在满足高识别准确度目标值的同时有效降低识别成本。

Description

一种基于深度学习模型的资源分配方法及终端

技术领域

本发明涉及一种基于深度学习模型的资源分配方法及终端，属于数据处理领域。

背景技术

一般的OCR应用系统，常用的OCR流程包括获取带有文字的图像，使用机器定位图象中感兴趣的字段，机器对定位的字符字段片段图像进行识别等步骤。根据OCR应用系统对文字识别的准确度要求，可选地使用人工审查OCR识别的结果，纠正错误的识别。使用机器的OCR系统流程见图1。

但是票据识别等商业应用对于准确度要求很高(比如99.9％)，采用常用的OCR流程很难达到准确度要求。因此现在商业化的票务识别应用，大多采用多个工人进行定位和识别，再利用人工对识别结果审查和纠错。这种采用人工完成定位和识别等主要工作的纯人工识别方法的系统流程见图例2。纯人工OCR方法识别准确度够高，但是有较多缺陷，比如人工成本非常高，人工识别文字之后还需要手动敲键盘将文字输入到计算机系统中会降低速度和引入额外的错误，识别性能会受到疲劳等人为因素影响，识别速度慢，不能有效支持票据识别业务的快速扩张等。

发明内容

本发明所要解决的技术问题是：如何在满足高识别准确度的同时，降低识别成本。

为了解决上述技术问题，本发明采用的技术方案为：

本发明提供一种基于深度学习模型的资源分配方法，包括：

S1、预设多个不同的OCR深度学习模型；所述OCR深度学习模型用于识别图像中的字符片段；

S2、分别生成与每一所述OCR深度学习模型对应的第一性能函数；所述第一性能函数的自变量为置信度，因变量为准确度；一个所述OCR深度学习模型对应一个所述第一性能函数；

S3、生成多个第二性能函数；所述第二性能函数表示同时使用M个OCR深度学习模型识别图像中的字符片段时，置信度与准确度之间的函数关系；其中，置信度为自变量，准确度为因变量；所述M为正整数，大于零且小于等于所述多个不同的OCR深度学习模型的总数量；

S4、根据所述多个第二性能函数和预设的一个工人识别单个字符的第一准确度，计算得到准确度集合；所述准确度集合中的元素表示同时使用M个OCR深度学习模型和Q个工人共同识别图像中的字符的准确度；其中，所述Q为正整数；

S5、根据所述准确度集合和预设的准确度目标值设置OCR深度学习模型数量和工人数量，得到最优模型数量和最优工人数量。

优选地，所述S2具体为：

S21、预设第一测试样本集；

S22、一OCR深度学习模型识别所述第一测试样本集，得到第一识别结果；

S23、根据所述第一识别结果获取所述一OCR深度学习模型识别所述第一测试样本集合中各样本的置信度和准确度；

S24、曲线拟合所述各样本的置信度和准确度，得到与所述一OCR深度学习模型对应的第一性能函数；

S25、重复执行S22至S24，直至所述多个不同的OCR深度学习模型均被遍历。

优选地，所述S23具体为：

S231、根据所述第一识别结果统计所述一OCR深度学习模型识别单个字符的置信度，得到第一置信度；

S232、获取与一样本中各字符对应的一个以上第一置信度，得到第二置信度集合；

S233、统计所述第二置信度集合的平均值，得到与所述一样本对应的置信度；

S234、重复执行S232至S233，直至所述第一测试样本集被遍历。

优选地，所述S3具体为：

S31、预设第一数量；所述第一数量的初始值为1，所述第一数量的最大值为所述多个不同的OCR深度学习模型的总数量；

S32、与预设第一数量对应的不同的OCR深度学习模型识别预设的第二测试样本集，得到第二识别结果；

S33、根据所述第二识别结果分别计算各个OCR深度学习模型识别同一样本的置信度和准确度，得到第一集合；所述第一集合的一元素包括一个OCR深度学习模型识别一个样本的置信度和准确度；

S34、获取所述第一集合中具有最大值的准确度，得到当前准确度；

S35、从所述第一集合中获取与所述当前准确度对应的置信度，得到第三置信度；

S36、添加所述当前准确度和所述第三置信度至预设的第二集合；所述第二集合的一元素包括一准确度和与所述一准确度对应的置信度；

S37、重复执行S33至S36，直至所述第二测试样本集中每一样本均被遍历；

S38、曲线拟合所述第二集合，得到与所述第一数量对应的一第二性能函数；

S39、所述第一数量的值加1，当所述第一数量的值不大于所述第一数量的最大值时，重复执行S32至S38，得到所述多个第二性能函数。

优选地，所述S4具体为：

S41、预设多个分配方案；一所述分配方案包括OCR深度学习模型数量和工人数量；

S42、获取一分配方案，得到当前分配方案；

S43、获取与所述当前分配方案的OCR深度学习模型的数量对应的所述第二性能函数，得到当前性能函数；

S44、根据所述当前性能函数计算得到与所述一分配方案对应的OCR深度学习的准确度，得到机器学习准确度；

S45、根据预设的第一公式，计算得到与所述一分配方案对应的第二准确度；所述第一公式具体为：

P_hyb(M，Q)＝1-(1-P_I，M)(1-P_H)Q

其中，P_hyb为与所述第二准确度，P_I,M为所述机器学习准确度，P_H为所述第一准确度，Q为与所述当前分配方案对应的工人数量；

S46、添加所述第二准确度至所述准确度集合；

S47、重复执行S42至S46，直至所述多个分配方案被遍历。

优选地，所述S5具体为：

预设多个分配方案；一所述分配方案包括OCR深度学习模型数量和工人数量；

根据预设的第二公式或预设的第三公式，分别计算与所述多个分配方案对应的系统效用，得到系统效用集合；

所述第二公式具体为：

U(m，q)＝G_p-m×C_R-q×C_H，i_f P_hyb(m，q)≥R

所述第三公式具体为：

U(m，q)＝-G_f-m×C_R-q×C_H，if P_hyb(m，q)＜R

其中，U(m,q)为所述系统效用，P_hyb为所述准确度集合中与一所述分配方案对应的准确度，G_p为预设的成功识别一个字符片段图像的单位经济收益，G_f为预设的错误识别一个字符片段图像的单位经济损失，C_R为每个所述OCR深度学习模型的单位时间成本，C_H为每个工人的单位时间成本，m为一所述分配方案对应的OCR深度学习模型数量，q为一所述分配方案对应的工人数量；

获取所述系统效用集合中的最大值，得到最大系统效用；

获取与所述最大系统效用对应的一所述分配方案，得到最优分配方案；

若与所述最优分配方案对应的准确度大于所述准确度目标值，则根据所述最优分配方案设置OCR深度学习模型数量和工人数量。

优选地，还包括：

预设一字符片段图像，得到待识别图像；

与所述最优模型数量对应的OCR深度学习模型识别所述待识别图像，得到第三识别结果；

根据所述第三识别结果计算与所述最优模型数量对应的OCR深度学习模型的置信度，得到当前置信度；

根据与所述最优模型数量对应的第二性能函数和所述第四置信度，计算得到当前机器学习准确度；

根据所述当前机器学习准确度和所述准确度目标值设置最优工人数量。

本发明还提供一种基于深度学习模型的资源分配终端，包括一个或多个处理器及存储器，所述存储器存储有程序，并且被配置成由所述一个或多个处理器执行以下步骤：

优选地，所述S2具体为：

S21、预设第一测试样本集；

优选地，所述S23具体为：

S234、重复执行S232至S233，直至所述第一测试样本集被遍历。

优选地，所述S3具体为：

优选地，所述S4具体为：

S42、获取一分配方案，得到当前分配方案；

P_hyb(M，Q)＝1-(1-P_I，M)(1-P_H)Q

S46、添加所述第二准确度至所述准确度集合；

S47、重复执行S42至S46，直至所述多个分配方案被遍历。

优选地，所述S5具体为：

所述第二公式具体为：

U(m，q)＝G_p-m×C_R-q×C_H，if P_hyb(m，q)≥R

所述第三公式具体为：

U(m，q)＝-G_f-m×C_R-q×C_H，if P_hyb(m，q)＜R

获取所述系统效用集合中的最大值，得到最大系统效用；

优选地，还包括：

预设一字符片段图像，得到待识别图像；

本发明具有如下有益效果：

1、本发明提供一种基于深度学习模型的资源分配方法及终端，通过可反映同时使用多个OCR深度学习模型识别字符片段图像的置信度和准确率之间关系的性能函数，预估出使用不同的OCR深度学习模型组合识别待识别字符片段图像的准确度；将不同的OCR深度学习模型组合与不同数量的人工识别进一步组合，计算各种机器与人工识别组合的准确度，进而在能达到期望的准确度目标值的所有机器与人工识别的组合中选择一成本最低的组合，并根据所选的组合分配模型数量与工人数量。实现了在满足高识别准确度目标值的同时有效降低识别成本。

2、进一步地，通过每一OCR深度学习模型识别测试样本集的置信度和准确度，曲线拟合出每一个OCR深度学习模型的置信度和准确度之间的函数关系，为后续拟合集成多个不同的OCR深度学习模型识别结果的置信度和准确度之间的函数关系提供基础。

3、进一步地，使用不同的深度学习模型识别同一个字符片段图像，识别出的字符个数和内容都不一定相同，仅仅在字符层面上比较识别的置信度无法准确反映出各深度学习模型的优劣。由于现有的深度学习模型只能够提供单个字符的识别置信度，因此，本发明将深度学习模型提供的单个字符的识别置信度，通过平均值计算方法转换为识别一个字符片段图像的置信度，有利于提高与一深度学习模型对应的第一函数反映置信度与准确度之间关系的正确性。

4、进一步地，使用多个不同的OCR深度学习模型识别同一字符片段图像中准确度最高的模型对应的准确度和置信度作为整个集成模型的准确度和置信度，使得拟合出的第二性能函数能够反映出集成模型的最优准确度。

5、进一步地，根据第一公式能够较精确地估算出采用不同的OCR深度学习模型与不同数量人工组合识别字符片段图像所能达到的准确度。

6、进一步地，根据分配方案对应的准确度、成功一个字符片段图像的单位经济收益、错误识别一个字符片段图像的单位经济损失、OCR深度学习模型的单位时间成本、工人识别的单位时间成本计算出各分配方案对应的经济收益与资源开销之差，直观地获悉各分配方案的成本，有利于根据各分配方案的成本以及期望的准确度目标值选择一中长期规划的最优分配方案。

7、进一步地，使用中长期规划的最优分配方案分配的多个OCR深度学习模型同时识别一字符片段图像后，立即计算使用与最优分配方案对应的机器识别当前字符片段图像的置信度，并根据与最优分配方案对应的多个OCR深度学习模型对应的第二性能函数预估出使用最优分配方案的机器识别的准确度，再根据实时得到的识别准确度、期望的准确度目标值、人工识别准确度性能和计算系统效用的公式分配工人数量，根据实际的机器识别准确度调整为达到期望的准确度目标值所需的最少工人数量，有利于在满足期望准确度目标值的前提下减少成本，或能够有力地保证最终的识别准确度达到期望的准确度目标值，

附图说明

图1为使用机器的OCR系统流程图；

图2为纯人工识别方法的系统流程图；

图3本发明提供的一种基于深度学习模型的资源分配方法的具体实施方式的流程框图；

图4为本发明提供的一种基于深度学习模型的资源分配终端的具体实施方式的结构框图；

图5为训练样本第一样例示意图；

图6为训练样本第二样例示意图；

图7为训练样本第三样例示意图；

标号说明：

1、处理器； 2、存储器。

具体实施方式

下面结合附图和具体实施例来对本发明进行详细的说明。

请参照图3至图7，

本发明的实施例一为：

如图3所示，本实施例提供一种基于深度学习模型的资源分配方法，包括：

S1、预设多个不同的OCR深度学习模型；所述OCR深度学习模型用于识别图像中的字符片段。

其中，所述的被选择的多个不同的OCR深度学习模型在识别性能上具有一定的互补性。比如，有些被选择的深度学习模型在训练的时候，通过更多的数字训练样本增强模型对数字的训练，使得该模型在识别数字上有相对更高的准确度；而另外一些被选择的模型，可以在深度学习模型的网络结构和/或训练方面有所不同，使得对中文文字的识别具有更高的准确度。上述两类深度学习模型在识别字符的类型方面具有互补性。不同模型之间的互补性，可以通过观察模型在测试集中不同类别的字段上的识别准确度来评估，从而挑选出互补性和识别准确度都比较好的深度学习模型。

每个OCR深度学习模型中设置不同的模块参数(比如卷积层的阶段数和池化层的设置)，或者采用不同的训练样本集进行训练。利用测试样本集测试不同的训练好的OCR深度学习模型，统计单个OCR深度学习模型识别字符片段图像的准确度。

例如，本实施例中的OCR深度学习模型采用卷积神经网络和长短时记忆网络(longshort term memory,LSTM)以及CTC的结构。卷积神经网络具有多个阶段(stage)，每个阶段都包含一定数目的卷积模块(提取图象特征)和池化层(缩小特征图大小)等。

优选地，预设多个不同的OCR深度学习模型，具体为：

S11、建立训练样本集；使用所述训练样本集训练一个OCR深度学习模型；

例如，收集200000张字符片段图像训练样本。每个训练样本，包括字符片段图像和与字符片段图像对应的字符标注。图5所示的训练样本的文字片段图像中带有横直线干扰，图6所述的训练样本的文字片段图像中带有竖直线干扰，图7所述的训练样本的文字片段图像中带有红色印章干扰。训练样本可不断补充。

优选地，所述训练样本集中的每个训练样本包括字符片段图像和与字符片段图像对应的字符标注；

转换所述字符标注为对应的数字标注；其中，每一字符与一个唯一的整数代号对应。

例如，训练过程中，训练图片直接输入到OCR深度学习模型中，在计算机里面可以作为一个3维矩阵来表示，比如I_(w0,h0,c0)，这里w0代表输入图片宽度(像素的个数)，h0代表输入图片高度，c0代表输入图片颜色通道(彩色图片有红蓝绿三个颜色通道，灰度图片只有一个颜色通道)。训练样本的数字标注用于和OCR深度学习模型的输出进行比较，计算识别误差并调整网络参数。通过深度学习网络的卷积模块后，训练图片的特征将被提取，输出一定通道数目的特征图，比如F_(w1,h1,c1)，此处w1、h1和c1分别表示经过卷积模块后的特征图的宽度、高度和通道数。经过多阶段的卷积模块和池化层后，卷积网络输出的特征图(记为F_(wn,hn,cn))被作为输入送入到长短时记忆(LSTM)网络。在特征图的宽度方向上每一列(对应一个像素宽度)的特征信息(包括高度维度和通道维度)逐一输入到LSTM网络,每一列输出所有可能字符以及一种额外字符(表示无字符)的概率。LSTM网络的输出经过CTC模块的处理，输出识别的有效字符的整数代号，经过映射转换输出深度学习网络识别得到的有效字符。对OCR深度学习模型识别得到的有效字符和训练样本自带的文字标注进行比较，可以计算OCR深度学习模型识别的误差，根据识别误差反向输入到深度学习网络，调整OCR深度学习模型的参数，然后继续学习，直到OCR深度学习模型识别误差降低到一定程度具有了较好的识别能力之后停止训练。

S12、预设第三测试样本集；根据所述第三测试样本集计算一个OCR深度学习模型的准确度。

例如，收集一定数量的测试样本，用于测试OCR深度学习模型的性能。每个测试样本包括字符片段图像和与字符片段图像对应的字符标注。一个OCR深度学习模型对第三测试样本集中的字符片段图像进行识别，得到识别结果。将一个OCR深度学习模型识别测试样本的识别结果和测试样本的字符标注进行比较，从而计算出一个OCR深度学习模型识别字符片段图像的准确度。本实施例中需计算出每一个OCR深度学习模型的准确度。

S13、重复执行S12至S13，直至所述多个不同的OCR深度学习模型均已被训练和测试。

S2、分别生成与每一所述OCR深度学习模型对应的第一性能函数；所述第一性能函数的自变量为置信度，因变量为准确度；一个所述OCR深度学习模型对应一个所述第一性能函数。具体为：

S21、预设第一测试样本集；

S23、根据所述第一识别结果获取所述一OCR深度学习模型识别所述第一测试样本集合中各样本的置信度和准确度。

根据所述第一识别结果获取所述一OCR深度学习模型识别所述第一测试样本集合中各样本的置信度,具体为：

S234、重复执行S232至S233，直至所述第一测试样本集被遍历。

其中，假设所述第一测试样本集中有N个字符片段图像，用Ωt表示整个测试样本集，Ωt＝{Sn|n＝1，2，...，N}。

第n个字符片段图像用Sn表示，Sn里面有K_n个字符。假设有M个训练好的OCR深度学习模型。将第m个OCR深度学习模型识别所述第一测试样本集中第n个字符片段图像，假定识别出L_m,n个字符，第m个OCR深度学习模型对第l个字符识别的置信度记为C_m,n,l。

通过OCR深度学习模型对字符识别的置信度，可以根据预设的第四公式计算第m个OCR深度学习模型对整个第n个字符片段图像识别的置信度C_m,n。所述第四公式为：

以图5所示的字符片段图像样本为例。假如第m个OCR深度学习模型对图三所示字符片段图像识别得到文字串“尤锡亿特不锈钢有限公司”，共计11个字符，相应的字符识别置信度分别为0.85、0.975、0.992、0.995、0.993、0.996、0.997、0.995、0.993、0.998、0.989。通过统计字符串中字符识别置信度的平均值，可以得到第m个OCR深度学习模型对该字符片段图像识别结果的置信度为0.9794。

(0.85+0.975+0.992+0.995+0.993+0.996+0.997+0.995+0.993+0.998+0.989)/11＝0.9794

根据所述第一识别结果获取所述一OCR深度学习模型识别所述第一测试样本集合中各样本的准确度,具体为：

对于第一OCR深度学习模型，在所有测试样本集上的识别准确度定义为，所有测试样本中被正确识别的样本数除以测试样本集中所有样本数。对于任一个字符片段图像，如果第一OCR深度学习模型识别的输出字符和该字符片段图像的字符标注完全相同，则标记第一OCR深度学习模型正确地识别了待识别字符片段图像，否则，标记第一OCR深度学习模型错误地识别了待识别字符片段图像。

对于一个确定的置信度，例如第五置信度，相应的测试样本数可能非常少，为了能有效统计第五置信度对应的准确度，本实施例将第五置信度对应的准确度的计算方式为：第一测试样本集中所有置信度值大于第五置信度的测试样本被第一OCR深度学习模型正确识别的比率。

例如：假设第m个OCR深度学习模型，识别10000个测试样本，第五置信度为0.98，10000个测试样本中有9500个测试样本的置信度超过第五置信度(0.98)。在置信度超过第五置信度的9500个测试样本中，有9000个测试样本被正确识别(500个被错误识别)。对于第m个OCR深度学习模型，可以计算第五置信度0.98对应的准确度为9000/9500≈0.947。

S24、曲线拟合所述各样本的置信度和准确度，得到与所述一OCR深度学习模型对应的第一性能函数。

其中，采用曲线拟合方法对第一测试样本集中的所有字符片段图像识别结果和识别准确度进行处理，建立置信度和准确度之间的函数关系。假设由曲线拟合方法得到的第m个OCR深度学习模型的第一性能函数由Fm表示。

给定一个新的字符片段图像，假设第m个OCR深度学习模型对该新的字符片段图像的置信度为C_m，通过第一性能函数Fm，可以估计第m个OCR深度学习模型对该字符片段图像的识别准确度Pm＝Fm(Cm)。

S3、生成多个第二性能函数；所述第二性能函数表示同时使用M个OCR深度学习模型识别图像中的字符片段时，置信度与准确度之间的函数关系；其中，置信度为自变量，准确度为因变量；所述M为正整数，大于零且小于等于所述多个不同的OCR深度学习模型的总数量。具体为：

其中，集成M个OCR深度学习模型识别同一测试样本Sn。计算每个OCR深度学习模型对测试样本Sn的置信度，并根据每个OCR深度学习模型对应的第一性能函数计算出每个OCR深度学习模型识别Sn的准确度。记第m个OCR深度学习模型对第n个测试样本Sn的置信度为C_m,n，准确度为P_m,n。

其中，假设集成M个OCR深度学习模型的集成模型识别一个字符片段图像的置信度为C_I,M，通过与M个对应的第二性能函数F_I,M，可以估计集成的OCR深度学习模型识别该字符片段图像的准确度P_I,M＝F_I,M(C_I,M)。

例如，假设集成3个OCR深度学习模型(M＝3)，4个测试样本字符片段图像(N＝4)。3个OCR深度学习模型分别对应的置信度和准确度的性能模型(即第一性能函数)由Fm()表示，m∈{1，2，3}。OCR深度学习模型的编号依据测试样本集上识别的准确度降序排列。集成3个OCR深度学习模型识别4个测试样本字符片段图像的置信度以及估计的准确度如表一中第2列到第7列所示。对于第1个测试样本，3个模型估计的准确度分别为0.99、0.992和0.993。对于第1个测试样本，模型3的准确度最大，则设置模型3识别第1个测试样本的准确度为集成3个OCR深度学习模型识别第1个测试样本的准确度，模型3识别第1个测试样本的置信度为集成3个OCR深度学习模型识别第1个测试样本的置信度。相应地，可以对其它测试样本做类似的处理。

表一计算集成模型置信度与准确度示例

S4、根据所述多个第二性能函数和预设的一个工人识别单个字符的第一准确度，计算得到准确度集合；所述准确度集合中的元素表示同时使用M个OCR深度学习模型和Q个工人共同识别图像中的字符的准确度；其中，所述Q为正整数；具体为：

S42、获取一分配方案，得到当前分配方案；

P_hyb(M，Q)＝1-(1-P_I，M)(1-P_H)Q

例如，假设单个工人识别字符片段图像的性能为独立均匀分布，准确度均为P_H。进一步假设OCR深度学习模型和人工识别过程串联执行，即先用集成的OCR深度学习模型对单个文字片段进行识别，识别结果再交给工人逐个识别。假设集成M个OCR深度学习模型的准确度为P_I,M。M个OCR深度学习模型的集成模型与Q个工人识别结合的混合识别系统的准确度P_hyb可以使用所述第一公式计算得到。

S46、添加所述第二准确度至所述准确度集合；

S47、重复执行S42至S46，直至所述多个分配方案被遍历。

优选地，第一种资源分配方案，具体为：

S51、预设多个分配方案；一所述分配方案包括OCR深度学习模型数量和工人数量；

S52、根据预设的第二公式或预设的第三公式，分别计算与所述多个分配方案对应的系统效用，得到系统效用集合；

所述第二公式具体为：

U(m，q)＝G_p-m×C_R-q×C_H，if P_hyb(m，q)≥R

所述第三公式具体为：

U(m，q)＝-G_f-m×C_R-q×C_H，if P_hyb(m，q)＜R

其中，所述系统效用为识别字符片段图像带来的经济收益与资源开销之差。

S53、获取所述系统效用集合中的最大值，得到最大系统效用；

S54、获取与所述最大系统效用对应的一所述分配方案，得到最优分配方案；

S55、若与所述最优分配方案对应的准确度大于所述准确度目标值，则根据所述最优分配方案设置OCR深度学习模型数量和工人数量。

例如：假设所述准确度目标值R＝0.998，预设的成功识别一个字符片段图像的单位经济收益G_p＝10，预设的错误识别一个字符片段图像的单位经济损失G_f＝10，集成1到3个OCR深度学习模型得到的集成模型的准确度分别是0.98,0.995,0.9975,CR＝1。其中，计算集成模型的准确度的过程如S3所示，S32步骤中的第二测试样本集即为待识别的字符片段图像。总共有2个工人可用，人工识别准确度P_H＝0.995，C_H＝3。根据上述假设的参数，可以计算分配不同的OCR深度学习模型资源和人工资源能得到的识别准确度以及系统开销，从而计算系统效用，如表二所示。根据不同资源分配方案对应的系统效用，可以确定最优的资源分配方案为1个OCR深度学习模型和一个工人。

表二系统效用计算

优选地，第二种资源分配方案，具体为：

在第一种资源分配方案的基础上，

预设一字符片段图像，得到待识别图像；

其中，采用第一种资源分配方案根据集成的OCR深度学习模型的准确度对机器资源和人工资源进行中长期的分配和规划。

针对每个待识别的字符片段图像，利用第一种资源分配方案中分配的多个OCR深度学习模型进行字符片段图像识别，计算集成的OCR深度学习模型识别的识别当前待识别的字符片段图像的置信度，并且与该集成的OCR深度学习模型对应的第二性能函数估计对当前待识别字符片段图像的准确度。

根据上一步骤估计的识别准确度，结合字符识别的准确度目标值、人工识别准确度性能以及计算系统效用的函数，从可用的人工资源池中分配人工资源。分配人工资源后，更新可用于字符识别的人工资源池。

S6、识别并统计识别结果。具体为：

对待识别的字符片段图像，利用分配的OCR深度学习模型和工人对待识别的字符片段图像进行实时识别，综合处理字符片段图像识别的结果。

可选地，使用人工对识别结果进行审查并采取必要的纠错等措施。

可选地，统计OCR深度学习模型的置信度和准确度，并且定期调整OCR深度学习模型对应的第一性能函数和第二性能函数，以及调整资源分配的策略。

由于深度学习的飞速发展，深度学习在文字识别领域取得了巨大的进展，在文字识别精度上接近人工识别的性能，可以助力商业票据识别业务，形成一种借助机器深度学习和人工识别的混合式OCR系统。在初期阶段，由于机器识别精度距离人工识别的精确度还有一定差距，除了采用机器识别之外，还需要采用一定数量的人工进行识别以及审核。随着机器识别精度的进一步提高，可能需要更少甚至不需要人工进行识别，只需要一定数量的人工执行审核操作。

为了降低票据识别应用的系统成本，本实施例采用预先训练过的OCR深度学习模型对已经定位好并且分割成单行(或者单列)的字符片段图像训练样本进行字符片段的字符识别，离线建立字符片段识别的置信度与识别准确度的性能模型。在实际OCR应用中，利用统计得到的机器识别与识别准确度的性能关系，根据字符识别应用性能要求以及可用资源等信息，适当地分配机器和人工识别的资源，控制OCR准确率，降低OCR成本，有效、经济地完成OCR应用的任务。

综上所述，本实施例提出借助OCR深度学习模型，通过对票据识别系统中机器计算资源和人工资源进行控制，在满足票据业务高准确度要求的前提下，降低人工OCR的使用量，有效降低系统的投资成本和运行成本，加快识别速度，便于建立大规模票据识别系统。

本发明的实施例二为：

如图4所示，本实施例提供一种基于深度学习模型的资源分配终端，包括一个或多个处理器1及存储器2，所述存储器2存储有程序，并且被配置成由所述一个或多个处理器1执行以下步骤：

其中，所述多个不同的OCR深度学习模型之间具有一定的互补性。每个OCR深度学习模型中设置不同的模块参数(比如卷积层的阶段数和池化层的设置)，或者采用不同的训练样本集进行训练。利用测试样本集测试不同的训练好的OCR深度学习模型，统计单个OCR深度学习模型识别字符片段图像的准确度。

优选地，预设多个不同的OCR深度学习模型，具体为：

S21、预设第一测试样本集；

S234、重复执行S232至S233，直至所述第一测试样本集被遍历。

(0.85+0.975+0.992+0.995+0.993+0.996+0.997+0.995+0.993+0.998+0.989)/11＝0.9794

表一计算集成模型置信度与准确度示例

S42、获取一分配方案，得到当前分配方案；

P_hyb(M，Q)＝1-(1-P_I，M)(1-P_H)Q

S46、添加所述第二准确度至所述准确度集合；

S47、重复执行S42至S46，直至所述多个分配方案被遍历。

优选地，第一种资源分配方案，具体为：

所述第二公式具体为：

U(m，q)＝G_p-m×C_R-q×C_H，if P_hyb(m，q)≥R

所述第三公式具体为：

U(m，q)＝-G_f-m×C_R-q×C_H，if P_hyb(m，q)＜R

例如：假设所述准确度目标值R＝0.998，预设的成功识别一个字符片段图像的单位经济收益G_p＝10，预设的错误识别一个字符片段图像的单位经济损失G_f＝10，集成1到3个OCR深度学习模型得到的集成模型的准确度分别是0.98,0.995,0.9975,CR＝1。总共有2个工人可用，人工识别准确度P_H＝0.995，C_H＝3。根据上述假设的参数，可以计算分配不同的OCR深度学习模型资源和人工资源能得到的识别准确度以及系统开销，从而计算系统效用，如表二所示。根据不同资源分配方案对应的系统效用，可以确定最优的资源分配方案为1个OCR深度学习模型和一个工人。

表二系统效用计算

优选地，第二种资源分配方案，具体为：

在第一种资源分配方案的基础上，

预设一字符片段图像，得到待识别图像；

S6、识别并统计识别结果。具体为：

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于深度学习模型的资源分配方法，其特征在于，包括：

2.根据权利要求1所述的基于深度学习模型的资源分配方法，其特征在于，所述S2具体为：

S21、预设第一测试样本集；

3.根据权利要求2述的基于深度学习模型的资源分配方法，其特征在于，所述S23具体为：

S234、重复执行S232至S233，直至所述第一测试样本集被遍历。

4.根据权利要求1所述的基于深度学习模型的资源分配方法，其特征在于，所述S3具体为：

5.根据权利要求1所述的基于深度学习模型的资源分配方法，其特征在于，所述S4具体为：

S42、获取一分配方案，得到当前分配方案；

P_hyb(M，Q)＝1-(1-P_I，M)(1-P_H)^Q

S46、添加所述第二准确度至所述准确度集合；

S47、重复执行S42至S46，直至所述多个分配方案被遍历。

6.根据权利要求1所述的基于深度学习模型的资源分配方法，其特征在于，所述S5具体为：

所述第二公式具体为：

U(m，q)＝G_p-m×C_R-q×C_H，if P_hyb(m，q)≥R

所述第三公式具体为：

U(m，q)＝-G_f-m×C_R-q×C_H，if P_hyb(m，q)＜R

其中，U(m，q)为所述系统效用，P_hyb为所述准确度集合中与一所述分配方案对应的准确度，G_p为预设的成功识别一个字符片段图像的单位经济收益，G_f为预设的错误识别一个字符片段图像的单位经济损失，C_R为每个所述OCR深度学习模型的单位时间成本，C_H为每个工人的单位时间成本，m为一所述分配方案对应的OCR深度学习模型数量，q为一所述分配方案对应的工人数量；

获取所述系统效用集合中的最大值，得到最大系统效用；

7.根据权利要求6所述的基于深度学习模型的资源分配方法，其特征在于，还包括：

预设一字符片段图像，得到待识别图像；

8.一种基于深度学习模型的资源分配终端，其特征在于，包括一个或多个处理器及存储器，所述存储器存储有程序，并且被配置成由所述一个或多个处理器执行以下步骤：

9.根据权利要求8所述的基于深度学习模型的资源分配终端，其特征在于，所述S2具体为：

S21、预设第一测试样本集；

10.根据权利要求9述的基于深度学习模型的资源分配终端，其特征在于，所述S23具体为：

S234、重复执行S232至S233，直至所述第一测试样本集被遍历。

11.根据权利要求8所述的基于深度学习模型的资源分配终端，其特征在于，所述S3具体为：

12.根据权利要求8所述的基于深度学习模型的资源分配终端，其特征在于，所述S4具体为：

S42、获取一分配方案，得到当前分配方案；

P_hyb(M，Q)＝1-(1-P_I，M)(1-P_H)^Q

S46、添加所述第二准确度至所述准确度集合；

S47、重复执行S42至S46，直至所述多个分配方案被遍历。

13.根据权利要求8所述的基于深度学习模型的资源分配终端，其特征在于，所述S5具体为：

所述第二公式具体为：

U(m，q)＝G_p-m×C_R-q×C_H，if P_hyb(m，q)≥R

所述第三公式具体为：

U(m，q)＝-G_f-m×C_R-q×C_H，if P_hyb(m，q)＜R

获取所述系统效用集合中的最大值，得到最大系统效用；

14.根据权利要求13所述的基于深度学习模型的资源分配终端，其特征在于，还包括：

预设一字符片段图像，得到待识别图像；