CN110135409A - 识别模型的优化方法和装置 - Google Patents
识别模型的优化方法和装置 Download PDFInfo
- Publication number
- CN110135409A CN110135409A CN201910270038.3A CN201910270038A CN110135409A CN 110135409 A CN110135409 A CN 110135409A CN 201910270038 A CN201910270038 A CN 201910270038A CN 110135409 A CN110135409 A CN 110135409A
- Authority
- CN
- China
- Prior art keywords
- field picture
- identification model
- training
- picture
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000005457 optimization Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 89
- 238000004519 manufacturing process Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 30
- 230000002708 enhancing effect Effects 0.000 claims description 24
- 238000001514 detection method Methods 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像处理的技术领域,本发明提供一种识别模型的优化方法和装置,所述方法包括获取识别模型在生产中待识别的第一字段图片;将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息;其中,所述众包平台的用户对所述第一字段图片进行识别标注;定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片;将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化。本发明避免了不能在短时间内不能获取可信度高的训练字段图片的问题,保证及时对所述识别模型的训练样本进行更新,提升了所述识别模型的识别能力。
Description
技术领域
本发明涉及图像处理的技术领域,具体而言,本发明涉及一种识别模型的优化方法和装置。
背景技术
随着智能识别发展的趋势,文字智能识别已经运用至各领域中。目前,文字识别技术主要是通过训练字段识别模型,然后再对目标字段进行识别。但是,生成字段识别模型常常受限于业务方提供的数据,且难以在短时间内完成对字段识别模型进行优化,不利于提高识别模型的识别度。
发明内容
为克服以上技术问题,特别是现有技术中识别模型常常受限于业务方提供的数据的问题,特提出以下技术方案:
第一方面,本发明提供一种识别模型的优化方法,包括以下步骤:
获取识别模型在生产中待识别的第一字段图片;
将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息;其中,所述众包平台的用户对所述第一字段图片进行识别标注;
定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片;
将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化。
在其中一个实施例中,所述标注信息包括所述第一字段图片的标注编码和众包平台对带有标注编码的第一字段图片的第一识别结果;
所述根据所述第一字段图片的标注信息,获取训练字段图片的步骤包括:
根据所述标注编码对对应的字段图片的所述第一识别结果进行编码;
根据编码的结果,为所述第一识别结果分配对应的标注编码,得到的完成识别的第一字段图片作为训练字段图片。
在其中一个实施例中,所述将所述训练字段图片添加至所述识别模型的训练数据集中的步骤前,还包括:
对所述第一字段图片进行数据增强处理,得到第二字段图片;
将所述第二字段图片发送至所述众包平台进行标注,根据对应的标注编码,获取所述第二字段图片的第二识别结果;
将所述第一识别结果与所述第二识别结果进行比较;
若两者一致,则将所述第二字段图片作为训练字段图片。
在其中一个实施例中,所述对所述第一字段图片进行数据增强处理,得到第二字段图片的步骤,包括:
对所述第一字段图片进行有效内容的识别,确定所述第一字段图片的第一有效区域;
在所述第一有效区域的边界外对所述第一字段图片进行裁剪;其中,裁剪得到的区域边框为检测框;
将所述检测框向内缩减若干个像素,得到第二有效区域,根据所述第二有效区域截取第二字段图片;
其中,所述有效内容为所述第一字段图片的字段内容。
在其中一个实施例中,在所述将所述有效区域向内缩减若干个像素的步骤之前,还包括:
将所述检测框向外扩充若干个像素,得到所述第一有效区域;其中,所述向外扩充的像素大于向内缩减的像素。
在其中一个实施例中,所述对所述第一字段图片进行数据增强处理,得到第二字段图片的步骤,包括:
将所述第一字段图片向随机方向进行移动的模糊处理,得到所述第二字段图片。
在其中一个实施例中,所述对所述第一字段图片进行数据增强处理,得到第二字段图片的步骤,包括:
对所述第一字段图片进行若干倍率的下采样处理,降低所述第一字段图片的分辨率,得到所述第二字段图片。
第二方面,本发明还提供一种识别模型的优化装置,其包括:
获取模块,用于获取识别模型在生产中待识别的第一字段图片;
标注模块,用于将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息;其中,所述众包平台的用户对所述第一字段图片进行识别标注;
接收模块,用于定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片;
优化模块,用于将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化。
第三方面,本发明还提供一种服务器,其包括:
一个或多个处理器;
存储器;
一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于执行第一方面任一实施例所述的识别模型的优化方法。
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现第一方面任一实施例所述的识别模型的优化方法。
本发明所提供的一种识别模型的优化方法和装置,利用所述众包平台完成对大量字段图片进行识别标注,能在较短时间内向所述识别模型提供大量且可信度高的训练字段图片,从而避免了不能在短时间内不能获取可信度高的训练字段图片,也可解决了生产中所产生的大量字段数据,但因未能进行标注而可信度不高的问题,保证及时对所述识别模型的训练样本进行更新,保证所述识别模型在能以较短的时间间隔完成优化,提升所述识别模型的识别能力。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明中的一个实施例的识别模型的优化方法的流程图;
图2为本发明中的又一个实施例的识别模型的优化方法的流程图;
图3为本发明中的另一个实施例的识别模型的优化方法的流程图;
图4为本发明中的所述识别模型的优化方法的一个具体实施例流程图;
图5为本发明中的一个实施例的识别模型的优化装置的示意图;
图6为本发明中的一个实施例的服务器的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
为了解决目前字段识别受限于业务方提供的数据,导致影响了识别模型优化的问题,本发明提供了一种识别模型的优化方法,请参考图1所示,图1是一个实施例的识别模型的优化方法的流程图,包括以下步骤:
S110、获取识别模型在生产中待识别的第一字段图片。
在本步骤中,通过服务器获取在业务生产中所产生的字段图片,该字段图片是用于向所述识别模型提供训练数据集的材料,在本实施例中该字段图片被定位为第一字段图片。所述第一字段图片是对识别对象所截取关于字段内容的图片。所述字段内容是未经过结果识别的,若直接将其作为训练数据集对识别模型进行优化,得到的识别模型的识别能力会受到一定程度的影响。
S120、将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息。
在此步骤中,所述众包平台的用户对所述第一字段图片进行识别标注。
服务器对步骤S110的所获取的第一字段图片中的字段内容发送至所述众包平台。所述众包平台上的用户对第一字段图片中的字段内容进行识别,并根据识别的结果对所述第一字段图片进行标注,得到并返回关于对应的第一字段图片的标注信息。
由于众包平台上的所有用户均可以对所述第一字段图片中的字段内容进行识别并标注,因此,针对单个第一字段图片的字段内容,所述众包平台可能会收集到多于一个识别结果。对于一个第一字段图片,若在所述众包平台上产生多个识别结果,则可对该多个识别结果进行比例的统计,并根据该比例的统计结果,确认使用哪个识别结果对对应的第一字段图片,并进行标注。
在本实施例中,服务器将第一字段图片中的字段内容发送至所述众包平台,可以是定期对所述第一字段图片中的字段内容经过压缩形成数据压缩包,并发送至所述众包平台。所述众包平台接收到所述数据压缩包,并对其进行解压,供众包平台上的用户对其内容进行识别。
S130、定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片。
用户根据识别模型的优化频率,设定接收所述第一字段图片的标注信息的频率。服务器根据接收频率,接收所述众包平台返回第一字段图片的标注信息。服务器根据所述第一字段图片及其对应的标注信息,形成可收录至所述识别模型的训练数据集,作为训练字段图片。由于所述训练字段图片是经过众包平台的用户进行标注,收集了大量的识别结果并统计得到的,因此,所述训练字段图片的准确率较高,能直接收录至识别模型并作为训练样本。
S140、将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化。
将步骤S130得到的训练字段图片作为训练样本,添加至所述识别模型的训练数据集中,对所述训练数据集进行更新,并以更新后的训练数据集对所述识别模型进行优化,不断提高所述识别模型的识别能力。
本发明提供的一种识别模型的优化方法,获取为所述识别模型提供的待识别的第一字段图片,对所述第一字段图片在所述众包平台上标注并得到包含对应的标注信息的训练字段图片,并利用该训练字段图片对所述识别模型进行优化。本发明通过众包平台对生产中的第一字段图片进行标注,得到所述识别模型可直接使用的高可信度的训练样本,解决了业务数据数量大但可信度低的问题,同时,也可以解决因受到业务提供的训练字段图片有限或训练字段图片未能及时更新,而影响了识别模型的优化进度的问题。对于步骤S120,所述标注信息包括所述第一字段图片的标注编码和众包平台对所述第一字段图片的识别结果。其中,所述标注编码与各个第一字段图片一一对应,以便后期保存对应的第一字段图片进行进一步的训练数据。
对于所述识别结果的获取,具体地,可以对上述关于识别结果的比例设定参考值,且该参考值至少为所收集到的全部的识别结果总数的一半以上。
若对应的第一字段图片的某个识别结果的占比高于该参考值的情况下,则认为该识别结果得到绝大部分用户的认同,则以该识别结果对对应的第一字段图片进行标注。
若对应的第一字段图片的所有识别结果的占比均低于该参考值的情况下,则认为任何一个是识别结果均不能直接认定为对应的第一字段图片的最终识别结果。对此,根据对应的第一字段图片的文字排版,如经过扫描,并根据扫描的结果对文字或符号之间进行分隔,形成多个单独的字体或符号,并以该字体或符号作为独立的判断对象。根据所述众包平台对该单个字体或符号进行识别,若得到的对应的某个识别结果高于所述参考值,则确认其为单个字体或符号最终的识别结果。待所述第一字段图片中的所有单个字体或符号识别完毕后,对所有的识别结果进行整合,并得到该第一字段图片最终的识别结果,并进行标注。该标注可以有别于可一次性得到识别结果的标注,以便识别模型进行特别标注。
对于将所述第一字段图片分隔成单个字体或符号后,仍无法得到所有单个字体或符号的识别结果的比例高于参考值的情况下,若比例高于参考值的单个字体或符号的个数占总数达到设定比例值时,则将根据所述众包平台的用户对该第一字段图片的类型的判断进行预测,得到一个识别结果,并进行标注,该标注可有别于上述所有的其他标注,以便所述识别模型以特定的形式进行标注,提高识别的准确性。
若对应的第一字段图片中比例高于参考值的单个字体或符号的个数占总数未能达到设定比例值时,则判断所述第一字段图片为异常状态,并向服务器返回对应的异常提示信息,启动重新获取对应第一字段图片的指令。
参照图2,图2是是又一个实施例的识别模型的优化方法的流程图,在上述基础上,步骤S130包括步骤:
S131:定期接收所述众包平台返回的第一字段图片的标注信息;
其中,所述根据所述第一字段图片的标注信息,获取训练字段图片的步骤包括:
S132、根据所述标注编码对对应的第一字段图片的所述第一识别结果进行编码;
S133、根据编码的结果,为所述第一识别结果分配对应的标注编码,得到完成识别的第一字段图片作为训练字段图片。
对应上述步骤S131-S133,定期接收经过步骤S120对所述第一字段图片进行标注得到其识别结果,得到第一识别结果。其中,该第一识别结果与对应的第一字段图片的标注编码进行对应编码,以便确认所述识别结果与对应的第一字段图片的对应关系。
根据从该两步骤所得到对应的标注编码、识别结果等标注信息的第一字段图片,由于经过所述众包平台进行标注得到了对应的第一识别结果,因此其可信度大大高于未经过标注的业务数据,该包括标注信息的第一字段图片可直接作为训练字段图片,为所述识别模型提供训练样本。
而且所述标注信息包括标注编码和与该标注编码对应的所述第一字段图片的第一识别结果,使得不同的第一字段图片之间不会因为标注有相同的识别结果而混淆,有利于后续进行进一步的训练数据优化或数据增强处理。
参照图3,图3是是另一个实施例的识别模型的优化方法的流程图,在上述的基础上,对于步骤140中的所述将所述训练字段图片添加至所述识别模型的训练数据集中的步骤之前,还包括:
S1、对所述第一字段图片进行数据增强处理,得到第二字段图片;
S2、将所述第二字段图片发送至所述众包平台进行标注,根据对应的标注编码,获取所述第二字段图片的第二识别结果;
S3、对所述第一识别结果与所述第二识别结果进行比较;
S4、若两者一致,则将所述第二字段图片作为训练字段图片。
在上述步骤S1中,为了增加所述识别模型的鲁棒性。对所述第一字段图片进行数据增强处理,得到对应的第二字段图片。即将所述第一字段图片的质量降低,使得所述识别模型对于质量较差的字段图片时,也能识别出正确地文本。
在步骤S2中,对于从步骤S1得到的所述第二字段图片,重新发送至所述众包平台,并进行标注。在此次重新对同一原始的字段图片进行标注得到的识别结果的标注编码与对应的第一字段图片相同;或者是在其基础上增加标注的次数的数值编号,如对于同一原始字段图片进行标注时,对其第一字段图片进行标注的标注编码为N123-1,若对应经过数据增强处理后的第二字段图片进行标注的标注编码为N123-2。这样,以便对快速查询或搜索到对应字段图片的数据处理历史,有利于为调整所述识别模型的优化方法提供参考。
具体地,所述第二字段图片在发送至所述众包平台进行识别,并得到对应的第二识别结果,具体获取第二识别结果的过程与上述提到的所述识别结果的获取过程相同。
在步骤S3中,将所述第一识别结果与所述第二识别结果进行比较,以防止所述第一字段图片进行数据增强处理过度的字段图片作为所述识别模型的训练样本,降低所述识别模型的识别能力。
因此,在步骤S4中,对于步骤S3得到的比较结果是一致的情况下,即为对所述第一字段图片的数据增强处理后,所述众包平台的用户仍可辨认出其内容,所以此时得到的第二字段图片可以作为训练字段图片,为所述识别模型提供训练样本。
对于上述提到的步骤S1对所述第一字段图片进行数据增强处理,得到第二字段图片的步骤中,至少可以使用以下几种方式:
第一种方式,具体的步骤如下:
A1、对所述第一字段图片进行有效内容的识别,确定所述第一字段图片的第一有效区域;
A2、在所述第一有效区域的边界外对所述第一字段图片进行裁剪;其中,裁剪得到的区域边框为检测框;
A3、将所述检测框向内缩减若干个像素,得到第二有效区域,根据所述第二有效区域截取第二字段图片。
在数据增强处理方式是对第一字段图片进行裁剪,为了在裁剪的过程中保证所述第一字段图片中内容的完整性,需要对所述第一字段图片进行有效内容的识别,确定所述第一字段图片的第一有效区域。其中,所述有效内容为所述第一字段图片的字段内容。
在本实施例中,可对所述第一字段图片经过二值化处理,得到所述第一字段图片中字段内容所在的第一有效区域,并根据该第一有效区域,以该第一有效区域的边界外对所述第一字段图片进行裁剪,裁剪得到的区域为检测区域,该检测区域的边界为检测框,所述检测框覆盖了整个第一有效区域。
所述裁剪的方式为对所述检测框向内随机进行缩减若干个像素,得到检测框的尺寸缩减后的第二字段图片。对所述检测框缩减的范围在所述有效区域的边界外,以免裁剪检测框内的字段内容。
在步骤A3的所述将所述检测框向内缩减若干个像素的步骤之前,还包括以下步骤:
A31、将所述检测框向外扩充若干个像素,得到所述第一有效区域;其中,所述向外扩充的像素大于向内缩减的像素。
在步骤A3对所述检测框向内缩减之前,对所述检测框向外扩充若干个像素,得到所述第一有效区域,以便模拟根据裁剪得到的区域输出的检测框的微小浮动,使所述识别模型可考虑不同的数据增强处理情况,最终达到所述识别模型的识别能力。
其中,所述检测框向外扩充的像素大于向内缩减的像素,以避免后续对所述检测框的向内缩减至所述有效区域内,影响对所述字段内容的完整性。
第二种方式,具体的步骤如下:
B1、将所述第一字段图片向随机方向进行移动的模糊处理,得到所述第二字段图片。
在数据增强处理方式是对第一字段图片进行运动模糊处理,所述将所述第一字段图片向随机方向进行移动,所述随机方向可以是将所述第一字段图片向多个方向进行晃动,或者可以向任一方向快速移动,所述第二字段图片相对于对应的第一字段图片因移动产生了模糊效果,增加了降低字段图片质量的第二字段图片,以增加所述识别模型的训练字段图片,提升所述识别模型的识别能力。
对所述第一字段图片移动的速度没有对应的设定值,均以进行运动模糊处理后得到相同的识别结果即可。
第三种方式,具体的步骤如下:
C1、对所述第一字段图片进行若干倍数的下采样处理,降低所述第一字段图片的分辨率,得到所述第二字段图片。
在该实施例中,对所述第一字段图片进行下采样处理,降低所述第一字段图片的图片质量,得到分辨率下降的所述第二字段图片。对于所述第一字段图片下采样的倍数没有对应的设定值,均以进行下采样处理后得到相同的识别结果即可。
对于上述所提到的进行数据增强处理的所述第一字段图片可以是旋转至任意一个方向放置,当将其发送至所述众包平台进行标注时,用户可以选择对所述第一字段图片进行旋转调整,然后再进行识别。
具体地,当进行对所述第一字段图片进行标注后所得到的标注信息可以包括根据所述众包平台用户对对所述第一字段图片调整旋转方位后的字段图片,以便规范所述识别模型的训练字段图片;同时,不对所述第一字段图片的放置方向进行限制,以便为所述识别模型增加不同情况的训练字段图片,达到增强所述识别模型的识别能力。
在对所述第一字段图片进行数据增强处理中,可以选择以上一种或多中方式对所述第一字段图片进行处理,分别得到对应的第二字段图片,以增加所述识别模型的训练字段图片,提升所述识别模型的识别能力。
参考图4,图4是针对上述关于本发明的识别模型的优化方法的具体实施例的流程图,以下就对该具体实施例进行说明:
S401、获取识别模型在生产中待识别的第一字段图片;
S402、发送至所述众包平台进行标注;
S403、接收对所述第一字段图片进行标注后得到第一识别结果;
S404、对所述第一识别结果进行编码,并得到相应的标注编码;
S405、对所述第一字段图片进行数据增强处理,得到第二字段图片,并转至步骤S402;
S406、接收对所述第二字段图片进行标注后得到第二识别结果;
S407、对所述第二识别结果进行编码,并得到相应的标注编码;
S408、对比关于所述第一识别结果和所述第二识别结果是否一致;
若两者一致,转步骤S409:
S409、将所述第二识别结果作为训练字段图片;
若两者的识别结果一致,转步骤S410:
S410、将所述第一字段图片进行丢弃,不再对其进行识别。
在本发明中提供的一种识别模型的优化方法,通过所述众包平台对业务生产中的第一字段图片进行标注,并将对应的识别结果输出为所述识别模型提供训练字段图像作为训练样本,达到及时为所述识别模型进行优化的目的。基于与上述一种识别模型的优化方法相同的发明构思,本发明实施例还提供了一种识别模型的优化装置,如图5所示,包括:
获取模块510,用于获取识别模型在生产中待识别的第一字段图片;
标注模块520,用于将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息;其中,所述众包平台的用户对所述第一字段图片进行识别标注;
接收模块530,用于定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片;
优化模块540,用于将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化。
请参考图6,图6为一个实施例中服务器的内部结构示意图。如图6所示,该服务器包括通过系统总线连接的处理器610、存储介质620、存储器630和网络接口640。其中,该服务器的存储介质620存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器610执行时,可使得处理器610实现一种识别模型的优化方法,处理器610能实现图5所示实施例中的一种识别模型的优化装置中的获取模块510、标注模块520、接收模块530和优化模型540的功能。该服务器的处理器610用于提供计算和控制能力,支撑整个服务器的运行。该服务器的存储器630中可存储有计算机可读指令,该计算机可读指令被处理器610执行时,可使得处理器610执行一种识别模型的优化方法。该服务器的网络接口640用于与终端连接通信。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本发明还提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:获取识别模型在生产中待识别的第一字段图片;将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息;定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片;将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化,其中,所述众包平台的用户对所述第一字段图片进行识别标注。
综合上述实施例可知,本发明最大的有益效果在于:
本发明所提供的一种识别模型的优化方法和装置,其主要是通过众包平台的用户对识别模型在生产中所得到的待识别的第一字段图片直接进行标注,对所述第一字段图片进行字段内容的识别;根据对应的标注信息,得到对应的训练字段图片,并作为训练样本添加至所述识别模型的训练数据集中,不断对所述识别模型进行优化。本发明利用所述众包平台完成对大量字段图片进行识别标注,能在较短时间内向所述识别模型提供大量且可信度高的训练字段图片,保证及时对所述识别模型的训练样本进行更新,保证所述识别模型在能以较短的时间间隔完成优化,提升所述识别模型的识别能力。
本发明还进一步提供了一优化方案,对所述第一字段图片进行数据增强处理,得到第二字段图片。同时,同样利用所述众包平台对所述第二字段图片进行标注,得到对应的识别结果。根据所述第一字段图片的识别结果和所述第二字段图片的识别结果进行对比,筛选出经过适度数据增强处理的所述第二字段图片作为训练字段图片,为所述识别模型增加了训练样本,进一步提升了所述识别模型的识别能力。
综上,本发明识别模型的优化方法和装置,通过对所述众包平台的使用,避免了不能在短时间内不能获取可信度高的训练字段图片,也可解决了生产中所产生的大量字段数据,但因未能进行标注而可信度不高的问题。最终实现可利用生产中所产生的大量字段数据,并对所述识别模型进行快速优化的方案。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种识别模型的优化方法,其特征在于,包括以下步骤:
获取识别模型在生产中待识别的第一字段图片;
将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息;其中,所述众包平台的用户对所述第一字段图片进行识别标注;
定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片;
将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化。
2.根据权利要求1所述的方法,其特征在于,
所述标注信息包括所述第一字段图片的标注编码和众包平台对带有标注编码的第一字段图片的第一识别结果;
所述根据所述第一字段图片的标注信息,获取训练字段图片的步骤包括:
根据所述标注编码对对应的第一字段图片的所述第一识别结果进行编码;
根据编码的结果,为所述第一识别结果分配对应的标注编码,得到完成识别的第一字段图片作为训练字段图片。
3.根据权利要求2所述的方法,其特征在于,
所述将所述训练字段图片添加至所述识别模型的训练数据集中的步骤前,还包括:
对所述第一字段图片进行数据增强处理,得到第二字段图片;
将所述第二字段图片发送至所述众包平台进行标注,根据对应的标注编码获取所述第二字段图片的第二识别结果;
将所述第一识别结果与所述第二识别结果进行比较;
若两者一致,则将所述第二字段图片作为训练字段图片。
4.根据权利要求3所述的方法,其特征在于,
所述对所述第一字段图片进行数据增强处理,得到第二字段图片的步骤,包括:
对所述第一字段图片进行有效内容的识别,确定所述第一字段图片的第一有效区域;
在所述第一有效区域的边界外对所述第一字段图片进行裁剪;其中,裁剪得到的区域边框为检测框;
将所述检测框向内缩减若干个像素,得到第二有效区域,根据所述第二有效区域截取第二字段图片;
其中,所述有效内容为所述第一字段图片的字段内容。
5.根据权利要求4所述的方法,其特征在于,
在所述将所述有效区域向内缩减若干个像素的步骤之前,还包括:
将所述检测框向外扩充若干个像素,得到所述第一有效区域;其中,所述向外扩充的像素大于向内缩减的像素。
6.根据权利要求3所述的方法,其特征在于,
所述对所述第一字段图片进行数据增强处理,得到第二字段图片的步骤,包括:
将所述第一字段图片向随机方向进行移动的模糊处理,得到所述第二字段图片。
7.根据权利要求3所述的方法,其特征在于,
所述对所述第一字段图片进行数据增强处理,得到第二字段图片的步骤,包括:
对所述第一字段图片进行若干倍率的下采样处理,降低所述第一字段图片的分辨率,得到所述第二字段图片。
8.一种识别模型的优化装置,其特征在于,包括:
获取模块,用于获取识别模型在生产中待识别的第一字段图片;
标注模块,用于将所述第一字段图片发送至众包平台进行标注,得到对应的标注信息;其中,所述众包平台的用户对所述第一字段图片进行识别标注;
接收模块,用于定期接收所述众包平台返回的第一字段图片的标注信息,根据所述第一字段图片的标注信息,获取训练字段图片;
优化模块,用于将所述训练字段图片添加至所述识别模型的训练数据集中,并利用所述训练数据集对所述识别模型进行优化。
9.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于执行根据权利要求1至7任一项所述的识别模型的优化方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1-7任一项所述的识别模型的优化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910270038.3A CN110135409B (zh) | 2019-04-04 | 2019-04-04 | 识别模型的优化方法和装置 |
PCT/CN2019/103009 WO2020199472A1 (zh) | 2019-04-04 | 2019-08-28 | 识别模型的优化方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910270038.3A CN110135409B (zh) | 2019-04-04 | 2019-04-04 | 识别模型的优化方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110135409A true CN110135409A (zh) | 2019-08-16 |
CN110135409B CN110135409B (zh) | 2023-11-03 |
Family
ID=67569369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910270038.3A Active CN110135409B (zh) | 2019-04-04 | 2019-04-04 | 识别模型的优化方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110135409B (zh) |
WO (1) | WO2020199472A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020199472A1 (zh) * | 2019-04-04 | 2020-10-08 | 平安科技(深圳)有限公司 | 识别模型的优化方法和装置 |
CN112686045A (zh) * | 2021-03-17 | 2021-04-20 | 北京世纪好未来教育科技有限公司 | 文本错误检测模型的评测方法及装置 |
CN112699906A (zh) * | 2019-10-22 | 2021-04-23 | 杭州海康威视数字技术股份有限公司 | 获取训练数据的方法、装置及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115841255B (zh) * | 2022-12-27 | 2024-05-31 | 济南市工程质量与安全中心 | 基于在线分析的建筑工程现场预警方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009049314A2 (en) * | 2007-10-11 | 2009-04-16 | Trustees Of Boston University | Video processing system employing behavior subtraction between reference and observed video image sequences |
US20140314311A1 (en) * | 2013-04-23 | 2014-10-23 | Wal-Mart Stores, Inc. | System and method for classification with effective use of manual data input |
CN108268575A (zh) * | 2017-01-04 | 2018-07-10 | 阿里巴巴集团控股有限公司 | 标注信息的处理方法、装置和系统 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108573255A (zh) * | 2017-03-13 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 文字合成图像的识别方法及装置、图像识别方法 |
CN108664897A (zh) * | 2018-04-18 | 2018-10-16 | 平安科技(深圳)有限公司 | 票据识别方法、装置及存储介质 |
CN108921029A (zh) * | 2018-06-04 | 2018-11-30 | 浙江大学 | 一种融合残差卷积神经网络和pca降维的sar自动目标识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150324614A1 (en) * | 2012-11-29 | 2015-11-12 | Prasenjit Dey | Image Analysis |
WO2016109884A1 (en) * | 2015-01-05 | 2016-07-14 | Valorbec Limited Partnership | Automated recommendation and virtualization systems and methods for e-commerce |
CN107273492B (zh) * | 2017-06-15 | 2021-07-23 | 复旦大学 | 一种基于众包平台处理图像标注任务的交互方法 |
CN108829652B (zh) * | 2018-04-28 | 2021-06-08 | 河海大学 | 一种基于众包的图片标注系统 |
CN109800320B (zh) * | 2019-01-04 | 2023-08-18 | 平安科技(深圳)有限公司 | 一种图像处理方法、设备及计算机可读存储介质 |
CN110135409B (zh) * | 2019-04-04 | 2023-11-03 | 平安科技(深圳)有限公司 | 识别模型的优化方法和装置 |
-
2019
- 2019-04-04 CN CN201910270038.3A patent/CN110135409B/zh active Active
- 2019-08-28 WO PCT/CN2019/103009 patent/WO2020199472A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009049314A2 (en) * | 2007-10-11 | 2009-04-16 | Trustees Of Boston University | Video processing system employing behavior subtraction between reference and observed video image sequences |
US20140314311A1 (en) * | 2013-04-23 | 2014-10-23 | Wal-Mart Stores, Inc. | System and method for classification with effective use of manual data input |
CN108268575A (zh) * | 2017-01-04 | 2018-07-10 | 阿里巴巴集团控股有限公司 | 标注信息的处理方法、装置和系统 |
CN108573255A (zh) * | 2017-03-13 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 文字合成图像的识别方法及装置、图像识别方法 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108664897A (zh) * | 2018-04-18 | 2018-10-16 | 平安科技(深圳)有限公司 | 票据识别方法、装置及存储介质 |
CN108921029A (zh) * | 2018-06-04 | 2018-11-30 | 浙江大学 | 一种融合残差卷积神经网络和pca降维的sar自动目标识别方法 |
Non-Patent Citations (1)
Title |
---|
张彩琴 等: "基于Co-training训练CRF模型的评价对象识别", 计算机应用与软件, vol. 30, no. 09, pages 32 - 56 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020199472A1 (zh) * | 2019-04-04 | 2020-10-08 | 平安科技(深圳)有限公司 | 识别模型的优化方法和装置 |
CN112699906A (zh) * | 2019-10-22 | 2021-04-23 | 杭州海康威视数字技术股份有限公司 | 获取训练数据的方法、装置及存储介质 |
CN112699906B (zh) * | 2019-10-22 | 2023-09-22 | 杭州海康威视数字技术股份有限公司 | 获取训练数据的方法、装置及存储介质 |
CN112686045A (zh) * | 2021-03-17 | 2021-04-20 | 北京世纪好未来教育科技有限公司 | 文本错误检测模型的评测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2020199472A1 (zh) | 2020-10-08 |
CN110135409B (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135409A (zh) | 识别模型的优化方法和装置 | |
CN109344884B (zh) | 媒体信息分类方法、训练图片分类模型的方法及装置 | |
US11100187B2 (en) | Method and device for jumping between pages | |
CN112348783B (zh) | 基于图像的人物识别方法、装置及计算机可读存储介质 | |
CN101777068B (zh) | 一种用于移动通讯设备终端的网页页面预读及整合浏览系统及其应用方法 | |
CN100481088C (zh) | 网页资源发布方法和发布系统 | |
US8745180B2 (en) | Method for dynamically adjusting network parameters of a mobile terminal browser and mobile terminal | |
US20130144961A1 (en) | System and method for providing information interactively by instant messaging application | |
EP3923585A1 (en) | Video transcoding method and device | |
CN106293554A (zh) | 一种云打印系统及云打印机 | |
CN108584598A (zh) | 一种电梯故障自动分析与预警方法、存储介质及智能终端 | |
CN114430307B (zh) | 数据解码方法、数据编码方法、装置及终端设备 | |
CN113449207B (zh) | 电子设备定位的方法、装置、服务器、系统以及存储介质 | |
US20230345295A1 (en) | Data transmission method, related device, computer readable storage medium, and computer program product | |
US11610392B1 (en) | Methods, devices, and systems for identifying the composition of materials | |
CN110647372A (zh) | 页面展示模块的位置调整方法以及装置 | |
CN115188000A (zh) | 基于ocr的文本识别方法、装置、存储介质及电子设备 | |
US11281367B2 (en) | Slider for content selection in user interface | |
Wang et al. | Harnessing the Power of AI-Generated Content for Semantic Communication | |
WO2021217828A1 (zh) | 一种对视频进行转码的方法和装置 | |
CN103473270A (zh) | 一种基于用户特性的内容展示和互动装置及其使用方法 | |
US20210344936A1 (en) | Method and device for transcoding video | |
WO2020258479A1 (zh) | 网页帧的获取方法、服务器及存储介质 | |
CN106357764A (zh) | 移动终端的数据同步方法、及服务器 | |
CN103024713B (zh) | 基于媒体分析的数字媒体内容服务网关系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |