CN116543392A - 一种用于深度学习字符识别的标注方法 - Google Patents

一种用于深度学习字符识别的标注方法 Download PDF

Info

Publication number
CN116543392A
CN116543392A CN202310423117.XA CN202310423117A CN116543392A CN 116543392 A CN116543392 A CN 116543392A CN 202310423117 A CN202310423117 A CN 202310423117A CN 116543392 A CN116543392 A CN 116543392A
Authority
CN
China
Prior art keywords
labeling
picture
marked
ocr
training model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310423117.XA
Other languages
English (en)
Other versions
CN116543392B (zh
Inventor
杨牧
赵亮
李建福
陈建文
张董
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Techmach Corp
Original Assignee
Techmach Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Techmach Corp filed Critical Techmach Corp
Priority to CN202310423117.XA priority Critical patent/CN116543392B/zh
Publication of CN116543392A publication Critical patent/CN116543392A/zh
Application granted granted Critical
Publication of CN116543392B publication Critical patent/CN116543392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Character Input (AREA)

Abstract

本发明涉及数据标识技术领域,特别是涉及一种用于深度学习字符标识的标注方法,包括:获取待标注图片,对所述待标注图片设置预标注参数,所述预标注参数包括标注区域、字符区域和输出格式;创建OCR训练模型,根据所述OCR训练模型对所述待标注图片进行预标注,得到预标注结果,将所述预标注结果反馈到预标注结果编辑框内和预标注数据库中;对所述预标注结果进行确认,若所述预标注结果正确,则设置区域属性信息并完成单张标注,若所述预标注结果不正确,对所述预标注结果进行微调,再次进行确认;其中,所述预标注结果为所述待标注图片的区域信息和识别结果,解决了现有的标注工具基本都是人工逐字标注,标注过程枯燥繁琐且容易出错的技术问题。

Description

一种用于深度学习字符识别的标注方法
技术领域
本发明涉及数据标注技术领域,更具体地,涉及一种用于深度学习字符识别的标注方法。
背景技术
机器学习与深度学习在过去十年内取得了长足的进步,这一方面得益于算力的提高、基础研究的进步,同时也得益于数据,尤其是标注数据的增长。从广义上来说,机器学习与深度学习可以被划分为监督学习、无监督学习、自监督学习等领域。无监督学习与自监督学习只需要将事先处理过的大规模数据送入模型进行训练、学习,无需进行人为标注。然而,大部分深度学习算法与场景,要求算法以监督学习的方式进行训练,这就需要进行人工数据标注工作。
数据标注是人工智能产业链条上的基础一环,也一直是深度学习开发者关注的重点。但目前的标注工具基本上都是人工逐字标注,标注过程枯燥繁琐且容易出错,无论是从成本还是时间上面,提高标注效率,降低标注成本都尤为重要。
因此,如何提高标注时间效率,降低人工标注比例是目前有待解决的技术问题。
发明内容
本发明提供一种用于深度学习字符识别的标注方法,用以解决现有技术中的标注工具基本上都是人工逐字标注,标注过程枯燥繁琐且容易出错的技术问题。该方法包括:
获取待标注图片,对所述待标注图片设置预标注参数,所述预标注参数包括标注区域、字符区域和输出格式;
创建OCR训练模型,根据所述OCR训练模型对所述待标注图片进行预标注,得到预标注结果,将所述预标注结果反馈到预标注结果编辑框内和预标注数据库中;
对所述预标注结果进行确认,若所述预标注结果正确,则设置区域属性信息并完成单张标注,若所述预标注结果不正确,对所述预标注结果进行微调,再次进行确认;
其中,所述预标注包括区域检测和识别,所述预标注结果为所述待标注图片的区域信息和识别结果。
在本申请的一些实施例中,所述根据所述OCR训练模型对所述待标注图片进行预标注,包括:
所述OCR训练模型对所述标注区域进行检测和识别,所述OCR训练模型检测到所述字符区域,获得所述字符区域的识别结果,将所述识别结果反馈到所述预标注结果编辑框内,完成所述字符区域的识别。
在本申请的一些实施例中,在根据所述OCR训练模型对所述待标注图片进行预标注之前,所述方法还包括:
判断所述待标注图片是否满足预设清晰度,若所述待标注图片满足预设清晰度,则进行所述步骤二;
若所述待标注图片不满足预设清晰度,根据所述待标注图片的图像质量调整所述待标注图片的亮度、对比度和标注框的透明度,从而调整所述待标注图片的清晰度,直至所述待标注图片满足所述预设清晰度。
在本申请的一些实施例中,所述若所述预标注结果正确,则设置区域属性信息并完成单张标注,包括:
在所述待标注图片上选择需要设置区域属性的所述标注区域,新建所述标注区域的属性类别;
其中,所述属性类别可进行叠加,可根据所述标注区域的属性与外部进行通信交互。
在本申请的一些实施例中,所述方法还可对带角度的矩形进行标注,包括:
预绘制一条线段,所述线段与所述标注区域成预设角度;
沿所述线段的垂直方向延伸预设距离,将所述标注区域框全;
进行所述OCR训练模型的预标注。
在本申请的一些实施例中,在完成单张标注后,所述方法还包括:
在所述预标注数据库中生成了已标注图片对应的所述标注区域和区域列表,所述预标注数据库可对所述已标注图片的单个区域、多个区域以及全部区域的整体位置进行调整。
在本申请的一些实施例中,所述在完成单张标注后,所述方法还包括:
所述预标注数据库可对所述已标注图片进行局部区域信息或全部区域信息进行复制、粘贴和移动,对与所述已标注图片的区域信息内容类似但位置存在偏差的所述待标注图片进行标注。
在本申请的一些实施例中,在创建OCR训练模型之前,所述方法还包括:
创建OCR预训练模型,对所述OCR预训练模型进行迭代训练,得到所述OCR训练模型,当所述预标注数据库存储到预设已标注图片数量后,可对所述OCR训练模型进行重新训练。
在本申请的一些实施例中,创建OCR预训练模型,对所述OCR预训练模型进行迭代训练,包括:
获取所述已标注图片;
创建OCR预训练模型,所述OCR预训练模型对所述已标注图片进行识别;
按照上述方法对所述OCR预训练模型进行迭代训练,得到所述OCR训练模型;
其中,所述已标注图片分为训练样本集和验证样本集,所述训练样本集用于训练所述OCR预训练模型,所述验证样本集用于泛化验证。
在本申请的一些实施例中,对所述OCR预训练模型进行训练的过程中,采用深度学习的算法来实现,所述算法包括BERT算法、LSTM算法、以及OCR识别模型。
本申请实施例与现有技术相比,带来了以下有益效果:
本发明提供了一种用于深度学习字符识别的标注方法,包括:获取待标注图片,对所述待标注图片设置预标注参数,所述预标注参数包括标注区域、字符区域和输出格式;创建OCR训练模型,根据所述OCR训练模型对所述待标注图片进行预标注,得到预标注结果,将所述预标注结果反馈到预标注结果编辑框内和预标注数据库中;对所述预标注结果进行确认,若所述预标注结果正确,则设置区域属性信息并完成单张标注,若所述预标注结果不正确,对所述预标注结果进行微调,再次进行确认;其中,所述预标注包括区域检测和识别,所述预标注结果为所述待标注图片的区域信息和识别结果。该方法在OCR训练模型中进行预标注,所述OCR训练模型由OCR预训练模型经过不断训练得到的,可以提高对未知识别的准确性,再得到预标注结果后,对所述预标注结果进行确认,若确认正确,设置区域属性完成单张标注,若不正确,对所述预标注结果进行微调,直到确认正确,本申请通过OCR训练模型,很快得到预标注结果,无需人工逐个单次的去标注,解决了现有技术中的标注工具基本上都是人工逐字标注,标注过程枯燥繁琐且容易出错的技术问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地 ,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中一种用于深度学习字符识别的标注方法的示意图;
图2是本申请实施例中一种用于深度学习字符识别的标注方法的流程示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
在本申请的描述中,需要理解的是,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内侧的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
如图1所示,本发明实施例的一种用于深度学习字符识别的标注方法,包括:
步骤一S101:获取待标注图片,对所述待标注图片设置预标注参数,所述预标注参数包括标注区域、字符区域和输出格式;
步骤二S102:创建OCR训练模型,根据所述OCR训练模型对所述待标注图片进行预标注,得到预标注结果,将所述预标注结果反馈到预标注结果编辑框内和预标注数据库中;
步骤三S103:对所述预标注结果进行确认,若所述预标注结果正确,则设置区域属性信息并完成单张标注,若所述预标注结果不正确,对所述预标注结果进行微调,再次进行确认;
其中,所述预标注包括区域检测和识别,所述预标注结果为所述待标注图片的区域信息和识别结果。
在本实施例中,提前设置好待标注图片的输入路径和已标注图片的输出路径,在输入路径中获取待标注图片,将单张标注完成的图片输送到输出路径。
在本申请的一些实施例中,所述根据所述OCR训练模型对所述待标注图片进行预标注,包括:
所述OCR训练模型对所述标注区域进行检测和识别,所述OCR训练模型检测到所述字符区域,获得所述字符区域的识别结果,将所述识别结果反馈到所述预标注结果编辑框内,完成所述字符区域的识别。
在本实施例中,OCR训练模型由OCR预训练模型不断迭代训练而来,OCR预训练模型进行不断的训练可以优化对于未知字符的识别准确率,从而提高OCR训练模型对未知字符的识别准确率。
在本申请的一些实施例中,在根据所述OCR训练模型对所述待标注图片进行预标注之前,所述方法包括:
判断所述待标注图片是否满足预设清晰度,若所述待标注图片满足预设清晰度,则进行所述步骤二;
若所述待标注图片不满足预设清晰度,根据所述待标注图片的图像质量调整所述待标注图片的亮度、对比度和标注框的透明度,从而调整所述待标注图片的清晰度,直至所述待标注图片满足所述预设清晰度。
在本申请的一些实施例中,所述若所述预标注结果正确,则设置区域属性信息并完成单张标注,包括:
在所述待标注图片上选择需要设置区域属性的所述标注区域,新建所述标注区域的属性类别;
其中,所述属性类别可进行叠加,可根据所述标注区域的属性与外部进行通信交互。
在本实施例中,首先在待标注图片上选择需要设置新的属性的标注区域,新建区域的属性类别,属性类别包括标注区域归属的字符快、标识区域的实际含义等,可根据标注区域多个属性的叠加,实现对区域的个性化处理,根据区域属性信息对外个性化输出,标注区域属性还可设置为不识别区域,这样可以减少不识别区域对于标注区域检测和识别能力的干扰。
在本申请的一些实施例中,所述方法还可对带角度的矩形进行标注,包括:
预绘制一条线段,所述线段与所述标注区域成预设角度;
沿所述线段的垂直方向延伸预设距离,将所述标注区域框全;
进行所述OCR训练模型的预标注。
在本实施例中,此方法可对带角度的矩形进行标注,带角度的矩形为在自然场景下的图像,会出现一些标注区域带有角度,在此标注区域的预设角度绘制一条线段,沿着此线段的两端顶点向下做垂直线,将需要标注文字区域框全,之后通过OCR训练模型进行字符识别,可以很好的处理由于标注文字区域角度的变化导致背景占比过大,导致后续的OCR训练模型识别有拟合风险的问题。
在本申请的一些实施例中,在完成单张标注后,所述方法包括:
在所述预标注数据库中生成了已标注图片对应的所述标注区域和区域列表,所述预标注数据库可对所述已标注图片的单个区域、多个区域以及全部区域的整体位置进行调整。
在本实施例中,针对已标注图片,生成该张图片对应的标注区域和区域列表,在已标注图片的标注区域中选择多个区域列表,将多个区域列表选择到一起,选中的多个区域通过方向键进行区域的整体左右上下移动功能,也可实现区域的整体缩放。
在本申请的一些实施例中,所述在完成单张标注后,所述方法还包括:
所述预标注数据库可对所述已标注图片进行局部区域信息或全部区域信息进行复制、粘贴和移动,对与所述已标注图片的区域信息内容类似但位置存在偏差的所述待标注图片进行标注。
在本实施例中,通过组合键对已标注图片的区域信息进行复制,区域信息包括区域的位置信息、标识信息等,将复制的区域信息粘贴到待标注图片上,此待标注图片和已标注图片的信息内容类似但是位置存在一些偏差,通过整体区域的复制粘贴,将区域信息移动到待标注图片上,实现了高效率的标注。
在本申请的一些实施例中,在创建OCR训练模型之前,所述方法包括:
创建OCR预训练模型,对所述OCR预训练模型进行迭代训练,得到所述OCR训练模型,当所述预标注数据库存储到预设已标注图片数量后,可对所述OCR训练模型进行重新训练。
在本实施例中,当存储到预设已标注图片数量后,即预设已标注图片到达一定的数量后,对OCR训练模型进行重新训练,重新训练后的OCR训练模型精度也会依据已标注图片数量增多而提高,上述过程为预标注、模型训练、预标注,此过程可以循环进行,提升对待标注图片的标注精度。
在本申请的一些实施例中,所述创建OCR预训练模型,对所述OCR预训练模型进行迭代训练,包括:
获取所述已标注图片;
创建OCR预训练模型,所述OCR预训练模型对所述已标注图片进行识别;
按照上述方法对所述OCR预训练模型进行迭代训练,得到所述OCR训练模型;
其中,所述已标注图片分为训练样本集和验证样本集,所述训练样本集用于训练OCR预训练模型,所述验证样本集用于泛化验证。
在本实施例中,验证样本集和训练样本集的比例为2:8的关系,验证样本集占已标注图片的两成,验证样本集用来进行泛化验证,不参与对OCR预训练模型的训练,泛化验证具体为对OCR预训练模型预测的未知字符进行验证,训练样本集占已标注图片的八成,训练样本集用于对OCR预训练模型进行训练,从而优化对于未知字符的识别准确率。
在本申请的一些实施例中,对所述OCR预训练模型进行训练的过程中,采用深度学习的算法来实现,所述算法包括BERT算法、LSTM算法、以及OCR识别模型。
本发明提供了一种用于深度学习字符识别的标注方法,包括:获取待标注图片,对所述待标注图片设置预标注参数,所述预标注参数包括标注区域、字符区域和输出格式;创建OCR训练模型,根据所述OCR训练模型对所述待标注图片进行预标注,得到预标注结果,将所述预标注结果反馈到预标注结果编辑框内和预标注数据库中;对所述预标注结果进行确认,若所述预标注结果正确,则设置区域属性信息并完成单张标注,若所述预标注结果不正确,对所述预标注结果进行微调,再次进行确认;其中,所述预标注包括区域检测和识别,所述预标注结果为所述待标注图片的区域信息和识别结果。该方法在OCR训练模型中进行预标注,所述OCR训练模型由OCR预训练模型经过不断训练得到的,可以提高对未知识别的准确性,再得到预标注结果后,对所述预标注结果进行确认,若确认正确,设置区域属性完成单张标注,若不正确,对所述预标注结果进行微调,直到确认正确,本申请通过OCR训练模型,很快得到预标注结果,无需人工逐个单次的去标注,解决了现有技术中的标注工具基本上都是人工逐字标注,标注过程枯燥繁琐且容易出错的技术问题。
以上所述仅为本发明的一个实施例子,但不能以此限制本发明的范围,凡依据本发明所做的结构上的变化,只要不失本发明的要义所在,都应视为落入本发明保护范围之内受到制约。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种用于深度学习字符识别的标注方法,其特征在于,包括:
获取待标注图片,对所述待标注图片设置预标注参数,所述预标注参数包括标注区域、字符区域和输出格式;
创建OCR训练模型,根据所述OCR训练模型对所述待标注图片进行预标注,得到预标注结果,将所述预标注结果反馈到预标注结果编辑框内和预标注数据库中;
对所述预标注结果进行确认,若所述预标注结果正确,则设置区域属性信息并完成单张标注,若所述预标注结果不正确,对所述预标注结果进行微调,再次进行确认;
其中,所述预标注包括区域检测和识别,所述预标注结果为所述待标注图片的区域信息和识别结果。
2.如权利要求1所述的用于深度学习字符识别的标注方法,其特征在于,所述根据所述OCR训练模型对所述待标注图片进行预标注,包括:
所述OCR训练模型对所述标注区域进行检测和识别,所述OCR训练模型检测到所述字符区域,获得所述字符区域的识别结果,将所述识别结果反馈到所述预标注结果编辑框内,完成所述字符区域的识别。
3.如权利要求1所述的一种用于深度学习字符识别的标注方法,其特征在于,所述在根据所述OCR训练模型对所述待标注图片进行预标注之前,包括:
判断所述待标注图片是否满足预设清晰度,若所述待标注图片满足预设清晰度,则进行所述步骤二;
若所述待标注图片不满足预设清晰度,根据所述待标注图片的图像质量调整所述待标注图片的亮度、对比度和标注框的透明度,从而调整所述待标注图片的清晰度,直至所述待标注图片满足所述预设清晰度。
4.如权利要求1所述的用于深度学习字符识别的标注方法,其特征在于,所述若所述预标注结果正确,则设置区域属性信息并完成单张标注,包括:
在所述待标注图片上选择需要设置区域属性的所述标注区域,新建所述标注区域的属性类别;
其中,所述属性类别可进行叠加,可根据所述标注区域的属性与外部进行通信交互。
5.如权利要求1所述的用于深度学习字符识别的标注方法,其特征在于,还可对带角度的矩形进行标注,包括:
预绘制一条线段,所述线段与所述标注区域成预设角度;
沿所述线段的垂直方向延伸预设距离,将所述标注区域框全;
进行所述OCR训练模型的预标注。
6.如权利要求1所述的用于深度学习字符识别的标注方法,其特征在于,在完成单张标注后,包括:
在所述预标注数据库中生成了已标注图片对应的所述标注区域和区域列表,所述预标注数据库可对所述已标注图片的单个区域、多个区域以及全部区域的整体位置进行调整。
7.如权利要求6所述的用于深度学习字符识别的标注方法,其特征在于,所述在完成单张标注后,还包括:
所述预标注数据库可对所述已标注图片进行局部区域信息或全部区域信息进行复制、粘贴和移动,对与所述已标注图片的区域信息内容类似但位置存在偏差的所述待标注图片进行标注。
8.如权利要求7所述的用于深度学习字符识别的标注方法,在创建OCR训练模型之前,其特征在于,包括:
创建OCR预训练模型,对所述OCR预训练模型进行迭代训练,得到所述OCR训练模型,当所述预标注数据库存储到预设已标注图片数量后,可对所述OCR训练模型进行重新训练。
9.如权利要求8所述的用于深度学习字符识别的标注方法,其特征在于,所述创建OCR预训练模型,对所述OCR预训练模型进行迭代训练,包括:
获取所述已标注图片;
创建OCR预训练模型,所述OCR预训练模型对所述已标注图片进行识别;
按照上述方法对所述OCR预训练模型进行迭代训练,得到所述OCR训练模型;
其中,所述已标注图片分为训练样本集和验证样本集,所述训练样本集用于训练OCR预训练模型,所述验证样本集用于泛化验证。
10.如权利要求9所述的用于深度学习字符识别的标注方法,其特征在于,还包括:
对所述OCR预训练模型进行训练的过程中,采用深度学习的算法来实现,所述算法包括BERT算法、LSTM算法、以及OCR识别模型。
CN202310423117.XA 2023-04-19 2023-04-19 一种用于深度学习字符识别的标注方法 Active CN116543392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310423117.XA CN116543392B (zh) 2023-04-19 2023-04-19 一种用于深度学习字符识别的标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310423117.XA CN116543392B (zh) 2023-04-19 2023-04-19 一种用于深度学习字符识别的标注方法

Publications (2)

Publication Number Publication Date
CN116543392A true CN116543392A (zh) 2023-08-04
CN116543392B CN116543392B (zh) 2024-03-12

Family

ID=87455283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310423117.XA Active CN116543392B (zh) 2023-04-19 2023-04-19 一种用于深度学习字符识别的标注方法

Country Status (1)

Country Link
CN (1) CN116543392B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809266A (zh) * 2015-02-11 2015-07-29 山东科技大学 一种基于样条曲线的工作面煤层赋存情况精确预测方法
CN105205199A (zh) * 2014-06-30 2015-12-30 上海神机软件有限公司 建设工程模板标识码管理系统及方法、排模系统及方法
CN107273883A (zh) * 2017-05-03 2017-10-20 天方创新(北京)信息技术有限公司 决策树模型训练方法、确定ocr结果中数据属性方法及装置
CN109492549A (zh) * 2018-10-24 2019-03-19 杭州睿琪软件有限公司 一种训练样本集处理、模型训练方法及系统
CN109685870A (zh) * 2018-11-21 2019-04-26 北京慧流科技有限公司 信息标注方法及装置、标注设备及存储介质
CN110837832A (zh) * 2019-11-08 2020-02-25 深圳市深视创新科技有限公司 基于深度学习网络的快速ocr识别方法
CN111860487A (zh) * 2020-07-28 2020-10-30 天津恒达文博科技股份有限公司 基于深度神经网络的碑文标注检测识别系统
CN111860348A (zh) * 2020-07-21 2020-10-30 国网山东省电力公司青岛供电公司 基于深度学习的弱监督电力图纸ocr识别方法
CN112862016A (zh) * 2021-04-01 2021-05-28 北京百度网讯科技有限公司 点云中物体的标注方法、装置、设备和存储介质
WO2021139342A1 (zh) * 2020-07-27 2021-07-15 平安科技(深圳)有限公司 Ocr识别模型的训练方法、装置和计算机设备
CN113159212A (zh) * 2021-04-30 2021-07-23 上海云从企业发展有限公司 Ocr识别模型训练方法、装置以及计算机可读存储介质
CN113255583A (zh) * 2021-06-21 2021-08-13 中国平安人寿保险股份有限公司 数据标注方法、装置、计算机设备和存储介质
CN114973275A (zh) * 2022-06-22 2022-08-30 信华信技术股份有限公司 一种基于深度学习技术的图文乱码识别方法
CN115223166A (zh) * 2022-09-20 2022-10-21 整数智能信息技术(杭州)有限责任公司 图片预标注方法、图片标注方法及装置、电子设备

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205199A (zh) * 2014-06-30 2015-12-30 上海神机软件有限公司 建设工程模板标识码管理系统及方法、排模系统及方法
CN104809266A (zh) * 2015-02-11 2015-07-29 山东科技大学 一种基于样条曲线的工作面煤层赋存情况精确预测方法
CN107273883A (zh) * 2017-05-03 2017-10-20 天方创新(北京)信息技术有限公司 决策树模型训练方法、确定ocr结果中数据属性方法及装置
CN109492549A (zh) * 2018-10-24 2019-03-19 杭州睿琪软件有限公司 一种训练样本集处理、模型训练方法及系统
CN109685870A (zh) * 2018-11-21 2019-04-26 北京慧流科技有限公司 信息标注方法及装置、标注设备及存储介质
CN110837832A (zh) * 2019-11-08 2020-02-25 深圳市深视创新科技有限公司 基于深度学习网络的快速ocr识别方法
CN111860348A (zh) * 2020-07-21 2020-10-30 国网山东省电力公司青岛供电公司 基于深度学习的弱监督电力图纸ocr识别方法
WO2021139342A1 (zh) * 2020-07-27 2021-07-15 平安科技(深圳)有限公司 Ocr识别模型的训练方法、装置和计算机设备
CN111860487A (zh) * 2020-07-28 2020-10-30 天津恒达文博科技股份有限公司 基于深度神经网络的碑文标注检测识别系统
CN112862016A (zh) * 2021-04-01 2021-05-28 北京百度网讯科技有限公司 点云中物体的标注方法、装置、设备和存储介质
CN113159212A (zh) * 2021-04-30 2021-07-23 上海云从企业发展有限公司 Ocr识别模型训练方法、装置以及计算机可读存储介质
CN113255583A (zh) * 2021-06-21 2021-08-13 中国平安人寿保险股份有限公司 数据标注方法、装置、计算机设备和存储介质
CN114973275A (zh) * 2022-06-22 2022-08-30 信华信技术股份有限公司 一种基于深度学习技术的图文乱码识别方法
CN115223166A (zh) * 2022-09-20 2022-10-21 整数智能信息技术(杭州)有限责任公司 图片预标注方法、图片标注方法及装置、电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩丽蓉 等: "基于MAPGIS建立空间及属性数据库的方法", 《青海大学学报(自然科学版)》, vol. 28, no. 3, 31 December 2010 (2010-12-31), pages 24 - 27 *

Also Published As

Publication number Publication date
CN116543392B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CN110659574B (zh) 文档图像勾选框状态识别后输出文本行内容的方法及系统
EP3432198A2 (en) Crowdsourcing and deep learning based segmenting and karyotyping of chromosomes
KR101122854B1 (ko) 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치
US8849032B2 (en) Shape parameterisation for editable document generation
WO2020248497A1 (zh) 图片扫描件处理方法、装置、计算机设备及存储介质
CN110610175A (zh) 一种ocr数据误标注清洗方法
CN113158895B (zh) 票据识别方法、装置、电子设备及存储介质
CN110135407B (zh) 样本标注方法及计算机存储介质
Shen et al. Olala: object-level active learning for efficient document layout annotation
CN114758341A (zh) 一种智能化合同图像识别与合同要素抽取方法及装置
CN115810133A (zh) 基于图像处理和点云处理的焊接控制方法及相关设备
CN114782974A (zh) 表格识别方法、系统、智能终端及计算机可读存储介质
CN116543392B (zh) 一种用于深度学习字符识别的标注方法
CN111814801A (zh) 一种机械图中标注串的提取方法
CN115130437B (zh) 一种文档智能填写方法、装置及存储介质
CN112396057A (zh) 一种字符识别方法、装置及电子设备
CN116541912A (zh) 一种基于cad图像识别生成接线图的方法及装置
CN111274863A (zh) 一种基于文本山峰概率密度的文本预测方法
CN112241749A (zh) 字符识别模型训练方法、装置及设备
CN116311300A (zh) 表格生成方法、装置、电子设备以及存储介质
CN114461835A (zh) 图片处理方法及装置、计算机可读存储介质和电子设备
CN114359931A (zh) 一种快递面单识别方法、装置、计算机设备及存储介质
JP2021047688A (ja) 帳票認識方法およびプログラム
CN112036443A (zh) 一种图像数据中物体轮廓的标注方法和装置
CN110706317A (zh) 印刷手写混合的数学公式数据生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant