CN115131806A - 一种基于深度学习的各类证件ocr图像信息识别方法、系统 - Google Patents
一种基于深度学习的各类证件ocr图像信息识别方法、系统 Download PDFInfo
- Publication number
- CN115131806A CN115131806A CN202210640739.3A CN202210640739A CN115131806A CN 115131806 A CN115131806 A CN 115131806A CN 202210640739 A CN202210640739 A CN 202210640739A CN 115131806 A CN115131806 A CN 115131806A
- Authority
- CN
- China
- Prior art keywords
- user
- display mode
- text
- probability
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000013135 deep learning Methods 0.000 title claims abstract description 23
- 238000012015 optical character recognition Methods 0.000 title description 30
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000002372 labelling Methods 0.000 claims abstract description 3
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/166—Normalisation of pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种基于深度学习的各类证件OCR图像信息识别方法、系统,涉及计算机视觉领域,解决了OCR识别结果准率降低,可读性较差,通过人工做二次加工处理也将耗费大量时间成本的问题,其包括:将原图像信息的长宽做自适应缩放和灰度处理;通过方向识别网络模型将朝向为90度、180度、270度的图像矫正为0度;通过文本框检测网络模型获取证件图像中的矩形文本检测框;通过文本识别网络模型对每个检测框进行文本识别,根据模型输出的置信度对文本行图像做字符标注;对识别的文本做解析以将文本结构化。本申请具有如下效果:能够实现对待检测证件图像中的目标文本的自动化检测与识别,减少甚至避免了在文本信息提取过程中对人工的依赖和需求。
Description
技术领域
本申请涉及计算机视觉领域,尤其是涉及一种基于深度学习的各类证件OCR图像信息识别方法、系统。
背景技术
随着信息科技的进步和社会的发展,各行各业都在逐步走向数字化。尤其是计算机视觉领域的OCR(Optical Character Recognition,光学符号识别)技术,OCR是指利用扫描等光学输入的方式把各种文件、证件、票据等印刷品上的文本解析读取出来,并转换成一种计算机能理解的格式。可应用于证件卡证、文件资料、文案录入等领域。
由于对当前日益增长的提升录入效率、版面理解正确率及识别速度等需求,OCR技术已经被充分的推广并大规模应用。如单行图像的场景下,OCR工具的识别准确率较高,甚至超过9成。
针对上述中的相关技术,发明人认为存在有如下缺陷:在图像朝向歪斜、密集文本图像等复杂场景下,由于多行的文本距离过近,或是图像中冗余文字过多难以结构化等现象,使得OCR识别结果准率降低,可读性较差,通过人工做二次加工处理也将耗费大量时间成本。
发明内容
为了能够实现对待检测证件图像中的目标文本的自动化检测与识别,减少甚至避免了在文本信息提取过程中对人工的依赖和需求,本申请提供一种基于深度学习的各类证件OCR图像信息识别方法、系统。
第一方面,本申请提供一种基于深度学习的各类证件OCR图像信息识别方法,采用如下的技术方案:
一种基于深度学习的各类证件OCR图像信息识别方法,包括:
获取图像信息并作OCR图像信息识别;
若识别失败,则将原图像信息的长宽做自适应缩放和灰度处理;
通过方向识别网络模型将朝向为90度、180度、270度的图像矫正为0度;
通过文本框检测网络模型获取证件图像中的矩形文本检测框,每个检测框覆盖图像中符合预设规则的文本行图像,每个检测框覆盖图像中符合预设规则的文本行图像;
通过文本识别网络模型对每个检测框进行文本识别,根据模型输出的置信度对文本行图像做字符标注;
对识别的文本做解析以将文本结构化以获取正确识别后的内容信息。
若识别成功,则获取正确识别后的内容信息。
可选的,方向识别网络模型为MobileNetV3,输出的维度为4,分别代表预测图像的朝向为0度、90度、180度和270度的概率。
可选的,文本框检测网络模型包括主干网络ResNet50、Neck网络DBFPN、Head网络DBNe;
利用所述主干网络对全局特征进行特征提取,得到全局特征;
利用所述Neck网络对所述全局特征进行特征提取,得到高层特征;
利用所述Head网络对所述高层特征进行特征处理,得到输出的一个或多个文本框预测结果。
可选的,所述文本识别网络模型包括主干网络ResNet34、Neck网络SequenceEncoder、Head网络CTC网络;
利用所述主干网络对全局特征进行特征提取,得到全局特征;
利用所述Neck网络对所述全局特征进行特征提取,得到高层特征;
利用所述Head网络对所述高层特征进行特征处理,得到输出的单字符分割预测结果。
可选的,还包括对识别的文本做解析以将文本结构化以获取正确识别后的内容信息:
分析获取用户历史是否设置过关于内容信息的展示模式;
若用户历史有设置过内容信息的展示模式,则基于用户在相应时段所设置的展示模式以及用户关于不同内容的展示模式调节情况,预测分析用户本次关于内容信息展示模式的倾向;
展示用户本次关于内容信息展示模式的倾向,若用户未在预设时间内调整,则以所展示的模式展示内容信息;
若用户历史未设置过内容信息的展示模式,则基于相应内容信息的整体模式选择概率分布情况,按照用户对重要信息的浏览习惯展示不同模式以及概率;
获取用户所选择的模式,并以相应模式展示内容信息。
可选的,预测分析用户本次关于内容信息展示模式的倾向包括:
获取用户关于不同时段所设置的展示模式概率的对应关系,以及用户关于不同内容所调节展示模式的概率;
基于当前时段以及用户关于不同时段所设置的展示模式的对应关系,预测分析用户在当下时段所设置的展示模式概率;
基于所识别的内容以及用户关于不同内容所调节展示模式的概率,预测分析用户关于本次所识别内容所设置的展示模式的概率;
基于所预测分析的用户在当下时段所设置的展示模式概率以及所预测分析的用户关于本次所识别内容所设置的展示模式的概率,分析预测出每个展示模式的概率,并以概率最高的展示模式作为用户本次关于内容信息展示模式的倾向。
可选的,分析预测出每个展示模式的概率包括:
获取所预测分析的用户在当下时段所设置的一个展示模式的概率,以及用户关于本次所识别内容所设置相应展示模式的概率;
将所预测分析的用户在当下时段所设置的一个展示模式的概率,与用户关于本次所识别内容所设置相应展示模式的概率相加之和的一半作为相应展示模式的概率。
可选的,基于相应内容信息的整体模式选择概率分布情况,用户对重要信息的浏览习惯展示不同模式以及概率包括:
基于内容以及内容所对应的模式选择的概率分布情况的对应关系,分析内容重要程度的排序情况;
获取用户对重要信息的浏览习惯信息,并基于用户对重要信息的的浏览习惯按照重要程度对内容进行排序。
可选的,还包括位于分析获取用户历史是否设置过关于内容信息的展示模式之前的步骤:
获取用户是否登录OCR图像信息识别系统;
若用户登录OCR图像信息识别系统,则基于用户登录账号确定用户信息;
反之,则基于不同用户历史浏览内容信息的时段分布概率情况,以及不同用户在不同时段疏忽登录OCR图像信息识别系统的概率,分析获取在当下时段疏忽登录OCR图像信息识别系统的概率以及历史浏览内容信息概率之和最高所对应的用户信息作为所确定的用户信息。
第二方面,本申请提供一种基于深度学习的各类证件OCR图像信息识别系统,采用如下的技术方案:
一种基于深度学习的各类证件OCR图像信息识别系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,该程序能够被处理器加载执行时实现如第一方面所述的一种基于深度学习的各类证件OCR图像信息识别方法。
综上所述,本申请的有益技术效果为:
1.对图像的预处理保证了数据的稳定性,避免模型接受过大或过小尺寸的图片而导致结果异常的问题。
2.文本图像方向识别网络模型的应用能有效矫正图像的朝向问题,避免在后续任务中出现无法检测文本框甚至无法进行文本识别的问题;其轻量级的MobileNetV3主干网络能保证极快的运行效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本申请实施例基于深度学习的各类证件OCR图像信息识别方法的整体步骤示意图。
图2是本申请实施例对识别的文本做解析以将文本结构化以获取正确识别后的内容信息的步骤示意图。
图3是本申请实施例预测分析用户本次关于内容信息展示模式的倾向的步骤示意图。
图4是本申请实施例分析预测出每个展示模式的概率的步骤示意图。
图5是本申请实施例基于相应内容信息的整体模式选择概率分布情况,用户对重要信息的浏览习惯展示不同模式以及概率的步骤示意图。
图6是本申请实施例位于分析获取用户历史是否设置过关于内容信息的展示模式之前的步骤示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合附图对本申请作进一步详细说明。
参照图1,为本申请公开的一种基于深度学习的各类证件OCR图像信息识别方法,包括:
步骤S100,获取图像信息并作OCR图像信息识别。
步骤S200,若识别失败,则将原图像信息的长宽做自适应缩放和灰度处理。
其中,步骤S200包括如下步骤:首先,检测目标图像的长宽是否符合预设值,如果不符合则进行自适应缩放,其次,对目标图像进行灰度处理
步骤S300,通过方向识别网络模型将朝向为90度、180度、270度的图像矫正为0度。
其中,方向识别网络模型为MobileNetV3,输出的维度为4,分别代表预测图像的朝向为0度、90度、180度和270度的概率。
步骤S400,通过文本框检测网络模型获取证件图像中的矩形文本检测框,每个检测框覆盖图像中符合预设规则的文本行图像,每个检测框覆盖图像中符合预设规则的文本行图像。
其中,文本框检测网络模型包括主干网络ResNet50、Neck网络DBFPN、Head网络DBNe,利用所述主干网络对全局特征进行特征提取,得到全局特征;利用所述Neck网络对所述全局特征进行特征提取,得到高层特征;利用所述Head网络对所述高层特征进行特征处理,得到输出的一个或多个文本框预测结果。
步骤S500,通过文本识别网络模型对每个检测框进行文本识别,根据模型输出的置信度对文本行图像做字符标注。
其中,所述文本识别网络模型包括主干网络ResNet34、Neck网络SequenceEncoder、Head网络CTC网络;利用所述主干网络对全局特征进行特征提取,得到全局特征;利用所述Neck网络对所述全局特征进行特征提取,得到高层特征;利用所述Head网络对所述高层特征进行特征处理,得到输出的单字符分割预测结果。
步骤S600,对识别的文本做解析以将文本结构化以获取正确识别后的内容信息。
举例来说,初始图像中的待检测对象例如可以是身份证国徽面。身份证国徽面的拍摄场景简单,形式统一。然而初始图像中可能包括身份证国徽面的整体或者仅包括局部,并且很可能存在倾斜、破损、涂抹、光照不均匀等情况,再者身份证国徽面存在冗余文字信息,通常只需要签发机关和有效期限这二者的文本内容。由此,通过先在初始图像中检测身份证国徽面的外边界框,或内部的包围签发机关和有效期限这二者信息的局部的边框,从而能够得到更容易进行文本检测与识别的待检测图像,进而提升后续对目标文本进行检测和识别的准确率。可以理解的,本公开实施例中的待检测图像不限于为身份证国徽面,可以为任何具备排版结构的证件对象,例如,行驶证、驾驶证等等。
相应地,在这些实施例中,符合预设规则的目标文本例如可以是只包含数字的字符串,也可以是包含数字和少量特定英文字符的字符串,还可以是包含数字、英文字符和部分特殊符号(例如,短横线、斜杠、下划线等)的字符串,在此不做限定。这些预设规则由证件识别程序以配置文件的形式统一管理。通过使用上述方法,能够实现对最核心的关键信息字段的快速识别。
步骤SA00,若识别成功,则获取正确识别后的内容信息。
参照图2,其中,一种基于深度学习的各类证件OCR图像信息识别方法在步骤S600之后还包括:
步骤S700,分析获取用户历史是否设置过关于内容信息的展示模式。
其中,步骤S700所提及的内容信息的展示模式包括自动上下翻页的展示模式、自动左右翻页的展示模式、手动上下翻页的展示模式、手动左右翻页的展示模式。
步骤SB00,若用户历史有设置过内容信息的展示模式,则基于用户在相应时段所设置的展示模式以及用户关于不同内容的展示模式调节情况,预测分析用户本次关于内容信息展示模式的倾向。
步骤SC00,展示用户本次关于内容信息展示模式的倾向,若用户未在预设时间内调整,则以所展示的模式展示内容信息。
其中,步骤SC00所提及的预设时间可以是5秒、10秒,也可以是其他时间。
步骤SD00,若用户历史未设置过内容信息的展示模式,则基于相应内容信息的整体模式选择概率分布情况,按照用户对重要信息的浏览习惯展示不同模式以及概率。
其中,步骤SD00所提及的重要信息的浏览习惯包括由上至下重要性逐一递减的方式、由左至右重要性逐一递减的方式。
步骤SE00,获取用户所选择的模式,并以相应模式展示内容信息。
参照图3,其中,步骤SB00所提及的预测分析用户本次关于内容信息展示模式的倾向包括:
步骤SB10,获取用户关于不同时段所设置的展示模式概率的对应关系,以及用户关于不同内容所调节展示模式的概率。
其中,用户关于不同时段所设置的展示模式概率的对应关系可以从存储有相应关系的数据库中调取,同理,用户关于不同内容所调节展示模式的概率可以从存储有相应关系的数据库中调取。
步骤SB20,基于当前时段以及用户关于不同时段所设置的展示模式的对应关系,预测分析用户在当下时段所设置的展示模式概率。
类似的,用户关于不同时段所设置的展示模式的对应关系可以从存储有相应关系的数据库中调取,然后通过当前时段对相应数据库的查询,可以获取用户在当下时段所设置的展示模式概率。
步骤SB30,基于所识别的内容以及用户关于不同内容所调节展示模式的概率,预测分析用户关于本次所识别内容所设置的展示模式的概率。
步骤SB40,基于所预测分析的用户在当下时段所设置的展示模式概率以及所预测分析的用户关于本次所识别内容所设置的展示模式的概率,分析预测出每个展示模式的概率,并以概率最高的展示模式作为用户本次关于内容信息展示模式的倾向。
举例来说,假定展示模式1为用户在当下时段所设置的概率为30%,模式1为用户关于本次所识别内容所设置的概率为40%,此时所计算的模式1为70%,假定模式2为60%,那么模式1为用户本次关于内容信息展示模式的倾向。
参照图4,其中,步骤SB40所提及的分析预测出每个展示模式的概率包括:
步骤SB4a,获取所预测分析的用户在当下时段所设置的一个展示模式的概率,以及用户关于本次所识别内容所设置相应展示模式的概率。
步骤SB4b,将所预测分析的用户在当下时段所设置的一个展示模式的概率,与用户关于本次所识别内容所设置相应展示模式的概率相加之和的一半作为相应展示模式的概率。
参照图5,其中,步骤SD00所提及的基于相应内容信息的整体模式选择概率分布情况,用户对重要信息的浏览习惯展示不同模式以及概率包括:
步骤SD10,基于内容以及内容所对应的模式选择的概率分布情况的对应关系,分析内容重要程度的排序情况。
步骤SD20,获取用户对重要信息的浏览习惯信息,并基于用户对重要信息的的浏览习惯按照重要程度对内容进行排序。
参照图6,另外,在步骤S700之前还包括如下步骤:
步骤Sa00,获取用户是否登录OCR图像信息识别系统;
步骤Sb00,若用户登录OCR图像信息识别系统,则基于用户登录账号确定用户信息;
步骤Sc00,反之,则基于不同用户历史浏览内容信息的时段分布概率情况,以及不同用户在不同时段疏忽登录OCR图像信息识别系统的概率,分析获取在当下时段疏忽登录OCR图像信息识别系统的概率以及历史浏览内容信息概率之和最高所对应的用户信息作为所确定的用户信息。
基于同一发明构思,本发明实施例提供一种基于深度学习的各类证件OCR图像信息识别系统,包括存储器、处理器,存储器上存储有可在所述处理器上运行实现如图1至图6任一种方法的程序。
本具体实施方式的实施例均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
Claims (10)
1.一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于,包括:
获取图像信息并作OCR图像信息识别;
若识别失败,则将原图像信息的长宽做自适应缩放和灰度处理;
通过方向识别网络模型将朝向为90度、180度、270度的图像矫正为0度;
通过文本框检测网络模型获取证件图像中的矩形文本检测框,每个检测框覆盖图像中符合预设规则的文本行图像,每个检测框覆盖图像中符合预设规则的文本行图像;
通过文本识别网络模型对每个检测框进行文本识别,根据模型输出的置信度对文本行图像做字符标注;
对识别的文本做解析以将文本结构化以获取正确识别后的内容信息。
若识别成功,则获取正确识别后的内容信息。
2.根据权利要求1所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于:方向识别网络模型为MobileNetV3,输出的维度为4,分别代表预测图像的朝向为0度、90度、180度和270度的概率。
3.根据权利要求1所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于,文本框检测网络模型包括主干网络ResNet50、Neck网络DBFPN、Head网络DBNe;
利用所述主干网络对全局特征进行特征提取,得到全局特征;
利用所述Neck网络对所述全局特征进行特征提取,得到高层特征;
利用所述Head网络对所述高层特征进行特征处理,得到输出的一个或多个文本框预测结果。
4.根据权利要求1所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于,所述文本识别网络模型包括主干网络ResNet34、Neck网络SequenceEncoder、Head网络CTC网络;
利用所述主干网络对全局特征进行特征提取,得到全局特征;
利用所述Neck网络对所述全局特征进行特征提取,得到高层特征;
利用所述Head网络对所述高层特征进行特征处理,得到输出的单字符分割预测结果。
5.根据权利要求1所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于,还包括对识别的文本做解析以将文本结构化以获取正确识别后的内容信息:
分析获取用户历史是否设置过关于内容信息的展示模式;
若用户历史有设置过内容信息的展示模式,则基于用户在相应时段所设置的展示模式以及用户关于不同内容的展示模式调节情况,预测分析用户本次关于内容信息展示模式的倾向;
展示用户本次关于内容信息展示模式的倾向,若用户未在预设时间内调整,则以所展示的模式展示内容信息;
若用户历史未设置过内容信息的展示模式,则基于相应内容信息的整体模式选择概率分布情况,按照用户对重要信息的浏览习惯展示不同模式以及概率;
获取用户所选择的模式,并以相应模式展示内容信息。
6.根据权利要求5所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于,预测分析用户本次关于内容信息展示模式的倾向包括:
获取用户关于不同时段所设置的展示模式概率的对应关系,以及用户关于不同内容所调节展示模式的概率;
基于当前时段以及用户关于不同时段所设置的展示模式的对应关系,预测分析用户在当下时段所设置的展示模式概率;
基于所识别的内容以及用户关于不同内容所调节展示模式的概率,预测分析用户关于本次所识别内容所设置的展示模式的概率;
基于所预测分析的用户在当下时段所设置的展示模式概率以及所预测分析的用户关于本次所识别内容所设置的展示模式的概率,分析预测出每个展示模式的概率,并以概率最高的展示模式作为用户本次关于内容信息展示模式的倾向。
7.根据权利要求6所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于,分析预测出每个展示模式的概率包括:
获取所预测分析的用户在当下时段所设置的一个展示模式的概率,以及用户关于本次所识别内容所设置相应展示模式的概率;
将所预测分析的用户在当下时段所设置的一个展示模式的概率,与用户关于本次所识别内容所设置相应展示模式的概率相加之和的一半作为相应展示模式的概率。
8.根据权利要求7所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于,基于相应内容信息的整体模式选择概率分布情况,用户对重要信息的浏览习惯展示不同模式以及概率包括:
基于内容以及内容所对应的模式选择的概率分布情况的对应关系,分析内容重要程度的排序情况;
获取用户对重要信息的浏览习惯信息,并基于用户对重要信息的的浏览习惯按照重要程度对内容进行排序。
9.根据权利要求5所述的一种基于深度学习的各类证件OCR图像信息识别方法,其特征在于:还包括位于分析获取用户历史是否设置过关于内容信息的展示模式之前的步骤:
获取用户是否登录OCR图像信息识别系统;
若用户登录OCR图像信息识别系统,则基于用户登录账号确定用户信息;
反之,则基于不同用户历史浏览内容信息的时段分布概率情况,以及不同用户在不同时段疏忽登录OCR图像信息识别系统的概率,分析获取在当下时段疏忽登录OCR图像信息识别系统的概率以及历史浏览内容信息概率之和最高所对应的用户信息作为所确定的用户信息。
10.一种于深度学习的各类证件OCR图像信息识别系统,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,该程序能够被处理器加载执行时实现如权利要求1至9中任一项所述的一种于深度学习的各类证件OCR图像信息识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210640739.3A CN115131806B (zh) | 2022-06-07 | 2022-06-07 | 一种基于深度学习的各类证件ocr图像信息识别方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210640739.3A CN115131806B (zh) | 2022-06-07 | 2022-06-07 | 一种基于深度学习的各类证件ocr图像信息识别方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115131806A true CN115131806A (zh) | 2022-09-30 |
CN115131806B CN115131806B (zh) | 2023-10-31 |
Family
ID=83378912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210640739.3A Active CN115131806B (zh) | 2022-06-07 | 2022-06-07 | 一种基于深度学习的各类证件ocr图像信息识别方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115131806B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105487747A (zh) * | 2015-11-20 | 2016-04-13 | 北京金山安全软件有限公司 | 一种信息展示方法、装置及电子设备 |
CN106504011A (zh) * | 2015-09-06 | 2017-03-15 | 阿里巴巴集团控股有限公司 | 一种业务对象的展示方法和装置 |
CN108829808A (zh) * | 2018-06-07 | 2018-11-16 | 麒麟合盛网络技术股份有限公司 | 一种页面个性化排序方法、装置及电子设备 |
CN109242778A (zh) * | 2018-09-18 | 2019-01-18 | 北京旷视科技有限公司 | 一种图片标注控制方法、装置及其存储介质 |
CN109660657A (zh) * | 2018-11-26 | 2019-04-19 | 维沃移动通信有限公司 | 一种应用程序控制方法及装置 |
CN111353792A (zh) * | 2020-05-25 | 2020-06-30 | 广东电网有限责任公司惠州供电局 | 一种可视化展现与数据分析的客户画像系统 |
CN112508011A (zh) * | 2020-12-02 | 2021-03-16 | 上海逸舟信息科技有限公司 | 一种基于神经网络的ocr识别方法及设备 |
CN112926469A (zh) * | 2021-03-04 | 2021-06-08 | 浪潮云信息技术股份公司 | 基于深度学习ocr与版面结构的证件识别方法 |
CN113449829A (zh) * | 2021-06-25 | 2021-09-28 | 未鲲(上海)科技服务有限公司 | 基于光学字符识别技术的数据传输方法及相关装置 |
CN113868526A (zh) * | 2021-09-27 | 2021-12-31 | 北京沃东天骏信息技术有限公司 | 信息推送方法和装置、非瞬时性计算机可读存储介质 |
CN113885604A (zh) * | 2021-09-26 | 2022-01-04 | 中交一公局厦门检测技术有限公司 | 一种大体积混凝土智能温度监控方法、装置 |
CN114218477A (zh) * | 2021-11-24 | 2022-03-22 | 中国建设银行股份有限公司 | 展示界面的控制方法、装置及电子设备 |
-
2022
- 2022-06-07 CN CN202210640739.3A patent/CN115131806B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106504011A (zh) * | 2015-09-06 | 2017-03-15 | 阿里巴巴集团控股有限公司 | 一种业务对象的展示方法和装置 |
CN105487747A (zh) * | 2015-11-20 | 2016-04-13 | 北京金山安全软件有限公司 | 一种信息展示方法、装置及电子设备 |
CN108829808A (zh) * | 2018-06-07 | 2018-11-16 | 麒麟合盛网络技术股份有限公司 | 一种页面个性化排序方法、装置及电子设备 |
CN109242778A (zh) * | 2018-09-18 | 2019-01-18 | 北京旷视科技有限公司 | 一种图片标注控制方法、装置及其存储介质 |
CN109660657A (zh) * | 2018-11-26 | 2019-04-19 | 维沃移动通信有限公司 | 一种应用程序控制方法及装置 |
CN111353792A (zh) * | 2020-05-25 | 2020-06-30 | 广东电网有限责任公司惠州供电局 | 一种可视化展现与数据分析的客户画像系统 |
CN112508011A (zh) * | 2020-12-02 | 2021-03-16 | 上海逸舟信息科技有限公司 | 一种基于神经网络的ocr识别方法及设备 |
CN112926469A (zh) * | 2021-03-04 | 2021-06-08 | 浪潮云信息技术股份公司 | 基于深度学习ocr与版面结构的证件识别方法 |
CN113449829A (zh) * | 2021-06-25 | 2021-09-28 | 未鲲(上海)科技服务有限公司 | 基于光学字符识别技术的数据传输方法及相关装置 |
CN113885604A (zh) * | 2021-09-26 | 2022-01-04 | 中交一公局厦门检测技术有限公司 | 一种大体积混凝土智能温度监控方法、装置 |
CN113868526A (zh) * | 2021-09-27 | 2021-12-31 | 北京沃东天骏信息技术有限公司 | 信息推送方法和装置、非瞬时性计算机可读存储介质 |
CN114218477A (zh) * | 2021-11-24 | 2022-03-22 | 中国建设银行股份有限公司 | 展示界面的控制方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115131806B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yanikoglu et al. | Pink Panther: a complete environment for ground-truthing and benchmarking document page segmentation | |
US6535619B1 (en) | Address recognition apparatus and method | |
US6940617B2 (en) | Printing control interface system and method with handwriting discrimination capability | |
US6047251A (en) | Automatic language identification system for multilingual optical character recognition | |
EP0621553A2 (en) | Methods and apparatus for inferring orientation of lines of text | |
JP3294995B2 (ja) | 帳票読取装置 | |
JP2002312385A (ja) | 文書自動分割装置 | |
US11823497B2 (en) | Image processing system and an image processing method | |
JP4280355B2 (ja) | 文字認識装置 | |
EP3759647A1 (en) | An image processing method and an image processing system | |
US7149352B2 (en) | Image processing device, program product and system | |
JP2008282094A (ja) | 文字認識処理装置 | |
CN115131806B (zh) | 一种基于深度学习的各类证件ocr图像信息识别方法、系统 | |
KR100957508B1 (ko) | 광학 문자 인식 시스템 및 방법 | |
US11551461B2 (en) | Text classification | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP4281236B2 (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
CN112101356A (zh) | 一种图片中特定文本的定位方法、装置及存储介质 | |
JPH11328306A (ja) | 文書画像の論理要素抽出方法、装置および記録媒体 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
CN117391045B (zh) | 可复制蒙文的可携带文件格式文件输出方法 | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
JP4651407B2 (ja) | 画像処理装置およびコンピュータプログラムおよび記憶媒体 | |
JP4328511B2 (ja) | パターン認識装置、パターン認識方法、プログラムおよび記憶媒体 | |
JP2592756B2 (ja) | 文字切り出し装置およびこれを用いた文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |