CN111814539B - 基于红外光和紫外光的文字识别方法、装置和计算机设备 - Google Patents

基于红外光和紫外光的文字识别方法、装置和计算机设备 Download PDF

Info

Publication number
CN111814539B
CN111814539B CN202010469606.5A CN202010469606A CN111814539B CN 111814539 B CN111814539 B CN 111814539B CN 202010469606 A CN202010469606 A CN 202010469606A CN 111814539 B CN111814539 B CN 111814539B
Authority
CN
China
Prior art keywords
text
image
identified
type
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010469606.5A
Other languages
English (en)
Other versions
CN111814539A (zh
Inventor
李越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010469606.5A priority Critical patent/CN111814539B/zh
Publication of CN111814539A publication Critical patent/CN111814539A/zh
Priority to PCT/CN2020/124729 priority patent/WO2021139341A1/zh
Application granted granted Critical
Publication of CN111814539B publication Critical patent/CN111814539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/33Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本申请揭示了一种基于红外光和紫外光的文字识别方法、装置、计算机设备和存储介质,所述方法包括:生成红外光,以照射预设的待识别纸质文件,并采集所述待识别纸质文件的图像,从而得到第一图像;生成紫外光,以照射所述待识别纸质文件,并采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;生成可见光,以照射所述待识别纸质文件,并采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;叠加得到中间图像;识别所述中间图像,从而得到识别文字文本;将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本。从而提高了整体的识别效率,提高了识别可靠性。

Description

基于红外光和紫外光的文字识别方法、装置和计算机设备
技术领域
本申请涉及到计算机领域,特别是涉及到一种基于红外光和紫外光的文字识别方法、装置、计算机设备和存储介质。
背景技术
传统的图片识别技术,只能对图片进行例如文字信息提取等方面的处理,而提取得到的文字信息等对计算机自身而言是没有区别的(因此计算机难以直接理解并应用),因此一般需要人工微调识别得到的文字信息(例如将文字信息人工划分,以分为不同类别的子信息,再进行分类存储等),才能完成整体的有意义的文字识别过程。例如,对于一张包括一段连续文字的文字图片,传统的图片识别技术,只能识别出一个文字序列,需要由人工进行再处理。因此,传统的图片识别方案,需要人工的参与,效率低、识别结果可靠性低。
发明内容
本申请的主要目的为提供一种基于红外光和紫外光的文字识别方法、装置、计算机设备和存储介质,旨在提高整体的识别效率,提高了识别可靠性。
为了实现上述发明目的,本申请提出一种基于红外光和紫外光的文字识别方法,包括以下步骤:
采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;其中,所述待识别纸质文件上预先绘制有由第一材料划分出的第一封闭区域,所述第一材料在红外光条件下将被激发出可见光;
采用预设的紫外光发生设备生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;其中,所述待识别纸质文件上预先绘制有由第二材料划分出的第二封闭区域,所述第二材料在紫外光条件下将被激发出可见光;
采用预设的可见光发生设备生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;
叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;
采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;
将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外。
进一步地,所述采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像的步骤,包括:
采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到具有由绿光线条限定的第一子区域和由蓝光线条限定的第二子区域的第一图像;其中,所述待识别纸质文件上预先绘制有由红外转绿光材料划分出的第一子区域,和由红外转蓝光材料划分出的第二子区域,所述红外转绿光材料和所述红外转蓝光材料在红外光条件下将被激发出可见光;
所述将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外的步骤之后,包括:
将所述第一类文字文本划分为第一子文本和第二子文本,其中所述第一子文本位于所述由绿光线条限定的第一子区域中,所述第二子文本位于所述由蓝光线条限定的第二子区域中。
进一步地,所述叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像的步骤之前,包括:
将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果,其中所述纸质文件类型识别模型基于卷积神经网络并利用样本数据训练而成,所述样本数据由预先收集的训练用纸质文件和与所述训练用纸质文件的类型构成;
判断所述类型识别结果是否为指定类型;
若所述类型识别结果为指定类型,则根据预设的模糊度计算方法,计算第三图像的模糊度值;
判断所述模糊度值是否小于预设的模糊度阈值;
若所述模糊度值小于预设的模糊度阈值,则生成图像叠加指令,所述图像叠加指令用于指示叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像。
进一步地,所述将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果的步骤,包括:
将所述第三图像进行像素矩阵化处理,从而得到所述第三图像所有像素点对应的像素矩阵;
将所述像素矩阵输入预设的卷积神经网络模型中的卷积层中进行处理,从而得到所述卷积层输出的抽象特征矩阵;其中所述卷积神经网络模型由卷积层、池化层、全连接层和分类层;
采用所述池化层对所述抽象特征矩阵进行收敛,从而得到收敛矩阵;
将所述收敛矩阵输入所述全连接层中进行处理,从而得到所述全连接层输出的特征值;
将所述特征值输入所述分类层,从而得到所述分类层输出的类型识别结果。
进一步地,所述采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本的步骤,包括:
判断所述中间图像是否存在手写体文字;
若所述中间图像存在手写体文字,则将所述中间图像输入基于几何特征抽取法的文字识别模型中进行计算,从而得到所述文字识别模型输出的识别文字文本。
进一步地,所述将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外的步骤之后,包括:
获取与所述待识别纸质文件对应的用户端;
向所述用户端发送信息核实要求,所述信息核实要求携带有关联展示数据,所述关联展示数据包括所述第一类文字文本、第二类文字文本、第三类文字文本和所述中间图像,并且所述中间图像中的第一封闭区域标注有与所述第一类文字文本关联的第一标记,所述中间图像中的第二封闭区域标注有与所述第二类文字文本关联的第二标记;
接收所述用户端的返回信息,并判断所述返回信息是否为核实通过;
若所述返回信息为核实通过,则将所述第一类文字文本、第二类文字文本和第三类文字文本分别填入预设的电子文件中的对应位置中。
本申请提供一种基于红外光和紫外光的文字识别装置,包括:
第一图像获取单元,用于采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;其中,所述待识别纸质文件上预先绘制有由第一材料划分出的第一封闭区域,所述第一材料在红外光条件下将被激发出可见光;
第二图像获取单元,用于采用预设的紫外光发生设备生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;其中,所述待识别纸质文件上预先绘制有由第二材料划分出的第二封闭区域,所述第二材料在紫外光条件下将被激发出可见光;
第三图像获取单元,用于采用预设的可见光发生设备生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;
中间图像获取单元,用于叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;
识别文字文本获取单元,用于采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;
识别文字文本划分单元,用于将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外。
进一步地,所述第一图像获取单元,包括:
第一图像获取子单元,用于采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到具有由绿光线条限定的第一子区域和由蓝光线条限定的第二子区域的第一图像;其中,所述待识别纸质文件上预先绘制有由红外转绿光材料划分出的第一子区域,和由红外转蓝光材料划分出的第二子区域,所述红外转绿光材料和所述红外转蓝光材料在红外光条件下将被激发出可见光;
所述装置,包括:
第一类文字文本划分单元,用于将所述第一类文字文本划分为第一子文本和第二子文本,其中所述第一子文本位于所述由绿光线条限定的第一子区域中,所述第二子文本位于所述由蓝光线条限定的第二子区域中。
本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的基于红外光和紫外光的文字识别方法、装置、计算机设备和存储介质,生成红外光,以照射预设的待识别纸质文件,并采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本。从而提高了整体的识别效率,提高了识别可靠性。
附图说明
图1为本申请一实施例的基于红外光和紫外光的文字识别方法的流程示意图;
图2为本申请一实施例的基于红外光和紫外光的文字识别装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种基于红外光和紫外光的文字识别方法,包括以下步骤:
S1、采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;其中,所述待识别纸质文件上预先绘制有由第一材料划分出的第一封闭区域,所述第一材料在红外光条件下将被激发出可见光;
S2、采用预设的紫外光发生设备生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;其中,所述待识别纸质文件上预先绘制有由第二材料划分出的第二封闭区域,所述第二材料在紫外光条件下将被激发出可见光;
S3、采用预设的可见光发生设备生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;
S4、叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;
S5、采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;
S6、将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外。
本申请采用特别的图片作为信息载体,从而计算机进行图片识别过程中可直接理解识别信息,无需人工微调,从而提高了整体的识别效率,提高了识别可靠性。本申请的图片文字识别方法,可适用于任意场景,尤其适用于批量处理待识别纸质文件。
本申请的执行主体可为任意可行主体,例如为专门用于批量识别图片的终端,该终端上预设有红外发生设备、紫外发生设备、可见光发生设备和摄像头,从而在整个识别过程中完成全自动识别。待识别纸质文件例如为新车发票(指新购车辆对应的发票),而新车一般还未购买保险,因此通过对新车发票进行识别,以得到准确的识别信息(例如购买人信息,价税信息等记载于发票上的信息),可用于例如新车保险报价出单等用途,此过程中无需人工操作,全程自动化。并且由于本申请的由第一材料划分出的第一封闭区域、由第二材料划分出的第二封闭区域在可见光下与其他区域无异,因此不会影响可见光下条件下的待识别纸质文件的使用。
如上述步骤S1所述,采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;其中,所述待识别纸质文件上预先绘制有由第一材料划分出的第一封闭区域,所述第一材料在红外光条件下将被激发出可见光。其中所述第一材料能够将红外光转换为可见光,其例如为吸收长波而辐射出短波的材料,该长波为红外光,该短波为可见光。所述第一材料例如为氟氧基类化合物,由于其具有较低的声子能量,可以抑制无辐射跃迁的几率,从而提高上转换发光效率,再进行掺杂Tm3+,Er3+,Ho3+等离子,以实现将红外光转为可见光。因此,所述第一材料在可见光下不能被摄像头观测到(即与非第一材料没有明显区别),而在红外光条件下能够被摄像头观测到(非第一材料在红外光条件下无法激发可见光,因此在摄像头中为黑色)。因此,此时摄像头采集的第一图像是由第一材料形成的封闭图形(从而划分出第一封闭区域)。其中,所述第一材料可通过任意可行方式绘制在纸质文件上,例如通过颜料笔的方式(颜色料所述第一材料)在所述纸质文件上绘出闭合形状。
如上述步骤S2所述,采用预设的紫外光发生设备生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;其中,所述待识别纸质文件上预先绘制有由第二材料划分出的第二封闭区域,所述第二材料在紫外光条件下将被激发出可见光。所述第二材料能够将紫外光转换为可见光,其例如为吸收短波而辐射出长波的材料,该长波为可见光,该短波为紫外光。其材料例如为钨酸钆钠基化合物,再进行掺杂Eu3+等离子实现紫外光转换为可见光。因此在紫外光下第二材料可为摄像头观测到。
如上述步骤S3所述,采用预设的可见光发生设备生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像。其中所述第三图像即是所述待识别纸质文件在可见光下可被观测的图像。若仅利用第三图像进行图像识别,即是传统的图像识别方法,其仅能识别出文字序列,仍需人工干预以对所述文字序列进行再分类之类的微调。
如上述步骤S4所述,叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像。其中第一图像即为由第一材料构成的闭合图形的图像,第二图像即为由第二材料构成的闭合图形的图像,第三图像即为所述待识别纸质文件的普通图像,从而进行叠加后,得到的中间图像即为在第三图像上标识出第一封闭区域和第二封闭区域,从而为文字文本的自动划分提供了可能。
如上述步骤S5所述,采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本。其中所述图片文字识别技术可采用任意可行的技术,例如采用模板匹配法或者采用几何特征抽取法的图片文字识别技术,以将中间图像中的文字识别出来。
如上述步骤S6所述,将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外。由于第一封闭区域和第二封闭区域在所述中间图像中可见,因此可作为文字文本划分的依据。在此仍以发票为例,例如,第一封闭区域中仅有发票中的购买人信息,第二封闭区域中仅有价税信息,那么第一封闭区域、第二封闭区域对应的第一类文字文本、第二类文字文本即被直接划分出来,并且由于这种划分是根据第一材料和第二材料限定的封密区域进行划分的,因此准确性高(因为封密区域的形状可变,因此可进行准确的划分)。
在一个实施方式中,所述采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像的步骤S1,包括:
S101、采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到具有由绿光线条限定的第一子区域和由蓝光线条限定的第二子区域的第一图像;其中,所述待识别纸质文件上预先绘制有由红外转绿光材料划分出的第一子区域,和由红外转蓝光材料划分出的第二子区域,所述红外转绿光材料和所述红外转蓝光材料在红外光条件下将被激发出可见光;
所述将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外的步骤S6之后,包括:
S611、将所述第一类文字文本划分为第一子文本和第二子文本,其中所述第一子文本位于所述由绿光线条限定的第一子区域中,所述第二子文本位于所述由蓝光线条限定的第二子区域中。
如上所述,实现了将所述第一类文字文本划分为第一子文本和第二子文本,以实现进一步细分文本。可见光的光谱包括多种颜色的光,本申请通过控制第一材料的成分,以使第一材料限定的第一封闭区域在红外光下呈现不同颜色的可见光,即蓝光区域和绿光区域,从而使文本的进一步细分成为了可能。其中,所述红外转绿光材料例如为氟氧基类化合物,对其进行高掺杂Er3+等离子,从而激发的光子处于绿色光谱,因此能够将红外光转换为绿光。所述红外转蓝光材料例如为氟氧基类化合物,对其进行高掺杂Tm3+等离子,从而激发的光子处于蓝色光谱,因此能够将红外光转换为蓝光。从而所述中间图像中将显现由绿光线条和蓝光线条限定的第一子区域和第二子区域,再将第一子区域对应的文字文本划分为第一子文本,第二子区域对应的文字文本划分为第二子文本,即可实现了进一步地文本细分。
在一个实施方式中,所述叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像的步骤S4之前,包括:
S31、将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果,其中所述纸质文件类型识别模型基于卷积神经网络并利用样本数据训练而成,所述样本数据由预先收集的训练用纸质文件和与所述训练用纸质文件的类型构成;
S32、判断所述类型识别结果是否为指定类型;
S33、若所述类型识别结果为指定类型,则根据预设的模糊度计算方法,计算第三图像的模糊度值;
S34、判断所述模糊度值是否小于预设的模糊度阈值;
S35、若所述模糊度值小于预设的模糊度阈值,则生成图像叠加指令,所述图像叠加指令用于指示叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像。
如上所述,实现了指定类型的纸质文件的批量识别处理。其中所述模糊度计算可采用任意可行方式进行计算,例如采用开源的openCV开源库(一种计算机视觉库)中的拉普拉斯方差算法对所述中间图像进行处理,从而得到信号频谱,再获取所述信号频谱中的高频区域内的信号与总信号的占比,并将该占比的倒数记为所述模糊度值。本申请通过纸质文件类型识别模型得到类型识别结果,以在所述类型识别结果为指定类型的前提下再进行模糊度判断,而在所述类型识别结果不为指定类型,则拒绝识别,以避免异种文件对批量处理的干扰。再进行模糊度计算,并在所述模糊度值小于预设的模糊度阈值生成图像叠加指令,以保证识别得到的文字文本足够准确。
在一个实施方式中,所述将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果的步骤S31,包括:
S311、将所述第三图像进行像素矩阵化处理,从而得到所述第三图像所有像素点对应的像素矩阵;
S312、将所述像素矩阵输入预设的卷积神经网络模型中的卷积层中进行处理,从而得到所述卷积层输出的抽象特征矩阵;其中所述卷积神经网络模型由卷积层、池化层、全连接层和分类层;
S313、采用所述池化层对所述抽象特征矩阵进行收敛,从而得到收敛矩阵;
S314、将所述收敛矩阵输入所述全连接层中进行处理,从而得到所述全连接层输出的特征值;
S315、将所述特征值输入所述分类层,从而得到所述分类层输出的类型识别结果。
如上所述,实现了将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果。本申请采用的所述卷积神经网络模型由卷积层、池化层、全连接层和分类层,以进行类型识别。其中在存在多层卷积层的情况下,每一层卷积层接收上一层卷积层的像素矩阵并进行卷积处理,再将卷积得到的像素矩阵传给下一卷积层。池化层,在不改变像素矩阵的深度(对于三色的像素矩阵,其深度为3)情况下,缩小最终流向全连接层的节点个数,达到收敛作用,其池化过程可采用最大池化处理或者平均池化处理。全连接层连接池化层输出的所有收敛矩阵,从而对整体图像对应的所有收敛矩阵的数据进行处理,以得到特征值。分类层例如为softmax分类层,以依据特征值与类别的对应关系,输出准确的分类类别。从而实现了对纸质文件的准确识别。
在一个实施方式中,所述采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本的步骤S5,包括:
S501、判断所述中间图像是否存在手写体文字;
S502、若所述中间图像存在手写体文字,则将所述中间图像输入基于几何特征抽取法的文字识别模型中进行计算,从而得到所述文字识别模型输出的识别文字文本。
如上所述,实现了采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本。其中,几何特征抽取法指抽取文字图像中的几何特征,例如端点、分叉点及相对位置信息等进行识别。中间图像根据其上记载的文字图像,可分为三种类型:纯印刷体文字图像,纯手写体文字图像或者印刷体手写体混合图像。当为纯印刷体文字图像,本申请可采用基于模板匹配法的识别方法对所述中间图像进行识别,从而利用模板匹配法更适用于印刷体文字的方式,提高识别准确性。若为纯手写体文字图像或者印刷体手写体混合图像,即若所述中间图像存在手写体文字,则采用几何特征抽取法进行识别,以利用几何特征抽取法更适用于手写体文字的特点,提高识别准确性。
在一个实施方式中,所述将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外的步骤S6之后,包括:
S621、获取与所述待识别纸质文件对应的用户端;
S622、向所述用户端发送信息核实要求,所述信息核实要求携带有关联展示数据,所述关联展示数据包括所述第一类文字文本、第二类文字文本、第三类文字文本和所述中间图像,并且所述中间图像中的第一封闭区域标注有与所述第一类文字文本关联的第一标记,所述中间图像中的第二封闭区域标注有与所述第二类文字文本关联的第二标记;
S623、接收所述用户端的返回信息,并判断所述返回信息是否为核实通过;
S624、若所述返回信息为核实通过,则将所述第一类文字文本、第二类文字文本和第三类文字文本分别填入预设的电子文件中的对应位置中。
如上所述,实现了将所述第一类文字文本、第二类文字文本和第三类文字文本分别填入预设的电子文件中的对应位置中。为了进一步减少识别错误的可能,本申请通过获取与所述待识别纸质文件对应的用户端;向所述用户端发送信息核实要求;在核实通过后将所述第一类文字文本、第二类文字文本和第三类文字文本分别填入预设的电子文件中的对应位置中,从而利用了用户端对应的用户以保证信息的准确性。其中,所述用户端例如为所述待识别纸质文件对应的用户所拥有的用户端,因此所述用户对所述待识别文件有足够准确的理解,从而能够纠正可能的识别错误。其中所述电子文件中预先设置有空位位置,以待将第一类文字文本、第二类文字文本和第三类文字文本分别填入。例如待识别文件为新车发票,所述电子文件为车辆保单,从而将新车发票中的购买人信息,价税信息等自动提取出来,并填入车辆保单中,从而实现了自动准确地出单。
本申请的基于红外光和紫外光的文字识别方法,生成红外光,以照射预设的待识别纸质文件,并采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本。从而提高了整体的识别效率,提高了识别可靠性。
参照图2,本申请实施例提供一种基于红外光和紫外光的文字识别装置,包括:
第一图像获取单元10,用于采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;其中,所述待识别纸质文件上预先绘制有由第一材料划分出的第一封闭区域,所述第一材料在红外光条件下将被激发出可见光;
第二图像获取单元20,用于采用预设的紫外光发生设备生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;其中,所述待识别纸质文件上预先绘制有由第二材料划分出的第二封闭区域,所述第二材料在紫外光条件下将被激发出可见光;
第三图像获取单元30,用于采用预设的可见光发生设备生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;
中间图像获取单元40,用于叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;
识别文字文本获取单元50,用于采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;
识别文字文本划分单元60,用于将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外。
其中上述单元分别用于执行的操作与前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述第一图像获取单元10,包括:
第一图像获取子单元,用于采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到具有由绿光线条限定的第一子区域和由蓝光线条限定的第二子区域的第一图像;其中,所述待识别纸质文件上预先绘制有由红外转绿光材料划分出的第一子区域,和由红外转蓝光材料划分出的第二子区域,所述红外转绿光材料和所述红外转蓝光材料在红外光条件下将被激发出可见光;
所述装置,包括:
第一类文字文本划分单元,用于将所述第一类文字文本划分为第一子文本和第二子文本,其中所述第一子文本位于所述由绿光线条限定的第一子区域中,所述第二子文本位于所述由蓝光线条限定的第二子区域中。
其中上述单元或者子单元分别用于执行的操作与前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述装置,包括:
类型识别结果获取单元,用于将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果,其中所述纸质文件类型识别模型基于卷积神经网络并利用样本数据训练而成,所述样本数据由预先收集的训练用纸质文件和与所述训练用纸质文件的类型构成;
类型识别结果判断单元,用于判断所述类型识别结果是否为指定类型;
模糊度值计算单元,用于若所述类型识别结果为指定类型,则根据预设的模糊度计算方法,计算第三图像的模糊度值;
模糊度值判断单元,用于判断所述模糊度值是否小于预设的模糊度阈值;
图像叠加指令生成单元,用于若所述模糊度值小于预设的模糊度阈值,则生成图像叠加指令,所述图像叠加指令用于指示叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像。
其中上述单元分别用于执行的操作与前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述类型识别结果获取单元,包括:
像素矩阵获取子单元,用于将所述第三图像进行像素矩阵化处理,从而得到所述第三图像所有像素点对应的像素矩阵;
抽象特征矩阵获取子单元,用于将所述像素矩阵输入预设的卷积神经网络模型中的卷积层中进行处理,从而得到所述卷积层输出的抽象特征矩阵;其中所述卷积神经网络模型由卷积层、池化层、全连接层和分类层;
收敛矩阵获取子单元,用于采用所述池化层对所述抽象特征矩阵进行收敛,从而得到收敛矩阵;
特征值获取子单元,用于将所述收敛矩阵输入所述全连接层中进行处理,从而得到所述全连接层输出的特征值;
类型识别结果获取子单元,用于将所述特征值输入所述分类层,从而得到所述分类层输出的类型识别结果。
其中上述子单元分别用于执行的操作与前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述识别文字文本获取单元50,包括:
手写体文字判断子单元,用于判断所述中间图像是否存在手写体文字;
识别文字文本获取子单元,用于若所述中间图像存在手写体文字,则将所述中间图像输入基于几何特征抽取法的文字识别模型中进行计算,从而得到所述文字识别模型输出的识别文字文本。
其中上述子单元分别用于执行的操作与前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述装置,包括:
用户端获取单元,用于获取与所述待识别纸质文件对应的用户端;
信息核实要求发送单元,用于向所述用户端发送信息核实要求,所述信息核实要求携带有关联展示数据,所述关联展示数据包括所述第一类文字文本、第二类文字文本、第三类文字文本和所述中间图像,并且所述中间图像中的第一封闭区域标注有与所述第一类文字文本关联的第一标记,所述中间图像中的第二封闭区域标注有与所述第二类文字文本关联的第二标记;
返回信息获取单元,用于接收所述用户端的返回信息,并判断所述返回信息是否为核实通过;
填充单元,用于若所述返回信息为核实通过,则将所述第一类文字文本、第二类文字文本和第三类文字文本分别填入预设的电子文件中的对应位置中。
其中上述单元分别用于执行的操作与前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
本申请的基于红外光和紫外光的文字识别装置,生成红外光,以照射预设的待识别纸质文件,并采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本。从而提高了整体的识别效率,提高了识别可靠性。
参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于红外光和紫外光的文字识别方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于红外光和紫外光的文字识别方法。
上述处理器执行上述基于红外光和紫外光的文字识别方法,其中所述方法包括的步骤分别与执行前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请的计算机设备,生成红外光,以照射预设的待识别纸质文件,并采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本。从而提高了整体的识别效率,提高了识别可靠性。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于红外光和紫外光的文字识别方法,其中所述方法包括的步骤分别与执行前述实施方式的基于红外光和紫外光的文字识别方法的步骤一一对应,在此不再赘述。
本申请的计算机可读存储介质,生成红外光,以照射预设的待识别纸质文件,并采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本。从而提高了整体的识别效率,提高了识别可靠性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (6)

1.一种基于红外光和紫外光的文字识别方法,其特征在于,包括:
采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;其中,所述待识别纸质文件上预先绘制有由第一材料划分出的第一封闭区域,所述第一材料在红外光条件下将被激发出可见光;
采用预设的紫外光发生设备生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;其中,所述待识别纸质文件上预先绘制有由第二材料划分出的第二封闭区域,所述第二材料在紫外光条件下将被激发出可见光;
采用预设的可见光发生设备生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;
将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果,其中所述纸质文件类型识别模型基于卷积神经网络并利用样本数据训练而成,所述样本数据由预先收集的训练用纸质文件和与所述训练用纸质文件的类型构成;
判断所述类型识别结果是否为指定类型;
若所述类型识别结果为指定类型,则根据预设的模糊度计算方法,计算第三图像的模糊度值;
判断所述模糊度值是否小于预设的模糊度阈值;
若所述模糊度值小于预设的模糊度阈值,则生成图像叠加指令,所述图像叠加指令用于指示叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;
叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;
采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;
将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外; 所述采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像的步骤,包括:
采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到具有由绿光线条限定的第一子区域和由蓝光线条限定的第二子区域的第一图像;其中,所述待识别纸质文件上预先绘制有由红外转绿光材料划分出的第一子区域,和由红外转蓝光材料划分出的第二子区域,所述红外转绿光材料和所述红外转蓝光材料在红外光条件下将被激发出可见光;
所述将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外的步骤之后,包括:
将所述第一类文字文本划分为第一子文本和第二子文本,其中所述第一子文本位于所述由绿光线条限定的第一子区域中,所述第二子文本位于所述由蓝光线条限定的第二子区域中;
所述将所述第三图像输入纸质文件类型识别模型中,从而对应得到所述纸质文件类型识别模型输出的类型识别结果的步骤,包括:
将所述第三图像进行像素矩阵化处理,从而得到所述第三图像所有像素点对应的像素矩阵;
将所述像素矩阵输入预设的卷积神经网络模型中的卷积层中进行处理,从而得到所述卷积层输出的抽象特征矩阵;其中所述卷积神经网络模型由卷积层、池化层、全连接层和分类层;
采用所述池化层对所述抽象特征矩阵进行收敛,从而得到收敛矩阵;
将所述收敛矩阵输入所述全连接层中进行处理,从而得到所述全连接层输出的特征值;
将所述特征值输入所述分类层,从而得到所述分类层输出的类型识别结果。
2.根据权利要求1所述的基于红外光和紫外光的文字识别方法,其特征在于,所述采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本的步骤,包括:
判断所述中间图像是否存在手写体文字;
若所述中间图像存在手写体文字,则将所述中间图像输入基于几何特征抽取法的文字识别模型中进行计算,从而得到所述文字识别模型输出的识别文字文本。
3.根据权利要求1所述的基于红外光和紫外光的文字识别方法,其特征在于,所述将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外的步骤之后,包括:
获取与所述待识别纸质文件对应的用户端;
向所述用户端发送信息核实要求,所述信息核实要求携带有关联展示数据,所述关联展示数据包括所述第一类文字文本、第二类文字文本、第三类文字文本和所述中间图像,并且所述中间图像中的第一封闭区域标注有与所述第一类文字文本关联的第一标记,所述中间图像中的第二封闭区域标注有与所述第二类文字文本关联的第二标记;
接收所述用户端的返回信息,并判断所述返回信息是否为核实通过;
若所述返回信息为核实通过,则将所述第一类文字文本、第二类文字文本和第三类文字文本分别填入预设的电子文件中的对应位置中。
4.一种基于红外光和紫外光的文字识别装置,用于执行权利要求1-3任意一项所述的方法,其特征在于,包括:
第一图像获取单元,用于采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第一图像;其中,所述待识别纸质文件上预先绘制有由第一材料划分出的第一封闭区域,所述第一材料在红外光条件下将被激发出可见光;
第二图像获取单元,用于采用预设的紫外光发生设备生成紫外光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被紫外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第二图像;其中,所述待识别纸质文件上预先绘制有由第二材料划分出的第二封闭区域,所述第二材料在紫外光条件下将被激发出可见光;
第三图像获取单元,用于采用预设的可见光发生设备生成可见光,以照射所述待识别纸质文件,并在所述待识别纸质文件仅被可见光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到第三图像;
中间图像获取单元,用于叠加所述第一图像、所述第二图像和所述第三图像,从而得到中间图像;
识别文字文本获取单元,用于采用预设的图片文字识别技术,识别所述中间图像,从而得到识别文字文本;
识别文字文本划分单元,用于将所述识别文字文本划分为第一类文字文本、第二类文字文本和第三类文字文本,其中所述第一类文字文本对应的文字图像位于所述第一封闭区域内,所述第二类文字文本对应的文字图像位于所述第二封闭区域内,所述第三类文字文本对应的文字图像位于所述第一封闭区域和所述第二封闭区域外;
所述第一图像获取单元,包括:
第一图像获取子单元,用于采用预设的红外光发生设备生成红外光,以照射预设的待识别纸质文件,并在所述待识别纸质文件仅被红外光照射时,采用预设的摄像头采集所述待识别纸质文件的图像,从而得到具有由绿光线条限定的第一子区域和由蓝光线条限定的第二子区域的第一图像;其中,所述待识别纸质文件上预先绘制有由红外转绿光材料划分出的第一子区域,和由红外转蓝光材料划分出的第二子区域,所述红外转绿光材料和所述红外转蓝光材料在红外光条件下将被激发出可见光;
所述装置,包括:
第一类文字文本划分单元,用于将所述第一类文字文本划分为第一子文本和第二子文本,其中所述第一子文本位于所述由绿光线条限定的第一子区域中,所述第二子文本位于所述由蓝光线条限定的第二子区域中。
5.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
CN202010469606.5A 2020-05-28 2020-05-28 基于红外光和紫外光的文字识别方法、装置和计算机设备 Active CN111814539B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010469606.5A CN111814539B (zh) 2020-05-28 2020-05-28 基于红外光和紫外光的文字识别方法、装置和计算机设备
PCT/CN2020/124729 WO2021139341A1 (zh) 2020-05-28 2020-10-29 基于红外光和紫外光的文字识别方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010469606.5A CN111814539B (zh) 2020-05-28 2020-05-28 基于红外光和紫外光的文字识别方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111814539A CN111814539A (zh) 2020-10-23
CN111814539B true CN111814539B (zh) 2023-07-21

Family

ID=72847808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010469606.5A Active CN111814539B (zh) 2020-05-28 2020-05-28 基于红外光和紫外光的文字识别方法、装置和计算机设备

Country Status (2)

Country Link
CN (1) CN111814539B (zh)
WO (1) WO2021139341A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814539B (zh) * 2020-05-28 2023-07-21 平安科技(深圳)有限公司 基于红外光和紫外光的文字识别方法、装置和计算机设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004297508A (ja) * 2003-03-27 2004-10-21 Minolta Co Ltd Jpeg2000符号化装置及び復号化装置
CN106447904A (zh) * 2016-09-09 2017-02-22 深圳怡化电脑股份有限公司 一种纸币的鉴别方法和装置
CN107423796A (zh) * 2017-07-28 2017-12-01 广州中国科学院先进技术研究所 一种多光谱隐形防伪标识及其检测装置、检测方法
CN109034155A (zh) * 2018-07-24 2018-12-18 百卓网络科技有限公司 一种文字检测及识别的方法及系统
CN109241904A (zh) * 2018-08-31 2019-01-18 平安科技(深圳)有限公司 文字识别模型训练、文字识别方法、装置、设备及介质
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN109815949A (zh) * 2018-12-20 2019-05-28 航天信息股份有限公司 基于神经网络的发票公示方法和系统
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
WO2019232853A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 中文模型训练、中文图像识别方法、装置、设备及介质
CN110598699A (zh) * 2019-09-16 2019-12-20 华中科技大学 一种基于多光谱图像的防伪票据鉴伪系统和方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214382A (zh) * 2018-07-16 2019-01-15 顺丰科技有限公司 一种基于crnn的票据信息识别算法、设备及存储介质
CN111814539B (zh) * 2020-05-28 2023-07-21 平安科技(深圳)有限公司 基于红外光和紫外光的文字识别方法、装置和计算机设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004297508A (ja) * 2003-03-27 2004-10-21 Minolta Co Ltd Jpeg2000符号化装置及び復号化装置
CN106447904A (zh) * 2016-09-09 2017-02-22 深圳怡化电脑股份有限公司 一种纸币的鉴别方法和装置
CN107423796A (zh) * 2017-07-28 2017-12-01 广州中国科学院先进技术研究所 一种多光谱隐形防伪标识及其检测装置、检测方法
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
WO2019232853A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 中文模型训练、中文图像识别方法、装置、设备及介质
CN109034155A (zh) * 2018-07-24 2018-12-18 百卓网络科技有限公司 一种文字检测及识别的方法及系统
CN109241904A (zh) * 2018-08-31 2019-01-18 平安科技(深圳)有限公司 文字识别模型训练、文字识别方法、装置、设备及介质
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN109815949A (zh) * 2018-12-20 2019-05-28 航天信息股份有限公司 基于神经网络的发票公示方法和系统
CN110598699A (zh) * 2019-09-16 2019-12-20 华中科技大学 一种基于多光谱图像的防伪票据鉴伪系统和方法

Also Published As

Publication number Publication date
CN111814539A (zh) 2020-10-23
WO2021139341A1 (zh) 2021-07-15

Similar Documents

Publication Publication Date Title
CN107798299B (zh) 票据信息识别方法、电子装置及可读存储介质
CN110334585A (zh) 表格识别方法、装置、计算机设备和存储介质
CN110569769A (zh) 图像识别方法、装置、计算机设备和存储介质
CN109255826B (zh) 中文训练图像生成方法、装置、计算机设备及存储介质
CN111291741B (zh) 单据识别方法、装置、计算机设备和存储介质
CN113158895B (zh) 票据识别方法、装置、电子设备及存储介质
CN110516541A (zh) 文本定位方法、装置、计算机可读存储介质和计算机设备
CN112862024B (zh) 一种文本识别方法及系统
CN111814539B (zh) 基于红外光和紫外光的文字识别方法、装置和计算机设备
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN113673338A (zh) 自然场景文本图像字符像素弱监督自动标注方法、系统及介质
CN111814716A (zh) 印章去除方法、计算机设备和可读存储介质
JP2019079347A (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
CN112749649A (zh) 一种智能识别并生成电子合同的方法及系统
CN112308946A (zh) 题目生成方法、装置、电子设备及可读存储介质
CN116030453A (zh) 一种数字电气表计的识别方法、装置及设备
CN114049540A (zh) 基于人工智能的标注图像检测方法、装置、设备及介质
CN114332883A (zh) 发票信息识别方法、装置、计算机设备及存储介质
CN113707279A (zh) 医学影像图片的辅助分析方法、装置、计算机设备及介质
CN113920520A (zh) 图像文本识别方法、系统、存储介质及电子设备
CN112418033A (zh) 基于mask rcnn神经网络的滑坡坡面分割识别方法
CN112418206A (zh) 基于位置检测模型的图片分类方法及其相关设备
CN114550189A (zh) 票据识别方法、装置、设备、计算机存储介质和程序产品
CN112257718A (zh) 一种关于放射科胶片的文本识别方法及装置
CN113780116A (zh) 发票分类方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant