CN107818320A - 基于开源ocr技术变电设备红外图像数值的识别方法 - Google Patents

基于开源ocr技术变电设备红外图像数值的识别方法 Download PDF

Info

Publication number
CN107818320A
CN107818320A CN201711026807.2A CN201711026807A CN107818320A CN 107818320 A CN107818320 A CN 107818320A CN 201711026807 A CN201711026807 A CN 201711026807A CN 107818320 A CN107818320 A CN 107818320A
Authority
CN
China
Prior art keywords
temperature
word
image
measurement
infrared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711026807.2A
Other languages
English (en)
Inventor
郑晓军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Sichuan Electric Power Co Ltd
Original Assignee
State Grid Sichuan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Sichuan Electric Power Co Ltd filed Critical State Grid Sichuan Electric Power Co Ltd
Priority to CN201711026807.2A priority Critical patent/CN107818320A/zh
Publication of CN107818320A publication Critical patent/CN107818320A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了基于开源OCR技术变电设备红外图像数值的识别方法,包括以下步骤:步骤A:采用红外测温装置对准变电设备进行拍照,获得红外测温图像,所述红外测温图像内含温度值文字;步骤B:将步骤A所获红外测温图像导入OCR识别系统进行温度值文字识别;步骤B的具体过程包括如下步骤:步骤B1、预处理;步骤B2、特征提取和降维;步骤B3、分类器识别;步骤B4、后处理,步骤C:获取变电站运维一体化数据智能分析系统的基础数据中的测量标识数据,将测量标识数据与属性文字进行近似分析,找到相近似的对应关系,建立测量标识数据与属性文字的一一映射关系,并根据属性文字与温度数值文字的一一映射关系对测量标识数据赋予对应的温度数值。

Description

基于开源OCR技术变电设备红外图像数值的识别方法
技术领域
本发明涉及变电设备红外图像数值自动化识别领域,具体涉及基于开源OCR技术变电设备红外图像数值的识别方法。
背景技术
在变电站运维一体化数据智能分析系统中,传统分析的流程是:先依赖人力在变电设备现场处采用红外测温装置进行拍照,红外测温装置可以根据所获得的红外测温图像自动化的计算出温度数值转为文字图像后直接在图像中显示并与图像合为统一的图像,没有提供专门的温度数值输接口,因此,在拿到红外测温图像后,再依赖于人力去识别红外测温图像中的温度数值并将温度数值输入到变电站运维一体化数据智能分析系统中,再来判断标准输出故障情况和给出操作建议,这种操作存在花费时间长,识别错误等风险,经过测试,这种处理方式使得识别出温度数据并录入电站运维一体化数据智能分析系统中需要人均11.4min,同时录入数据准确率为仅有80%。需要另外人员进行复核操作,而现在的变电站设备较多,且管理日趋精细化操作,以及检测频率的增多的情况下,因此,全年一个变电站的温度识别需要耗费大量的人力。
发明内容
本发明为了解决上述技术问题提供基于开源OCR技术变电设备红外图像数值的识别方法。
基于开源OCR技术变电设备红外图像数值的识别方法,包括以下步骤:
步骤A:采用红外测温装置对准变电设备进行拍照,获得红外测温图像,所述红外测温图像内含温度值文字;
步骤B:将步骤A所获红外测温图像导入OCR识别系统进行温度值文字识别;
步骤B的具体过程包括如下步骤:
步骤B1、预处理:依次完成文本区域的提取、灰度处理、降噪处理、二值化处理、图像矫正处理、分割字符处理;
步骤B2、特征提取和降维:对分割后的文字信息进行特征提取,当某一文字信息的特征的维数太高时,则对该文字信息的特征的分量数进行简化处理,再重新定义该文字信息的特征;
步骤B3、分类器识别:将提取出特征的给分类器,分类器就对其进行分类,判断出这个特征该识别成哪个文字;
步骤B4、后处理:对分类后的文字信息进行优化、排版、调整字体大小,其中,排版时,按照原始红外测温图像的文字排版进行排版排列,同时,将每一行文字中的左半部分文字为汉字的文字定为属性文字,将每一行文字中的右半部分文字为数字的文字定为温度数值文字,并建立属性文字与温度数值文字的一一映射关系。
步骤C:获取变电站运维一体化数据智能分析系统的基础数据中的测量标识数据,将测量标识数据与属性文字进行近似分析,找到相近似的对应关系,建立测量标识数据与属性文字的一一映射关系,并根据属性文字与温度数值文字的一一映射关系对测量标识数据赋予对应的温度数值。
OCR文字识别,是指利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把文字图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP等图片格式。
为了提升OCR计算效率和精准度,本发明采用了优化后的处理顺序对文字的识别进行处理,特别是解决了识别后文字与变电站运维一体化数据智能分析系统的数据对接问题,通过导入图像即可完成自动化的识别,不必人工介入操作,系统自动化的完成数据的填写和故障情况的分析处理。
本申请的操作原理如下:
预处理:对包含文字的图像进行处理以便后续进行特征提取。本过程的主要目的是减少图像中的无用信息,便于后期处理。本过程包含的步骤有:灰度化、降噪、二值化、字符切分以及归一化。经过二值化后,图像只剩下两种颜色,即黑和白。其中一个是图像背景,另一个就是要识别的文字。降噪在这个阶段非常重要,降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别。若文字行有倾斜,需进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,在同一个规格下,才能应用统一的算法。
特征提取和降维:特征是用来识别文字的关键信息,每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说,这个特征提取是比较容易的,因为数字只有10个,英文字母只有52个,都是小字符集。在确定了使用何种特征后,视情况而定,有可能需要进行特征降维。例如,特征的维数太高(特征一般用一个向量表示,维数即该向量的分量数),分类器的效率会受到很大的影响,为了提高识别速率,往往需要降维处理,该过程也很重要,既要降低维数,又要使减少维数后的特征量保留足够的信息量(以区分不同的文字)。
分类器设计、训练和实际识别:分类器是用来进行识别的。对于第二步,对一个文字图像,提取出特征给分类器,分类器对其进行分类,判断出该特征识别为哪个文字。在进行实际识别前,往往需对分类器进行训练。
后处理:分类器的分类不一定是完全正确的(实际上也做不到完全正确),后处理用于对分类结果进行优化。OCR的识别图像往往是有大量文字的,而且这些文字存在排版、字体大小等复杂情况。红外测温图像,其左半部分的文字和右半部分的文字毫无关系,而在字符切分过程中,往往是按行切分的,那么识别结果中左半部分的第一行,后面紧挨着右半部分的第一行,诸如此类。后处理可以对识别结果进行格式化,按照图像中的排版排列。
本发明的技术关键点在于:1.先检测和提取文本区域。2.接着利用拉东变换、霍夫变换等方法,进行文本校正。3.通过投影直方图分割出单行的文本图片。4.字符单行分割,用的是基于投影直方图极值点作为候选分割点,并使用分类器集束搜索最佳分割点。搜索到分割点之后对于单个字符,就是特征工程和分类器。
优选的:
步骤C中,将测量标识数据与属性文字进行近似分析采用模糊算法或相似度计算法。
还包括故障分析步骤:采用测量标识数据对应的温度数值计算温差和相对温度,再根据温差和相对温度值来划分为一般缺陷、严重缺陷和危急缺陷。
相对温度的计算方法为:TX=(T1-T2)/(T1-T0)*100%,温差的计算方法为:TC=(T1-T2),
其中,T1表示发热点最高温度,T2表示电气设备相对应的平均温度,T0表示环境温度,TX表示电气设备的相对温度,TC表示电气设备的温差温度。
步骤B1具体为:先检测和提取含有温度值文字的文本区域,再对该文本区域进行灰度处理、降噪处理、二值化处理,再采用拉东变换、霍夫变换对图像矫正处理,再采用投影直方图分割出单行的文本的图片,再基于投影直方图极值点作为候选分割点并使用分类器与集束搜索法搜索最佳分割点,依赖分割点对单行的文字进行分割字符处理。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明提供的OCR识别红外测温图像识别速度快、适应性强、可靠性高。基于开源OCR识别红外图像数值的智能分析系统将数据处理时间由人均11.4min缩短到75s,大大提高了工作效率,降低了人工成本。同时,一年内设备状态评估(以红外测温为例)情况显示系统录入数据准确率为100%。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。
图1为变电站运维一体化数据智能分析系统的界面示意图。
图2为变电站运维一体化数据智能分析系统自动识别温度后的界面示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
如图1和图2所示,
基于开源OCR技术变电设备红外图像数值的识别方法,包括以下步骤:
步骤A:采用红外测温装置对准变电设备(隔离开关刀口位置)进行拍照,获得红外测温图像,所述红外测温图像内含温度值文字,温度值文字有:最大值=43.5,平均值=26.7,最小值=22.4,红外测温图像内还有设备图像,红外温度渐变、省略了大部分背景区域,只保留了红外温度区域;
步骤B:将步骤A所获红外测温图像导入OCR识别系统进行温度值文字识别;
步骤B的具体过程包括如下步骤:
步骤B1、预处理:依次完成文本区域的提取、灰度处理、降噪处理、二值化处理、图像矫正处理、分割字符处理;
步骤B2、特征提取和降维:对分割后的文字信息进行特征提取,当某一文字信息的特征的维数太高时,则对该文字信息的特征的分量数进行简化处理,再重新定义该文字信息的特征;
步骤B3、分类器识别:将提取出的特征给分类器,分类器就对其进行分类,判断出这个特征该识别成哪个文字;
步骤B4、后处理:对分类后的文字信息进行优化、排版、调整字体大小。其中,排版时,按照原始红外测温图像的文字排版进行排版排列。同时,将每一行文字中的左半部分文字为汉字的文字定为属性文字(“最大值”、“平均值”、“最小值”),将每一行文字中的右半部分文字为数字的文字定为温度数值文字(“43.5”、“26.7”、“22.4”),并建立属性文字与温度数值文字的一一映射关系。
步骤C:获取变电站运维一体化数据智能分析系统的基础数据中的测量标识数据,将测量标识数据与属性文字进行近似分析,找到相近似的对应关系(“最大值”对应“最高温度”,“平均值”对应“中间温度”,“最小值”对应“最低温度”),建立测量标识数据与属性文字的一一映射关系,并根据属性文字与温度数值文字的一一映射关系对测量标识数据赋予对应的温度数值,在图2中,“43.5”、“26.7”、“22.4”分别赋予给“最高温度”、“中间温度”、“最低温度”。
OCR文字识别,是指利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。它是一种能够将文字自动识别录入到电脑中的软件技术,是与扫描仪配套的主要软件,属于非键盘输入范畴,需要图像输入设备主要是扫描仪相配合。
为了提升OCR计算效率和精准度,本发明采用了上述优化后的处理顺序进行对文字的识别处理,特别是解决了识别后文字与变电站运维一体化数据智能分析系统的数据对接问题,通过导入图像即可完成自动化的识别,不必人工介入操作,系统自动化的完成数据的填写和故障情况的分析处理。
本申请的操作原理如下:
预处理:对包含文字的图像进行处理以便后续进行特征提取、学习。本过程的主要目的是减少图像中的无用信息,便于后期处理。本过程包含的步骤有:灰度化、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白。其中一个是图像背景,另一个颜色就是要识别的文字了。降噪在这个阶段非常重要,降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。若文字行有倾斜,需进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸。在同一个规格下,才能应用统一的算法。
特征提取和降维:特征是用来识别文字的关键信息,每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说,这个特征提取是比较容易的,因为数字只有10个,英文字母只有52个,都是小字符集。在确定了使用何种特征后,视情况而定,还有可能要进行特征降维。例如,特征的维数太高(特征一般用一个向量表示,维数即该向量的分量数),分类器的效率会受到很大的影响,为了提高识别速率,往往就要进行降维,这该过程也很重要,既要降低维数,又使得减少维数后的特征量仍保留足够的信息量(以区分不同的文字)。
分类器设计、训练和实际识别:分类器是用来进行识别的。对于第二步,对一个文字图像,提取出特征给分类器,分类器就对其进行分类,判断出这个特征该识别成哪个文字。在进行实际识别前,往往还要对分类器进行训练。
后处理:分类器的分类不一定是完全正确的(实际上也做不到完全正确),后处理用于对分类结果进行优化。OCR的识别图像往往包含大量文字,而且这些文字存在排版、字体大小等复杂情况。红外测温图像,其左半部分的文字和右半部分的文字毫无关系,而在字符切分过程中,往往是按行切分的。因而,识别结果中左半部分的第一行后面会紧跟着右半部分的第一行,诸如此类。后处理可以对识别结果进行格式化,按照图像中的排版排列。
本发明的技术关键点在于:1.先检测和提取文本区域。2.接着利用拉东变换、霍夫变换等方法,进行文本校正。3.通过投影直方图分割出单行的文本的图片。4.对单行字符,用的是基于投影直方图极值点作为候选分割点,并使用分类器、集束搜索最佳分割点。搜索到分割点之后对于单个字符,就是特征工程和分类器。
优选的:
步骤C中,将测量标识数据与属性文字进行近似分析采用模糊算法或相似度计算法。
还包括故障分析步骤:采用测量标识数据对应的温度数值计算温差和相对温度,再根据温差和相对温度值来划分为一般缺陷、严重缺陷和危急缺陷。
相对温度的计算方法为:TX=(T1-T2)/(T1-T0)*100%,温差的计算方法为:TC=(T1-T2),
其中,T1表示发热点最高温度,T2表示电气设备相对应的平均温度,T0表示环境温度,TX表示电气设备的相对温度,TC表示电气设备的温差温度。
步骤B1具体为:先检测和提取含有温度值文字的文本区域,再对该文本区域进行灰度处理、降噪处理、二值化处理,再采用拉东变换、霍夫变换对图像矫正处理,再采用投影直方图分割出单行的文本的图片,再基于投影直方图极值点作为候选分割点并使用分类器与集束搜索法搜索最佳分割点,依赖分割点对单行的文字进行分割字符处理。
本方法完成时间为75s,为了对比人工方式,在班组员工中随机抽取4名人员作为调查对象,采用传统方式对红外精准测温数据中的上述数据进行处理时间进行测试,结果如表1.1:
表1.1 数据处理步骤占用时间分布及功能统计表
从表1.1可看出,一条红外精准测试数据的处理平均时间为11.4min,对于在大量的数据处理则需要更多的时间,传统方式在时效性和利用率上都无法满足。而通过OCR识别,一条红外精准测试数据的识别处理平均时间75s≤2min,由此可见大大提高了准确率和工作效率。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.基于开源OCR技术变电设备红外图像数值的识别方法,其特征在于,包括以下步骤:
步骤A:采用红外测温装置对准变电设备进行拍照,获得红外测温图像,所述红外测温图像内含温度值文字;
步骤B:将步骤A所获红外测温图像导入OCR识别系统进行温度值文字识别;
步骤B的具体过程包括如下步骤:
步骤B1、预处理:依次完成文本区域的提取、灰度处理、降噪处理、二值化处理、图像矫正处理、分割字符处理;
步骤B2、特征提取和降维:对分割后的文字信息进行特征提取,当某一文字信息的特征的维数太高时,则对该文字信息的特征的分量数进行简化处理,再重新定义该文字信息的特征;
步骤B3、分类器识别:将提取出的特征给分类器,分类器就对其进行分类,判断出这个特征该识别成哪个文字;
步骤B4、后处理:对分类后的文字信息进行优化、排版、调整字体大小,其中,排版时,按照原始红外测温图像的文字排版进行排版排列,同时,将每一行文字中的左半部分文字为汉字的文字定为属性文字,将每一行文字中的右半部分为数字的文字定为温度数值文字,并建立属性文字与温度数值文字的一一映射关系;
步骤C:获取变电站运维一体化数据智能分析系统的基础数据中的测量标识数据,将测量标识数据与属性文字进行近似分析,找到相近似的对应关系,建立测量标识数据与属性文字的一一映射关系,并根据属性文字与温度数值文字的一一映射关系将测量标识数据赋予对应的温度数值。
2.根据权利要求1所述的基于开源OCR技术变电设备红外图像数值的识别方法,其特征在于,步骤C中,将测量标识数据与属性文字进行近似分析采用模糊算法或相似度计算法。
3.根据权利要求1所述的基于开源OCR技术变电设备红外图像数值的识别方法,其特征在于,还包括故障分析步骤:采用测量标识数据对应的温度数值计算温差和相对温度,再根据温差和相对温度值来划分为一般缺陷、严重缺陷和危急缺陷。
4.根据权利要求3所述的基于开源OCR技术变电设备红外图像数值的识别方法,其特征在于,相对温度的计算方法为:TX=(T1-T2)/(T1-T0)*100%,温差的计算方法为:TC=(T1-T2),
其中,T1表示发热点最高温度,T2表示电气设备相对应的平均温度,T0表示环境温度,TX表示电气设备的相对温度,TC表示电气设备的温差温度。
5.根据权利要求1所述的基于开源OCR技术变电设备红外图像数值的识别方法,其特征在于,步骤B1具体为:先检测和提取含有温度值文字的文本区域,再对该文本区域进行灰度处理、降噪处理、二值化处理,再采用拉东变换、霍夫变换对图像进行矫正处理,再采用投影直方图分割出单行的文本图片,再基于投影直方图极值点作为候选分割点,使用分类器与集束搜索法搜索最佳分割点,依赖分割点对单行的文字进行分割字符处理。
CN201711026807.2A 2017-10-27 2017-10-27 基于开源ocr技术变电设备红外图像数值的识别方法 Pending CN107818320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711026807.2A CN107818320A (zh) 2017-10-27 2017-10-27 基于开源ocr技术变电设备红外图像数值的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711026807.2A CN107818320A (zh) 2017-10-27 2017-10-27 基于开源ocr技术变电设备红外图像数值的识别方法

Publications (1)

Publication Number Publication Date
CN107818320A true CN107818320A (zh) 2018-03-20

Family

ID=61604539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711026807.2A Pending CN107818320A (zh) 2017-10-27 2017-10-27 基于开源ocr技术变电设备红外图像数值的识别方法

Country Status (1)

Country Link
CN (1) CN107818320A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685051A (zh) * 2018-11-14 2019-04-26 国网上海市电力公司 一种基于电网系统的红外图像故障诊断系统
CN111414472A (zh) * 2018-12-18 2020-07-14 北京奇虎科技有限公司 基于光学字符识别的图片检测方法、装置及电子设备
CN112749813A (zh) * 2020-10-29 2021-05-04 广东电网有限责任公司 一种数据处理系统、方法、电子设备及存储介质
CN112990212A (zh) * 2021-02-05 2021-06-18 开放智能机器(上海)有限公司 热成像温度图的读数方法、装置、电子设备和存储介质
CN113033569A (zh) * 2021-03-30 2021-06-25 扬州大学 基于灰度投影极值的多行喷码字符序贯分割方法
CN113159047A (zh) * 2021-04-16 2021-07-23 南通大学 一种基于cgan图像扩增的变电设备红外图像温度值识别方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685051A (zh) * 2018-11-14 2019-04-26 国网上海市电力公司 一种基于电网系统的红外图像故障诊断系统
CN111414472A (zh) * 2018-12-18 2020-07-14 北京奇虎科技有限公司 基于光学字符识别的图片检测方法、装置及电子设备
CN112749813A (zh) * 2020-10-29 2021-05-04 广东电网有限责任公司 一种数据处理系统、方法、电子设备及存储介质
CN112749813B (zh) * 2020-10-29 2023-11-10 广东电网有限责任公司 一种数据处理系统、方法、电子设备及存储介质
CN112990212A (zh) * 2021-02-05 2021-06-18 开放智能机器(上海)有限公司 热成像温度图的读数方法、装置、电子设备和存储介质
CN113033569A (zh) * 2021-03-30 2021-06-25 扬州大学 基于灰度投影极值的多行喷码字符序贯分割方法
CN113159047A (zh) * 2021-04-16 2021-07-23 南通大学 一种基于cgan图像扩增的变电设备红外图像温度值识别方法
CN113159047B (zh) * 2021-04-16 2024-02-06 南通大学 一种基于cgan图像扩增的变电设备红外图像温度值识别方法

Similar Documents

Publication Publication Date Title
CN107818320A (zh) 基于开源ocr技术变电设备红外图像数值的识别方法
US20040006467A1 (en) Method of automatic language identification for multi-lingual text recognition
Hochberg et al. Automatic script identification from document images using cluster-based templates
Shafait et al. Table detection in heterogeneous documents
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
CN106598959B (zh) 一种确定双语语句对互译关系方法及系统
EP1107169A2 (en) Method and apparatus for performing document structure analysis
CN111582169B (zh) 图像识别数据纠错方法、装置、计算机设备和存储介质
CN111460091B (zh) 医学短文本数据负样例采样方法及医学诊断标准术语映射模型训练方法
CN113221711A (zh) 一种信息提取方法及装置
Lu et al. Retrieval of machine-printed latin documents through word shape coding
WO2023038722A1 (en) Entry detection and recognition for custom forms
CN101593278B (zh) 文档图像的语言判别方法和系统
US9811726B2 (en) Chinese, Japanese, or Korean language detection
Ahmed et al. Enhancing the character segmentation accuracy of bangla ocr using bpnn
JP2004171316A (ja) Ocr装置及び文書検索システム及び文書検索プログラム
Kumar et al. Line based robust script identification for indianlanguages
Salman et al. Proposed Deep Learning System for Arabic Text Detection and Recognition
CN109739981B (zh) 一种pdf文件类别判定方法及文字提取方法
Nakayama Content-oriented categorization of document images
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
US20140169676A1 (en) Information processing apparatus, information processing method, and computer-readable medium
Rathnasena et al. Summarization based approach for old sinhala text archival search and preservation
KR102646428B1 (ko) 인공지능 학습 모델을 이용한 유사 글자 추출 방법 및 장치
Nazemi et al. Mathematical information retrieval (MIR) from scanned pdf documents and MathML conversion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180320