CN116524529A - 一种基于图形嵌套关系的图层识别新方法 - Google Patents

一种基于图形嵌套关系的图层识别新方法 Download PDF

Info

Publication number
CN116524529A
CN116524529A CN202310806871.1A CN202310806871A CN116524529A CN 116524529 A CN116524529 A CN 116524529A CN 202310806871 A CN202310806871 A CN 202310806871A CN 116524529 A CN116524529 A CN 116524529A
Authority
CN
China
Prior art keywords
elements
nested
picture
layer
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310806871.1A
Other languages
English (en)
Other versions
CN116524529B (zh
Inventor
孙钦平
马嘉林
王锁成
潘超杰
崔方剑
张东亮
韩岩杰
孙光辉
夏波
李帅斌
王学平
张春雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Hisense Information Technology Co ltd
Original Assignee
Qingdao Hisense Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Hisense Information Technology Co ltd filed Critical Qingdao Hisense Information Technology Co ltd
Priority to CN202310806871.1A priority Critical patent/CN116524529B/zh
Publication of CN116524529A publication Critical patent/CN116524529A/zh
Application granted granted Critical
Publication of CN116524529B publication Critical patent/CN116524529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于图形嵌套关系的图层识别新方法,属于人工智能技术领域,其方法包括:对图片进行区域化处理,获取处理后的图片;基于所述处理后的图片进行嵌套结构提取;根据提取结果识别出各个嵌套结构之间的关系;基于所述各个嵌套结构之间的关系构建图层嵌套树;基于所述图层嵌套树进行常规字体笔画提取。解决了传统的图像文字识别技术通过图像处理和统计机器学习方法从图像中提取文本信息,包括二值化、噪声滤波、相关域分析等,其依赖于充足的训练样本以及清晰地特征规则,但在很多实际问题中无法获取足够训练样本,这对传统技术提出挑战,对具有普适性的新识别技术产生需求的问题。

Description

一种基于图形嵌套关系的图层识别新方法
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于图形嵌套关系的图层识别新方法。
背景技术
目前,图像文字识别是计算机识别的重要方面,有广泛应用,比如光学识别、工业图文识别、屏幕图文识别等,例如医药品包装上的文字、各种钢制部件上的文字、容器表面的喷涂文字、商店标志上的个性文字等,在这样的图像中,字符部分可能出现在弯曲阵列、曲面异形、斜率分布、皱纹变形、不完整等各种形式中,并且与标准字符的特征大不相同,因此难以检测和识别图像字符,传统的图像文字识别技术通过图像处理和统计机器学习方法从图像中提取文本信息,包括二值化、噪声滤波、相关域分析等,根据处理方法可分为图像准备、文本识别和后处理三个阶段,其依赖于充足的训练样本以及清晰地特征规则,但在很多实际问题中无法获取足够训练样本,这对传统技术提出挑战,对具有普适性的新识别技术产生需求。
因此,本发明提出一种基于图形嵌套关系的图层识别新方法。
发明内容
本发明提供一种基于图形嵌套关系的图层识别新方法,通过对图片进行区域化处理,获取处理后的图片,基于所述处理后的图片进行嵌套结构提取,根据提取结果识别出各个嵌套结构之间的关系,基于所述各个嵌套结构之间的关系构建图层嵌套树,基于所述图层嵌套树进行常规字体笔画提取,解决了背景技术中很多实际问题中无法获取足够训练样本,对具有普适性的新识别技术产生需求的问题。
本发明提出一种基于图形嵌套关系的图层识别新方法,该方法包括:
步骤1:对图片进行区域化处理,获取处理后的图片;
步骤2:基于所述处理后的图片进行嵌套结构提取;
步骤3:根据提取结果识别出各个嵌套结构之间的关系;
步骤4:基于所述各个嵌套结构之间的关系构建图层嵌套树;
步骤5:基于所述图层嵌套树进行常规字体笔画提取。
优化的,对图片进行区域化处理,获取处理后的图片,包括:
获取屏幕分辨率,根据屏幕分辨率获取像素总行数和像素总列数;
根据所述像素总行数和像素总列数确定多个坐标点;
获取所述多个坐标点上的像素向量;
根据所述像素向量创建像素集;
设定一个判定数字,并创建第一空集和第二空集;
在像素集中创建第一初始类集合并确定第一初始类集合的代表元;
将所述第一初始类集合中的元素放入第一空集,所述第一初始类集合的代表元中的元素放入到第二空集中;
其中,第一空集和第二空集中的元素按照两个维度变量的下标排列;
逐一取定像素集中的元素和第二空集中的元素,按照预设算法判定元素的计算结果是否小于等于所述判定数字,若满足,则将所述像素集中的元素和第二空集中的元素进行合并,若不满足,则创建第二初始类并进行重复判定直到满足计算结果;
当像素集中没有计算元素时,获取区域类。
优化的,基于所述处理后的图片进行嵌套结构提取,包括:
基于所述区域类中取一个类,从所取的类中获取所有元素对应的第一坐标集的最大值;
从取的类中获取以第一坐标集最大值为第一坐标的所有元素的集合;
从所述所有元素的集合中获取所有元素对应的第二坐标的最大值;
基于所述第一坐标集的最大值、第二坐标的最大值和多个坐标点上的像素向量构建所取类的基点;
根据所取类的基点构建嵌套元素集合;
根据嵌套元素集合生成若干个嵌套结构元素集合。
优化的,根据提取结果识别出各个嵌套结构之间的关系,包括:
根据嵌套结构元素集合中各元素之间的包含关系将所有元素进行分类;
根据分类结果确定各类元素之间的相对关系;
获取每个嵌套结构元素的包含元素;
根据各类元素之间的相对关系和每个嵌套结构元素的包含元素确定各个嵌套结构之间的关系。
优化的,基于所述各个嵌套结构之间的关系构建图层嵌套树,包括:
根据每个嵌套结构的划分元素按照各个嵌套结构之间的关系连接成树状结构;
其中,树的每个节点是一个图层。
优化的,对图片进行区域化处理之前,还包括:
对图片进行遮挡判断,根据判断结果选择性的对图片进行优化,获取优化后的图片;
将优化后的图片作为图片进行区域化处理的参考图片。
优化的,基于所述图层嵌套树进行常规字体笔画提取,包括:
创建第一集合和第二集合;
将嵌套元素集合中的所有元素的极小元存入到第一集合中,所有元素的次极小元存入到第二集合中;
任取某元素在第二集合中的第一次极小元,并获取该元素在第一集合中的第一极小元;
计算第一次极小元在图片上围起来的第一面积和第一极小元在图片上围起来的第二面积;
判断第二面积与第一面积之间的比值是否小于预设的参数范围内,若小于,则保留该元素在第二集合中的第一次极小元,否则,在第二集合中删除该元素的第一次极小元且从第一集合中删除该元素的第一极小元;
其中,剩余的第一集合中的子集为常规字体笔画。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于图形嵌套关系的图层识别新方法的流程图;
图2为本发明实施例中一种基于图形嵌套关系的图层识别新方法的另一流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本发明提供一种基于图形嵌套关系的图层识别新方法,如图1所示,该方法包括:
步骤1:对图片进行区域化处理,获取处理后的图片;
步骤2:基于所述处理后的图片进行嵌套结构提取;
步骤3:根据提取结果识别出各个嵌套结构之间的关系;
步骤4:基于所述各个嵌套结构之间的关系构建图层嵌套树;
步骤5:基于所述图层嵌套树进行常规字体笔画提取。
该实施例中,区域化处理是指输入像素及其周边像素共同参加运算,得到一个输出像素的处理过程。
该实施例中,嵌套结构比如是背景图在文字上方、文字在背景图上方或者是背景图在文字中间。
该实施例中,图层嵌套树是指表示各种嵌套结构的树状图。
该实施例中,常规字体笔画是指平时所见的汉字笔画 。
上述技术方案的有益效果是:通过对图片进行区域化处理,并对处理后的图片进行嵌套结构提取,根据各个嵌套结构之间的关系构建图层嵌套树,可以快速对图片中的嵌套关系做出判断,增强字符识别能力,提高人机交互体验感,为解决跨系统屏幕识别问题形成技术基础。
实施例2:
本发明提供一种基于图形嵌套关系的图层识别新方法,如图2所示,对图片进行区域化处理,获取处理后的图片,包括:
获取屏幕分辨率,根据屏幕分辨率获取像素总行数和像素总列数;
根据所述像素总行数和像素总列数确定多个坐标点;
获取所述多个坐标点上的像素向量;
根据所述像素向量创建像素集;
设定一个判定数字,并创建第一空集和第二空集;
在像素集中创建第一初始类集合并确定第一初始类集合的代表元;
将所述第一初始类集合中的元素放入第一空集,所述第一初始类集合的代表元中的元素放入到第二空集中;
其中,第一空集和第二空集中的元素按照两个维度变量的下标排列;
逐一取定像素集中的元素和第二空集中的元素,按照预设算法判定元素的计算结果是否小于等于所述判定数字,若满足,则将所述像素集中的元素和第二空集中的元素进行合并,若不满足,则创建第二初始类并进行重复判定直到满足计算结果;
当像素集中没有计算元素时,获取区域类。
该实施例中,假定屏幕的分辨率为,其中,/>是像素总列数,/>是像素总行数,假定/>
设定一个判定数字,空集/>
假定任意坐标点上的像素向量为/>,或简记为/>
创建像素集
创建初始类
是/>的代表元。
。其中,/>和/>中的元素按照两个维度变量的下标排列。
逐一取定
遍历,则令
中没有任何元素满足此条件,则创建一个新的初始类
直到,获得区域类/>
上述技术方案的有益效果是:通过屏幕分辨率确定多个坐标点,并获取坐标点上的像素向量,根据像素向量创建像素集,创建第一空集、第二空集和第一初始类集合并确定第一初始类集合的代表元,逐一取定像素集中的元素和第二空集中的元素进行计算,对计算结果进行判定,可以快速对图片进行区域化处理,同时更大程度的控制图片处理的范围和程度。
实施例3:
本发明提供一种基于图形嵌套关系的图层识别新方法,基于所述处理后的图片进行嵌套结构提取,包括:
基于所述区域类中取一个类,从所取的类中获取所有元素对应的第一坐标集的最大值;
从取的类中获取以第一坐标集最大值为第一坐标的所有元素的集合;
从所述所有元素的集合中获取所有元素对应的第二坐标的最大值;
基于所述第一坐标集的最大值、第二坐标的最大值和多个坐标点上的像素向量构建所取类的基点;
根据所取类的基点构建嵌套元素集合;
根据嵌套元素集合生成若干个嵌套结构元素集合。
该实施例中,区域类是指具有区域特征的连成一片的区域。
该实施例中,从区域类中取一个类/>,/>是代表元。
中获取所有元素对应的第一坐标集/>的最大值/>
中获取以/>为第一坐标的所有元素的集合/>
中获取所有元素对应的第二坐标/>的最大值/>
构造的基点
构造集合,令
依托的元素/>获得了若干/>,所有的/>构成集合
上述技术方案的有益效果是:通过获取所取的类中所有元素对应的第一坐标集的最大值,从取的类中获取以第一坐标集最大值为第一坐标的所有元素的集合,所有元素的集合中获取所有元素对应的第二坐标的最大值,根据第一坐标集的最大值、第二坐标的最大值和多个坐标点上的像素向量构建所取类的基点,可以准确的确定出若干个嵌套结构元素集合,根据集合能够对图片的嵌套结构做出更精准的判断。
实施例4:
本发明提供一种基于图形嵌套关系的图层识别新方法,如图2所示,根据提取结果识别出各个嵌套结构之间的关系,包括:
S01:根据嵌套结构元素集合中各元素之间的包含关系将所有元素进行分类;
S02:根据分类结果确定各类元素之间的相对关系;
S03:获取每个嵌套结构元素的包含元素;
S04:根据各类元素之间的相对关系和每个嵌套结构元素的包含元素确定各个嵌套结构之间的关系。
该实施例中,任取,建立类/>,使得/>
构造
任取,若/>,对于任意/>,令:
是/>中所有元素第一坐标的最大值;/>是/>中所有元素第一坐标的最小值;/>是/>中所有元素第二坐标的最大值;/>是/>中所有元素第二坐标的最小值;
是/>中所有元素第一坐标的最大值;/>是/>中所有元素第一坐标的最小值;/>是/>中所有元素第二坐标的最大值;/>是/>中所有元素第二坐标的最小值。
若以下两组条件必居其一,则令
若不满足前述条件,则
建立类,使得/>,并令/>
两组条件是:
由此,我们依托区域类集合和集合/>,获得了图形嵌套关系。上述技术方案的有益效果是:对嵌套结构元素中的元素进行分类,确定各类元素之间的相对关系,获取每个嵌套结构元素的包含元素,可以确定各个嵌套结构之间的关系加快对图层和文字的识别。
实施例5:
本发明提供一种基于图形嵌套关系的图层识别新方法,基于所述各个嵌套结构之间的关系构建图层嵌套树,包括:
根据每个嵌套结构的划分元素按照各个嵌套结构之间的关系连接成图层嵌套树;
其中,树的每个节点是一个图层。
该实施例中,图层嵌套树是指表示各种嵌套结构的树状图。
上述技术方案的有益效果是:通过构建图层嵌套树,可以准确的判断出每个图层之间的关系,也可以清晰的展现出图层的嵌套结构,方便对图层进行识别。
实施例6:
本发明提供一种基于图形嵌套关系的图层识别新方法,对图片进行区域化处理之前,还包括:
对图片进行遮挡判断,根据判断结果选择性的对图片进行优化,获取优化后的图片;
将优化后的图片作为图片进行区域化处理的参考图片。
该实施例中,对图片的遮挡物进行判断,若图片的遮挡物为人为,比如书、杯子遮挡住图片。则直接将遮挡物进行移出。
若遮挡物为阴影,则需要进行对图片进行ps处理。
上述技术方案的有益效果是:通过对图片进行遮挡判断,并根据判断结果对图片进行优化,可以使图片显示更清晰,后期图层和文字的识别也更加精准。
实施例7:
本发明提供一种基于图形嵌套关系的图层识别新方法,基于所述图层嵌套树进行常规字体笔画提取,包括:
创建第一集合和第二集合;
将嵌套元素集合中的所有元素的极小元存入到第一集合中,所有元素的次极小元存入到第二集合中;
任取某元素在第二集合中的第一次极小元,并获取该元素在第一集合中的第一极小元;
计算第一次极小元在图片上围起来的第一面积和第一极小元在图片上围起来的第二面积;
判断第二面积与第一面积之间的比值是否小于预设的参数范围内,若小于,则保留该元素在第二集合中的第一次极小元,否则,在第二集合中删除该元素的第一次极小元且从第一集合中删除该元素的第一极小元;
其中,剩余的第一集合中的子集为常规字体笔画。
该实施例中,创建集合和/>,获取嵌套元素集合中的元素/>,遍历,取/>的极小元/>,遍历/>,取/>的次极小元/>存入,任取/>,以及与之对应的/>,计算/>在图片上围起来的面积,分别记为/>小于一个恰当的(大于0小于1)的参数,则在/>中保留/>;若否,则从/>中删除/>,且从/>中删除/>对应的/>
常规字体笔画对应的是的子集。
上述技术方案的有益效果是:通过获取元素极小元和次极小元之间的比值,判断是否保留该元素,可以快速使满足条件的元素保留下来,避免出现误差,使常规字体笔画识别不完整。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种基于图形嵌套关系的图层识别新方法,其特征在于,该方法包括:
步骤1:对图片进行区域化处理,获取处理后的图片;
步骤2:基于所述处理后的图片进行嵌套结构提取;
步骤3:根据提取结果识别出各个嵌套结构之间的关系;
步骤4:基于所述各个嵌套结构之间的关系构建图层嵌套树;
步骤5:基于所述图层嵌套树进行常规字体笔画提取。
2.根据权利要求1所述的基于图形嵌套关系的图层识别新方法,其特征在于,对图片进行区域化处理,获取处理后的图片,包括:
获取屏幕分辨率,根据屏幕分辨率获取像素总行数和像素总列数;
根据所述像素总行数和像素总列数确定多个坐标点;
获取所述多个坐标点上的像素向量;
根据所述像素向量创建像素集;
设定一个判定数字,并创建第一空集和第二空集;
在像素集中创建第一初始类集合并确定第一初始类集合的代表元;
将所述第一初始类集合中的元素放入第一空集,所述第一初始类集合的代表元中的元素放入到第二空集中;
其中,第一空集和第二空集中的元素按照两个维度变量的下标排列;
逐一取定像素集中的元素和第二空集中的元素,按照预设算法判定元素的计算结果是否小于等于所述判定数字,若满足,则将所述像素集中的元素和第二空集中的元素进行合并,若不满足,则创建第二初始类并进行重复判定直到满足计算结果;
当像素集中没有计算元素时,获取区域类。
3.根据权利要求2所述的基于图形嵌套关系的图层识别新方法,其特征在于,基于所述处理后的图片进行嵌套结构提取,包括:
基于所述区域类中取一个类,从所取的类中获取所有元素对应的第一坐标集的最大值;
从取的类中获取以第一坐标集最大值为第一坐标的所有元素的集合;
从所述所有元素的集合中获取所有元素对应的第二坐标的最大值;
基于所述第一坐标集的最大值、第二坐标的最大值和多个坐标点上的像素向量构建所取类的基点;
根据所取类的基点构建嵌套元素集合;
根据嵌套元素集合生成若干个嵌套结构元素集合。
4.根据权利要求3所述的基于图形嵌套关系的图层识别新方法,其特征在于,根据提取结果识别出各个嵌套结构之间的关系,包括:
根据嵌套结构元素集合中各元素之间的包含关系将所有元素进行分类;
根据分类结果确定各类元素之间的相对关系;
获取每个嵌套结构元素的包含元素;
根据各类元素之间的相对关系和每个嵌套结构元素的包含元素确定各个嵌套结构之间的关系。
5.根据权利要求1所述的基于图形嵌套关系的图层识别新方法,其特征在于,基于所述各个嵌套结构之间的关系构建图层嵌套树,包括:
根据每个嵌套结构的划分元素按照各个嵌套结构之间的关系连接成树状结构;
其中,树的每个节点是一个图层。
6.根据权利要求1所述的基于图形嵌套关系的图层识别新方法,其特征在于,对图片进行区域化处理之前,还包括:
对图片进行遮挡判断,根据判断结果选择性的对图片进行优化,获取优化后的图片;
将优化后的图片作为图片进行区域化处理的参考图片。
7.根据权利要求1所述的基于图形嵌套关系的图层识别新方法,其特征在于,基于所述图层嵌套树进行常规字体笔画提取,包括:
创建第一集合和第二集合;
将嵌套元素集合中的所有元素的极小元存入到第一集合中,所有元素的次极小元存入到第二集合中;
任取某元素在第二集合中的第一次极小元,并获取该元素在第一集合中的第一极小元;
计算第一次极小元在图片上围起来的第一面积和第一极小元在图片上围起来的第二面积;
判断第二面积与第一面积之间的比值是否小于预设的参数范围内,若小于,则保留该元素在第二集合中的第一次极小元,否则,在第二集合中删除该元素的第一次极小元且从第一集合中删除该元素的第一极小元;
其中,剩余的第一集合中的子集为常规字体笔画。
CN202310806871.1A 2023-07-04 2023-07-04 一种基于图形嵌套关系的图层识别新方法 Active CN116524529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310806871.1A CN116524529B (zh) 2023-07-04 2023-07-04 一种基于图形嵌套关系的图层识别新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310806871.1A CN116524529B (zh) 2023-07-04 2023-07-04 一种基于图形嵌套关系的图层识别新方法

Publications (2)

Publication Number Publication Date
CN116524529A true CN116524529A (zh) 2023-08-01
CN116524529B CN116524529B (zh) 2023-10-27

Family

ID=87392562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310806871.1A Active CN116524529B (zh) 2023-07-04 2023-07-04 一种基于图形嵌套关系的图层识别新方法

Country Status (1)

Country Link
CN (1) CN116524529B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03194594A (ja) * 1989-12-25 1991-08-26 Nec Corp ストロークフォントデータの登録管理方式
CN102663388A (zh) * 2012-03-27 2012-09-12 复旦大学 从背景图片中对手写体字符进行分割的方法
WO2015183015A1 (ko) * 2014-05-30 2015-12-03 삼성에스디에스 주식회사 문자 인식 방법 및 그 장치
CN109784146A (zh) * 2018-12-05 2019-05-21 广州企图腾科技有限公司 一种字体种类识别方法、电子设备、存储介质
WO2019192397A1 (zh) * 2018-04-04 2019-10-10 华中科技大学 一种任意形状的场景文本端到端识别方法
WO2020248879A1 (zh) * 2019-06-11 2020-12-17 腾讯科技(深圳)有限公司 动画数据编码、解码方法、装置、存储介质和计算机设备
CN112686243A (zh) * 2020-12-29 2021-04-20 平安普惠企业管理有限公司 智能识别图片文字的方法、装置、计算机设备及存储介质
CN114241490A (zh) * 2021-01-04 2022-03-25 南京华苏科技有限公司 基于笔画扰动与后处理的手写体识别模型性能的提升方法
CN115908648A (zh) * 2023-02-23 2023-04-04 北京泽桥医疗科技股份有限公司 一种基于画面识别的医学三维动画嵌入系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03194594A (ja) * 1989-12-25 1991-08-26 Nec Corp ストロークフォントデータの登録管理方式
CN102663388A (zh) * 2012-03-27 2012-09-12 复旦大学 从背景图片中对手写体字符进行分割的方法
WO2015183015A1 (ko) * 2014-05-30 2015-12-03 삼성에스디에스 주식회사 문자 인식 방법 및 그 장치
WO2019192397A1 (zh) * 2018-04-04 2019-10-10 华中科技大学 一种任意形状的场景文本端到端识别方法
CN109784146A (zh) * 2018-12-05 2019-05-21 广州企图腾科技有限公司 一种字体种类识别方法、电子设备、存储介质
WO2020248879A1 (zh) * 2019-06-11 2020-12-17 腾讯科技(深圳)有限公司 动画数据编码、解码方法、装置、存储介质和计算机设备
CN112686243A (zh) * 2020-12-29 2021-04-20 平安普惠企业管理有限公司 智能识别图片文字的方法、装置、计算机设备及存储介质
CN114241490A (zh) * 2021-01-04 2022-03-25 南京华苏科技有限公司 基于笔画扰动与后处理的手写体识别模型性能的提升方法
CN115908648A (zh) * 2023-02-23 2023-04-04 北京泽桥医疗科技股份有限公司 一种基于画面识别的医学三维动画嵌入系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李庆佑;刘宏申;李兴;: "联机手写连笔字符识别特征提取算法优化", 人类工效学, no. 05 *
赵青;唐英敏;: "基于图形识别的汉字笔画分类方法", 计算机技术与发展, no. 10 *

Also Published As

Publication number Publication date
CN116524529B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN104871180B (zh) 用于ocr的基于文本图像质量的反馈
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
JP2021517330A (ja) 画像中の物体を識別するための方法、及び当該方法を実施するためのモバイル装置
CN109543595B (zh) 基于深度可分离卷积神经网络的电线的训练方法和检测方法
JP5777367B2 (ja) パターン識別装置、パターン識別方法及びプログラム
CN110569905A (zh) 基于生成对抗网络和注意力网络的细粒度图像分类方法
CN109165658B (zh) 一种基于Faster-RCNN的强负样本水下目标检测方法
JP4558232B2 (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Dewangan Importance & applications of digital image processing
CN111461131A (zh) 身份证号码信息识别方法、装置、设备及存储介质
JPH08508128A (ja) 分布マップを用いる画像の分類方法及び装置
CN111144413A (zh) 虹膜定位方法及计算机可读存储介质
CN116524529B (zh) 一种基于图形嵌套关系的图层识别新方法
Youlian et al. Face detection method using template feature and skin color feature in rgb color space
CN112926667A (zh) 深度融合边缘与高层特征的显著性目标检测方法及装置
JP2018152026A (ja) 文字認識方法及びコンピュータプログラム
Dinç et al. Super-thresholding: Supervised thresholding of protein crystal images
CN109800758A (zh) 一种极大值区域检测的自然场景文字检测方法
CN112861860B (zh) 一种基于上下边界提取的自然场景下文字检测方法
Debroutelle et al. Automatic classification of ceramic sherds with relief motifs
Jia et al. Grayscale-projection based optimal character segmentation for camera-captured faint text recognition
JP2011170554A (ja) 物体認識装置、物体認識方法及び物体認識プログラム
EP3702958A1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
CN109871910A (zh) 一种手写字符识别方法及装置
JP7277879B2 (ja) ナンバプレート認識プログラム及びナンバプレート認識装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant