CN112116611B - 一种书脊分割与文字识别系统及方法 - Google Patents

一种书脊分割与文字识别系统及方法 Download PDF

Info

Publication number
CN112116611B
CN112116611B CN202010910143.1A CN202010910143A CN112116611B CN 112116611 B CN112116611 B CN 112116611B CN 202010910143 A CN202010910143 A CN 202010910143A CN 112116611 B CN112116611 B CN 112116611B
Authority
CN
China
Prior art keywords
line
spine
image
rotated
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010910143.1A
Other languages
English (en)
Other versions
CN112116611A (zh
Inventor
孙大洋
许文巍
张有丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202010910143.1A priority Critical patent/CN112116611B/zh
Publication of CN112116611A publication Critical patent/CN112116611A/zh
Application granted granted Critical
Publication of CN112116611B publication Critical patent/CN112116611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/60Rotation of a whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/181Segmentation; Edge detection involving edge growing; involving edge linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本发明提出了一种书脊分割与文字识别方法,包括:步骤一、利用图像采集系统获取书脊图像image;步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;使用快速线检测算法对分割后的单书脊图像imgi进行拟合,对单个书脊图像和直线组进行透射旋转变换;使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;使用文字区域对旋转直线组进行滤波,去除与文字区域相交的直线;保留识别结果;步骤三、对书脊的文字识别结果进行数据库匹配;步骤四、存储识别结果,按标记显示书脊图像。

Description

一种书脊分割与文字识别系统及方法
技术领域
本发明专利属于图书馆馆藏书目管理领域,具体涉及一种书脊区域分割与文字识别系统及方法。
背景技术
计算机视觉是指利用摄像头和处理器对对象特征进行识别,提取和跟踪,最终,经过人性化处理获得所需的图像信息。而近几年来,作为机器学习中发展最为迅速的一个领域,深度学习为计算机视觉带来了更加广阔的应用和发展前景。图像处理是深度学习最早尝试应用的领域。它通过建立起与大脑神经网络相似的分层模型,逐层提取输入图像信息的特征映射,建立起从低级数据信息到高级语义的对应关系,最终实现了对图像的智能化处理。现已广泛应用在手写识别,证件信息审核、车牌识别等领域,其核心任务是文字检测和文字识别。
在现有图书馆书籍管理系统中,图书管理还是大量依赖于人工,而基于深度学习的整体书籍管理解决方案目前还没有人提出,书脊分割与文字识别的主要问题是如何快速准确地对书脊进行分割,对于图书馆场景中的各种复杂情况,书脊分割需要有较好的稳定性,采用深度学习的方式可以快速地进行书脊分割,然而由于照片拍摄的透射效果使得即使是摆正的书脊,也会出现一定的倾斜角度,导致深度学习的书脊分割结果会包含临近书脊的文字信息,对文字识别产生噪声影响,而采用传统方式进行书脊分割,速度与稳定性方面不尽如人意。因此如何快速准确地进行书脊分割是书脊文字识别的重点和难点。
发明内容:
本发明针对上述现有技术中存在的诸多技术问题,对书脊文本的检测进行了系统的设计,真正达到了书脊文本检测的应用标准。本发明旨在提供一套高效且易于维护的书脊识别系统,提高图书管理的智能化管理水平。
书脊分割与文字识别方法,包括:
步骤一、利用图像采集系统获取书脊图像image;
步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果;
步骤三、对书脊的文字识别结果进行数据库匹配;
步骤四、存储识别结果,按标记显示书脊图像。
进一步地,所述使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines的具体步骤如下:
步骤1:调用快速线检测得到线检测结果lines;
步骤2:使用线长阈值MinLength与角度阈值slantAngle对线检测结果lines进行滤波得到滤波线组sortedlines,滤除长度小于线长阈值MinLength,角度小于角度阈值slantAngle的线;
步骤3:对滤波线组sortedlines按照线段首点的横坐标排序;
步骤4:对滤波线组sortedlines中所有未进行线拟合的线linei进行如下操作:
a)以线linei初始化拟合线段linetmp,标记线linei为已拟合;
b)遍历与线linei距离相差小于10*MinLength的线linej,如果线linej两端点与拟合线段linetmp的距离均小于DisThreshold,则将线linej与线linei进行拟合,取线linej与线linej的最远端点更新拟合线段linetmp,标记线linej为已拟合;
c)如果拟合线段长度大于LineLength,将线拟合结果linetmp加入到拟合线段列表中;
步骤5:返回拟合线段列表。
一种书脊区域分割与文字识别系统,实现所述的书脊分割与文字识别方法,该系统包括:
图像采集系统,用于采集图书的书脊图像,并将采集到的书脊图像传输给图像分析系统;
图像分析系统,用于分析和处理图书的书脊图像,利用神经网络DarkNet框架进行书脊分割、记录坐标并保存分割的图像以及按照识别结果类型进行不同颜色的书脊框选显示;
文字识别系统,利用卷积递归神经网络CRNN对分割后的书脊进行文字区域识别及文字检测;
数据库交互系统,用于将图像分析系统得到的图像位置数据以及文字识别系统识别的数据与图书馆数据库做比对,并将比对结果恢复为可交互图像,存入数据库供管理员进行图书管理。
附图说明
附图1为本系统的总体流程;
附图2为书脊摆正、裁剪、文字识别的详细流程图;
附图3为线拟合流程;
附图4为书脊图像;
附图5为书脊分割结果;
附图6a和6b为书脊的文字识别结果;
附图7为数据库比对及图像恢复结果;
具体实施方式
书脊分割与文字识别方法,包括:步骤一、利用图像采集系统获取书脊图像image;步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果。步骤三、对书脊的文字识别结果进行数据库匹配;步骤四、存储识别结果,按标记显示书脊图像。
其中关于线拟合算法:由于快速线检测算法得到的线段往往是许多短线,并不能很好地标识书脊边界,因此我们用线拟合算法使书脊边界特征上的短线拟合成一条长直线,详细步骤如下:
2.调用快速线检测得到线检测结果lines;
3.使用线长阈值MinLength与角度阈值slantAngle对线检测结果lines进行滤波得到sortedlines,滤除长度小于MinLength,角度小于slantAngle的线;实际系统中,优选地,MinLength取3个像素,slantAngle取65度;
4.对sortedlines按照线段首点的横坐标排序;
5.对sortedlines中所有未进行线拟合的线linei
a)以linei初始化拟合线段linetmp,标记linei为已拟合;
b)遍历与linei距离相差小于10*MinLength的线linej,如果linej两端点与拟合线段linetmp的距离均小于拟合线距门限DisThreshold(系统中优选取值为3个像素),则将linej与linei进行拟合,取linej与linej的最远端点更新拟合线段linetmp,标记linej为已拟合;
c)如果拟合线段长度大于线长门限LineLength(系统中优选取值为图像高度的1/4),将线拟合结果linetmp加入到拟合线段列表中;
6.返回拟合线段列表
对于实现上述书脊分割与文字识别方法的系统(以下简称“本系统“):是基于神经网络框架DarkNet开源深度学习框架及卷积递归神经网络CRNN实现书脊分割与文字识别功能,本系统分为4个部分,分别为图像采集系统、图像分析系统、文字识别系统和数据库交互系统。
图像采集系统,用于采集图书的书脊图像,并将采集到的书脊图像传输给图像分析系统;图像分析系统,用于分析和处理图书图像,利用神经网络框架DarkNet进行书脊分割;文字识别系统,利用卷积递归神经网络CRNN对分割后的书脊进行文字区域识别及文字检测;数据库交互系统,用于将图像分析系统得到的图像位置数据以及文字识别系统识别的数据与图书馆数据库做比对,并将比对结果恢复为可交互图像,存入数据库供管理员进行图书管理。
本系统的有益效果为:可板载、可依赖手机APP实现,具有较强的可移植性,管理维护成本低。对于现有的图书管理系统,图书管理基本依靠人工进行,管理效率低,管理成本高,对于一些大规模图书馆,每天对所有图书进行一次管理的成本是无法接受的,本发明旨在提出一种高效简洁的图书管理方法,利用深度学习的技术自自动对图书进行识别和分类,在此基础上实现几乎实时的图书管理,这样可大大减少图书管理员的维护时间。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (2)

1.一种书脊分割与文字识别方法,其特征在于:包括:
步骤一、利用图像采集系统获取书脊图像image;
步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;具体步骤如下:
步骤1:调用快速线检测得到线检测结果lines;
步骤2:使用线长阈值MinLength与角度阈值slantAngle对线检测结果lines进行滤波得到滤波线组sortedlines,滤除长度小于线长阈值MinLength,角度小于角度阈值slantAngle的线;
步骤3:对滤波线组sortedlines按照线段首点的横坐标排序;
步骤4:对滤波线组sortedlines中所有未进行线拟合的线linei进行如下操作:
a)以线linei初始化拟合线段linetmp,标记线linei为已拟合;
b)遍历与线linei距离相差小于10*MinLength的线linej,如果线linej两端点与拟合线段linetmp的距离均小于拟合线距门限DisThreshold,则将线linej与线linei进行拟合,取线linej与线linej的最远端点更新拟合线段linetmp,标记线linej为已拟合;
c)如果拟合线段长度大于线长门限LineLength,将线拟合结果linetmp加入到拟合线段列表中;
步骤5:返回拟合线段列表;
(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果;
步骤三、对书脊的文字识别结果进行数据库匹配;
步骤四、存储识别结果,按标记显示书脊图像。
2.一种书脊区域分割与文字识别系统,实现权利要求1所述的书脊分割与文字识别方法,其特征在于,所述系统包括:
图像采集系统,用于采集图书的书脊图像,并将采集到的书脊图像传输给图像分析系统;
图像分析系统,用于分析和处理图书的书脊图像,利用神经网络DarkNet框架进行书脊分割、记录坐标并保存分割的图像以及按照识别结果类型进行不同颜色的书脊框选显示;
文字识别系统,利用卷积递归神经网络CRNN对分割后的书脊进行文字区域识别及文字检测;
数据库交互系统,用于将图像分析系统得到的图像位置数据以及文字识别系统识别的数据与图书馆数据库做比对,并将比对结果恢复为可交互图像,存入数据库供管理员进行图书管理。
CN202010910143.1A 2020-09-02 2020-09-02 一种书脊分割与文字识别系统及方法 Active CN112116611B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010910143.1A CN112116611B (zh) 2020-09-02 2020-09-02 一种书脊分割与文字识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010910143.1A CN112116611B (zh) 2020-09-02 2020-09-02 一种书脊分割与文字识别系统及方法

Publications (2)

Publication Number Publication Date
CN112116611A CN112116611A (zh) 2020-12-22
CN112116611B true CN112116611B (zh) 2022-07-05

Family

ID=73803864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010910143.1A Active CN112116611B (zh) 2020-09-02 2020-09-02 一种书脊分割与文字识别系统及方法

Country Status (1)

Country Link
CN (1) CN112116611B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001055965A2 (en) * 2000-01-27 2001-08-02 Koninklijke Philips Electronics N.V. Method and system for extracting spine geometrical data
CN102622593A (zh) * 2012-02-10 2012-08-01 北方工业大学 一种文本识别方法及系统
CN109241374A (zh) * 2018-06-07 2019-01-18 广东数相智能科技有限公司 一种图书信息库更新方法及图书馆书籍定位方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5841905A (en) * 1996-10-25 1998-11-24 Eastman Kodak Company Business form image identification using projected profiles of graphical lines and text string lines
CN102076068B (zh) * 2010-12-31 2013-04-24 吉林大学 一种基于空时调整的ZigBee节能方法
CN105701349B (zh) * 2016-01-13 2018-10-23 河海大学 非均匀颗粒离散单元快速线性接触检测方法
CN107220638A (zh) * 2017-07-03 2017-09-29 深圳市唯特视科技有限公司 一种基于深度学习卷积神经网络的车牌检测识别方法
CN107657230A (zh) * 2017-09-27 2018-02-02 安徽硕威智能科技有限公司 一种银行自助机器人文字识别装置
CN111091124B (zh) * 2019-12-04 2022-06-03 吉林大学 一种书脊文字识别方法
CN111310688B (zh) * 2020-02-25 2023-04-21 重庆大学 一种基于多角度成像的手指静脉识别方法
CN111368856B (zh) * 2020-03-16 2023-07-11 广东技术师范大学 一种基于视觉的图书盘点系统的书脊提取方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001055965A2 (en) * 2000-01-27 2001-08-02 Koninklijke Philips Electronics N.V. Method and system for extracting spine geometrical data
CN102622593A (zh) * 2012-02-10 2012-08-01 北方工业大学 一种文本识别方法及系统
CN109241374A (zh) * 2018-06-07 2019-01-18 广东数相智能科技有限公司 一种图书信息库更新方法及图书馆书籍定位方法

Also Published As

Publication number Publication date
CN112116611A (zh) 2020-12-22

Similar Documents

Publication Publication Date Title
CN111178236B (zh) 一种基于深度学习的车位检测方法
KR101589711B1 (ko) 비디오 데이터의 처리 방법 및 시스템
CN107239778B (zh) 高效准确的车牌识别方法
CN103208004A (zh) 票据信息区域自动识别和提取方法及设备
CN110659644B (zh) 书法单字的笔画自动提取方法
CN108805076A (zh) 环境影响评估报告书表格文字的提取方法及系统
CN104299009A (zh) 基于多特征融合的车牌字符识别方法
CN111062928A (zh) 一种医学ct图像中病变的识别方法
CN112651293B (zh) 一种公路违法设摊事件视频检测方法
CN116030396B (zh) 一种用于视频结构化提取的精确分割方法
Jiang et al. Baidu Meizu deep learning competition: Arithmetic operation recognition using end-to-end learning OCR technologies
CN110647824B (zh) 基于计算机视觉技术的增值税发票版面提取方法
CN116597270A (zh) 基于注意力机制集成学习网络的道路损毁目标检测方法
CN108537143A (zh) 一种基于重点区域特征比对的人脸识别方法与系统
CN112116611B (zh) 一种书脊分割与文字识别系统及方法
CN117119253B (zh) 一种针对目标对象的高质量视频抽帧方法
CN110634222B (zh) 一种银行票据信息识别方法
Rahaman et al. Lane detection for autonomous vehicle management: PHT approach
CN112508000A (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
US10991085B2 (en) Classifying panoramic images
CN116363655A (zh) 一种财务票据识别方法及系统
EP2048619A1 (en) Methods and systems for processing of video data
Jain et al. Number plate detection using drone surveillance
Weixing et al. Road extraction in vague images on gray scale consistency and improved MSR and DS evidence
CN114495044A (zh) 标牌识别方法、装置、计算机设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant