CN109034155A - 一种文字检测及识别的方法及系统 - Google Patents

一种文字检测及识别的方法及系统 Download PDF

Info

Publication number
CN109034155A
CN109034155A CN201810818780.9A CN201810818780A CN109034155A CN 109034155 A CN109034155 A CN 109034155A CN 201810818780 A CN201810818780 A CN 201810818780A CN 109034155 A CN109034155 A CN 109034155A
Authority
CN
China
Prior art keywords
model
text
picture
region
submodule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810818780.9A
Other languages
English (en)
Inventor
房鹏展
夏宇
吕晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuo Zhuo Network Technology Co Ltd
Original Assignee
Zhuo Zhuo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuo Zhuo Network Technology Co Ltd filed Critical Zhuo Zhuo Network Technology Co Ltd
Priority to CN201810818780.9A priority Critical patent/CN109034155A/zh
Publication of CN109034155A publication Critical patent/CN109034155A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种文字检测及识别的方法及系统,应用于识别图片中的文字信息,根据数据集中的文字区域位置,利用深度神经网络训练文字区域检测模型,然后根据文字区域图片与对应的文字信息训练文字识别模型,通过文字区域检测模型,可以检测出图片中的文字区域,通过文字识别模型,可以识别文字区域图片中的文字信息,两个模型结合起来可以实现图片中的文字信息识别。该方法和系统能够高效准确的完成图片文字检测及识别任务,能够应用到很多场景下的文字自动识别及录入工作,大大减少人力成本。

Description

一种文字检测及识别的方法及系统
技术领域
本发明涉及深度学习领域,特别是涉及一种文字检测及识别的方法及系统。
背景技术
在现实生活中,文字无处不在,但很多文字信息最初是通过拍摄以图片形式存在的,如身份证、银行卡、护照、名片、票据、书籍等等。而很多行业,如银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等,需要将这些图片中的文字信息进行录入,最开始的方法是采用人工录入的形式,人力成本很高,现在逐渐被自动化的文字信息录入替代。
文字识别往往包含两个比较关键的步骤,首先需要检测出文字所在的区域,传统的文字区域检测是通过腐蚀膨胀或基于OTSU等方法对图像进行分割,容易受图片噪声的影响;第二个就是文字区域图片的文字识别,传统的方法是先进行字符的切割,然后再进行文字的识别,准确率会受到切割的准确率影响,并且没有考虑文字之间的序列属性。
发明内容
本发明所要解决的技术问题是克服现有技术的不足,提供一种文字检测及识别的方法及系统。
为解决上述技术问题,本发明提供一种文字检测及识别的方法,其特征在于,包括如下步骤:
步骤一:准备数据集,包括文字图片中的文字区域位置、区域文字信息,数据集可以通过人工标注或者自动生成获得;
步骤二:根据文字区域位置,利用深度神经网络训练文字区域检测模型,并对模型进行评估及优化,对于文字区域检测模型,输入为一张图片Imagei,输出为{Regionik},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,Regionik表示第i个图片中第k个文字区域;利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={Regionik}。
步骤三:根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型,并对模型进行评估及优化;对于文字识别模型,输入为步骤二中得到的校正的文字区域图片CImageik,输出为对应的文字信息Stringik;利用深度神经网络训练一个文字区域检测模型,使得G(CImageik)=Stringik
步骤四:对于待识别的图片,调用F模型,得到t个文字区域矩形,并进行旋转校正,得到t个校正的文字区域图片;
步骤五:对于t个校正的文字区域图片,分别调用G模型,得到t个区域对应的文字信息,将这些信息返回。
所述步骤一中,数据集的采集是在文字区域采用矩形画框,实际存储采用矩形4个点的坐标,所述步骤二中,对于文字区域检测模型,输入为一张图片Imagei,输出{(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)分别表示第i个图片中第k个文字区域矩形的左上角、左下角、右下角、右上角的点的坐标,利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)}。
所述步骤二中,为了得到一个可用的文字区域检测模型,需要对模型进行测试,如果精度低于可用阈值Threshold(F),针对检测精度较低的图片类型,补充一些相关的图片到训练数据集中,重新训练,直到模型可用;另外,对每个Regionik进行倾斜矫正得到CImageik,根据4个点的坐标,可以计算矩形的倾斜角度θik,可以进行旋转Rotate(θik)校正到水平形状,Rotate(θik)表示对第i个图片的第k个文字区域旋转角度θik,得到CImageik
所述步骤三中,为了得到一个可用的文字识别模型,需要对模型进行测试,如果精度低于可用阈值Threshold(G),针对识别精度较低的文字,补充一些相关的文字图片到训练数据集中,重新训练,直到模型可用。
一种文字检测及识别的系统,其特征在于:包括数据源模块、模型训练模块、图片文字识别模块:
所述数据源模块,用于训练文字区域检测模型和文字识别模型所需要准备的数据集,主要包括:文字图片、文字区域位置、区域文字信息;
所述模型训练模块,利用深度神经网络训练文字区域检测及识别模型;其中包括四个子模块:文字区域检测模型训练子模块、文字区域检测模型子模块、文字识别模型训练子模块、文字识别模型子模块;所述文字区域检测模型训练子模块,是根据文字区域位置,利用深度神经网络训练文字区域检测模型;所述文字区域检测模型子模块,是对模型进行评估及优化,最终得到可用的文字区域检测模型;所述文字识别模型训练子模块,是根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型;所述文字识别模型子模块,是对模型进行评估及优化,最终得到可用的文字识别模型;
所述图片文字识别模块,提供文字识别的接口,接收待识别的图片,通过调用模型最终返回文字信息;其中包括五个子模块:待识别图片接收子模块、文字区域检测子模块、文字区域校正子模块、文字区域识别子模块、文字信息返回子模块;所述待识别图片接收子模块,用于接收待识别的图片信息;所述文字区域检测子模块,对于待识别的图片,调用文字区域检测模型,识别文字所在区域;所述文字区域校正子模块,根据文字区域的坐标位置计算该区域的倾斜角度,对文字区域进行校正;所述文字区域识别子模块,对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息;所述文字信息返回子模块,将最终识别的文字信息返回。
本发明所达到的有益效果:本发明针对文字检测及识别问题进行了方法和系统的设计,根据数据集中的文字区域位置,利用深度神经网络训练文字区域检测模型,然后根据文字区域图片与对应的文字信息训练文字识别模型。通过文字区域检测模型,可以检测出图片中的文字区域,通过文字识别模型,可以识别文字区域图片中的文字信息,两个模型结合起来可以实现图片中的文字信息识别。该方法和系统能够高效准确的完成图片文字检测及识别任务,能够应用到很多场景下的文字自动识别及录入工作,大大减少人力成本。
附图说明
图1为本发明的示例性实施例的方法流程简图;
图2为本发明的示例性实施例的系统结构示意图。
具体实施方式
下面结合附图和示例性实施例对本发明作进一步的说明:
参阅图1所示,本发明实施例的流程,具体步骤为:
步骤11:准备数据集,包括文字图片中的文字区域位置、区域文字信息。数据集有两个途径获得,第一个是人工对现有文字图片进行标注,对每一张图片标注出其文字区域位置、区域文字信息,但是因为深度学习需要的数据集非常庞大,因此此方法既耗时又耗费人力成本;第二个更常用的方法是,自动生成文字图片,也就是在随机的图片上随机生成文字,生成文字的同时记录下文字区域位置、区域文字信息。本实施例中,文字区域采用矩形画框,实际存储采用矩形4个点的坐标,通过第二个方法生成1千万张图片及对应的标签数据。
步骤12:根据文字区域位置,利用深度神经网络训练文字区域检测模型,并对模型进行评估及优化。本实施例中,对于文字区域检测模型,输入为一张图片Imagei,输出为{(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)分别表示第i个图片中第k个文字区域矩形的左上角、左下角、右下角、右上角的点的坐标。利用深度神经网络训练一个文字区域检测模型,使得
F(Imagei)={(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)}
为了得到一个可用的文字区域检测模型,我们需要对模型进行测试,如果精度低于可用阈值Threshold(F),针对检测精度较低的图片类型,补充一些相关的图片到训练数据集中,重新训练,直到模型可用。另外,根据4个点的坐标,可以计算矩形的倾斜角度θik,可以进行旋转Rotate(θik)校正到水平形状,Rotate(θik)表示对第i个图片的第k个文字区域旋转角度θik,得到CImageik
步骤13:根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型,并对模型进行评估及优化。本实施例中,对于文字识别模型,输入为步骤12中得到的校正的文字区域图片CImageik,输出为对应的文字信息Stringik。利用深度神经网络训练一个文字区域检测模型,使得G(CImageik)=Stringik
为了得到一个可用的文字识别模型,我们需要对模型进行测试,如果精度低于可用阈值Threshold(G),针对识别精度较低的文字,补充一些相关的文字图片到训练数据集中,重新训练,直到模型可用。
步骤14:对于待识别的图片,调用文字区域检测模型,识别文字所在区域,并提取文字区域图片并进行倾斜校正。本实施例中,对于待识别的图片,调用F模型,得到t个文字区域矩形,并进行旋转校正,得到t个校正的文字区域图片。
步骤15:对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息。本实施例中,对于t个校正的文字区域图片,分别调用G模型,得到t个区域对应的文字信息,将这些信息返回。
参阅图2所示,本发明实施例的系统结构,包括:数据源模块21、模型训练模块22、图片文字识别模块23。
数据源模块21,用于训练文字区域检测模型和文字识别模型所需要准备的数据集,主要包括:文字图片、文字区域位置、区域文字信息。
学员课程推荐模块22,利用深度神经网络训练文字区域检测及识别模型。其中包括四个子模块:文字区域检测模型训练子模块221、文字区域检测模型子模块222、文字识别模型训练子模块223、文字识别模型子模块224。
文字区域检测模型训练子模块221,是根据文字区域位置,利用深度神经网络训练文字区域检测模型。
文字区域检测模型子模块222,是对模型进行评估及优化,最终得到可用的文字区域检测模型。
文字识别模型训练子模块223,是根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型。
文字识别模型子模块224,是对模型进行评估及优化,最终得到可用的文字识别模型。
图片文字识别模块23,提供文字识别的接口,接收待识别的图片,通过调用模型最终返回文字信息。其中包括五个子模块:待识别图片接收子模块231、文字区域检测子模块232、文字区域校正子模块233、文字区域识别子模块234、文字信息返回子模块235。
待识别图片接收子模块231,用于接收待识别的图片信息。
文字区域检测子模块232,对于待识别的图片,调用文字区域检测模型,识别文字所在区域。
文字区域校正子模块233,根据文字区域的坐标位置计算该区域的倾斜角度,对文字区域进行校正。
文字区域识别子模块234,对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息。
文字信息返回子模块235,将最终识别的文字信息返回。
本发明主要用于提供一种文字检测及识别的方法及系统,根据数据集中的文字区域位置,利用深度神经网络训练文字区域检测模型,然后根据文字区域图片与对应的文字信息训练文字识别模型。通过文字区域检测模型,可以检测出图片中的文字区域,通过文字识别模型,可以识别文字区域图片中的文字信息,两个模型结合起来可以实现图片中的文字信息识别。该方法和系统能够高效准确的完成图片文字检测及识别任务,能够应用到很多场景下的文字自动识别及录入工作,大大减少人力成本。
以上实施例不以任何方式限定本发明,凡是对以上实施例以等效变换方式做出的其它改进与应用,都属于本发明的保护范围。

Claims (5)

1.一种文字检测及识别的方法,其特征在于,包括如下步骤:
步骤一:准备数据集,包括文字图片中的文字区域位置、区域文字信息,数据集可以通过人工标注或者自动生成获得;
步骤二:根据文字区域位置,利用深度神经网络训练文字区域检测模型,并对模型进行评估及优化,对于文字区域检测模型,输入为一张图片Imagei,输出为{Regionik},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,Regionik表示第i个图片中第k个文字区域;利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={Regionik}。
步骤三:根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型,并对模型进行评估及优化;对于文字识别模型,输入为步骤二中得到的校正的文字区域图片CImageik,输出为对应的文字信息Stringik;利用深度神经网络训练一个文字区域检测模型,使得G(CImageik)=Stringik
步骤四:对于待识别的图片,调用F模型,得到t个文字区域矩形,并进行旋转校正,得到t个校正的文字区域图片;
步骤五:对于t个校正的文字区域图片,分别调用G模型,得到t个区域对应的文字信息,将这些信息返回。
2.如权利要求1所述的一种文字检测及识别的方法,其特征在于:所述步骤一中,数据集的采集是在文字区域采用矩形画框,实际存储采用矩形4个点的坐标,所述步骤二中,对于文字区域检测模型,输入为一张图片Imagei,输出{(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)分别表示第i个图片中第k个文字区域矩形的左上角、左下角、右下角、右上角的点的坐标,利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)}。
3.如权利要求2所述的一种文字检测及识别的方法,其特征在于:所述步骤二中,为了得到一个可用的文字区域检测模型,需要对模型进行测试,如果精度低于可用阈值Threshold(F),针对检测精度较低的图片类型,补充一些相关的图片到训练数据集中,重新训练,直到模型可用;另外,对每个Regionik进行倾斜矫正得到CImageik,根据4个点的坐标,可以计算矩形的倾斜角度θik,可以进行旋转Rotate(θik)校正到水平形状,Rotate(θik)表示对第i个图片的第k个文字区域旋转角度θik,得到CImageik
4.如权利要求3所述的一种文字检测及识别的方法,其特征在于:所述步骤三中,为了得到一个可用的文字识别模型,需要对模型进行测试,如果精度低于可用阈值Threshold(G),针对识别精度较低的文字,补充一些相关的文字图片到训练数据集中,重新训练,直到模型可用。
5.一种根据权利要求1-4之一所述方法运行的文字检测及识别的系统,其特征在于:包括数据源模块、模型训练模块、图片文字识别模块:
所述数据源模块,用于训练文字区域检测模型和文字识别模型所需要准备的数据集,主要包括:文字图片、文字区域位置、区域文字信息;
所述模型训练模块,利用深度神经网络训练文字区域检测及识别模型;其中包括四个子模块:文字区域检测模型训练子模块、文字区域检测模型子模块、文字识别模型训练子模块、文字识别模型子模块;所述文字区域检测模型训练子模块,是根据文字区域位置,利用深度神经网络训练文字区域检测模型;所述文字区域检测模型子模块,是对模型进行评估及优化,最终得到可用的文字区域检测模型;所述文字识别模型训练子模块,是根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型;所述文字识别模型子模块,是对模型进行评估及优化,最终得到可用的文字识别模型;
所述图片文字识别模块,提供文字识别的接口,接收待识别的图片,通过调用模型最终返回文字信息;其中包括五个子模块:待识别图片接收子模块、文字区域检测子模块、文字区域校正子模块、文字区域识别子模块、文字信息返回子模块;所述待识别图片接收子模块,用于接收待识别的图片信息;所述文字区域检测子模块,对于待识别的图片,调用文字区域检测模型,识别文字所在区域;所述文字区域校正子模块,根据文字区域的坐标位置计算该区域的倾斜角度,对文字区域进行校正;所述文字区域识别子模块,对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息;所述文字信息返回子模块,将最终识别的文字信息返回。
CN201810818780.9A 2018-07-24 2018-07-24 一种文字检测及识别的方法及系统 Pending CN109034155A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810818780.9A CN109034155A (zh) 2018-07-24 2018-07-24 一种文字检测及识别的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810818780.9A CN109034155A (zh) 2018-07-24 2018-07-24 一种文字检测及识别的方法及系统

Publications (1)

Publication Number Publication Date
CN109034155A true CN109034155A (zh) 2018-12-18

Family

ID=64644633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810818780.9A Pending CN109034155A (zh) 2018-07-24 2018-07-24 一种文字检测及识别的方法及系统

Country Status (1)

Country Link
CN (1) CN109034155A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977957A (zh) * 2019-03-04 2019-07-05 苏宁易购集团股份有限公司 一种基于深度学习的发票识别方法及系统
CN110309796A (zh) * 2019-07-05 2019-10-08 上海中通吉网络技术有限公司 面单识别方法、装置和设备
CN110363196A (zh) * 2019-06-20 2019-10-22 吴晓东 一种倾斜文本的文字精准识别的方法
CN110490198A (zh) * 2019-08-12 2019-11-22 上海眼控科技股份有限公司 文本方向校正方法、装置、计算机设备和存储介质
CN110516554A (zh) * 2019-07-31 2019-11-29 杭州电子科技大学 一种多场景多字体中文文字检测识别方法
CN110659633A (zh) * 2019-08-15 2020-01-07 坎德拉(深圳)科技创新有限公司 图像文本信息的识别方法、装置以及存储介质
CN111242129A (zh) * 2020-01-03 2020-06-05 创新工场(广州)人工智能研究有限公司 一种用于端到端的文字检测与识别的方法和装置
CN111814539A (zh) * 2020-05-28 2020-10-23 平安科技(深圳)有限公司 基于红外光和紫外光的文字识别方法、装置和计算机设备
CN112905733A (zh) * 2021-02-02 2021-06-04 嘉应学院 一种基于ocr识别技术的图书保存方法、系统及装置
CN113298167A (zh) * 2021-06-01 2021-08-24 北京思特奇信息技术股份有限公司 一种基于轻量级神经网络模型的文字检测方法及系统
WO2021248912A1 (zh) * 2020-06-10 2021-12-16 深信服科技股份有限公司 一种图片审计方法、装置、计算设备及存储介质
CN115004247A (zh) * 2019-12-02 2022-09-02 尤帕斯公司 训练用于机器人过程自动化的光学字符检测和识别模型

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740774A (zh) * 2016-01-25 2016-07-06 浪潮软件股份有限公司 一种图像的文本区域定位方法及装置
CN105809164A (zh) * 2016-03-11 2016-07-27 北京旷视科技有限公司 文字识别方法和装置
CN106557768A (zh) * 2016-11-25 2017-04-05 北京小米移动软件有限公司 对图片中的文字进行识别的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740774A (zh) * 2016-01-25 2016-07-06 浪潮软件股份有限公司 一种图像的文本区域定位方法及装置
CN105809164A (zh) * 2016-03-11 2016-07-27 北京旷视科技有限公司 文字识别方法和装置
CN106557768A (zh) * 2016-11-25 2017-04-05 北京小米移动软件有限公司 对图片中的文字进行识别的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHRISTIAN BARTZ 等: "STN-OCR: A single Neural Network for Text Detection and Text Recognition", 《COMPUTER VISION AND PATTERN RECOGNITION》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977957A (zh) * 2019-03-04 2019-07-05 苏宁易购集团股份有限公司 一种基于深度学习的发票识别方法及系统
CN110363196B (zh) * 2019-06-20 2022-02-08 吴晓东 一种倾斜文本的文字精准识别的方法
CN110363196A (zh) * 2019-06-20 2019-10-22 吴晓东 一种倾斜文本的文字精准识别的方法
CN110309796A (zh) * 2019-07-05 2019-10-08 上海中通吉网络技术有限公司 面单识别方法、装置和设备
CN110516554A (zh) * 2019-07-31 2019-11-29 杭州电子科技大学 一种多场景多字体中文文字检测识别方法
CN110490198A (zh) * 2019-08-12 2019-11-22 上海眼控科技股份有限公司 文本方向校正方法、装置、计算机设备和存储介质
CN110659633A (zh) * 2019-08-15 2020-01-07 坎德拉(深圳)科技创新有限公司 图像文本信息的识别方法、装置以及存储介质
CN115004247A (zh) * 2019-12-02 2022-09-02 尤帕斯公司 训练用于机器人过程自动化的光学字符检测和识别模型
CN111242129A (zh) * 2020-01-03 2020-06-05 创新工场(广州)人工智能研究有限公司 一种用于端到端的文字检测与识别的方法和装置
WO2021139341A1 (zh) * 2020-05-28 2021-07-15 平安科技(深圳)有限公司 基于红外光和紫外光的文字识别方法、装置和计算机设备
CN111814539A (zh) * 2020-05-28 2020-10-23 平安科技(深圳)有限公司 基于红外光和紫外光的文字识别方法、装置和计算机设备
CN111814539B (zh) * 2020-05-28 2023-07-21 平安科技(深圳)有限公司 基于红外光和紫外光的文字识别方法、装置和计算机设备
WO2021248912A1 (zh) * 2020-06-10 2021-12-16 深信服科技股份有限公司 一种图片审计方法、装置、计算设备及存储介质
CN112905733A (zh) * 2021-02-02 2021-06-04 嘉应学院 一种基于ocr识别技术的图书保存方法、系统及装置
CN113298167A (zh) * 2021-06-01 2021-08-24 北京思特奇信息技术股份有限公司 一种基于轻量级神经网络模型的文字检测方法及系统

Similar Documents

Publication Publication Date Title
CN109034155A (zh) 一种文字检测及识别的方法及系统
CN109840519B (zh) 一种自适应的智能单据识别录入装置及其使用方法
CN106485243B (zh) 一种票据识别纠错方法及装置
CN109308476B (zh) 票据信息处理方法、系统及计算机可读存储介质
CN107067044B (zh) 一种财务报销全票据智能审核系统
Sun et al. Template matching-based method for intelligent invoice information identification
CN108009602A (zh) 一种基于条码识别的图书定位方法、电子设备及存储介质
CN109977957A (zh) 一种基于深度学习的发票识别方法及系统
CN110704633A (zh) 命名实体识别方法、装置、计算机设备及存储介质
CN107818322A (zh) 一种用于车辆年检的车辆vin码篡改检测系统及方法
CN109214382A (zh) 一种基于crnn的票据信息识别算法、设备及存储介质
CN111652232B (zh) 票据识别方法及装置、电子设备和计算机可读存储介质
CN109359696A (zh) 一种车款识别方法、系统及存储介质
CN110674815A (zh) 基于深度学习关键点检测的发票图像畸变校正方法
CN110162599A (zh) 招聘面试方法、装置及计算机可读存储介质
CN109815765A (zh) 一种提取含有二维码的营业执照信息的方法及装置
CN110348441A (zh) 增值税发票识别方法、装置、计算机设备及存储介质
CN110532855A (zh) 基于深度学习的自然场景证件图像文字识别方法
CN110427853B (zh) 一种智能票据信息提取处理的方法
CN109002768A (zh) 基于神经网络文本检测识别的医疗票据类文字提取方法
CN109446345A (zh) 核电文件校验处理方法以及系统
CN109919076A (zh) 基于深度学习的确认ocr识别结果可靠性的方法及介质
CN109684957A (zh) 一种自动按照纸质表单展现系统数据的方法及系统
CN112883926B (zh) 表格类医疗影像的识别方法及装置
CN108364037A (zh) 识别手写汉字的方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication