CN109034155A - 一种文字检测及识别的方法及系统 - Google Patents
一种文字检测及识别的方法及系统 Download PDFInfo
- Publication number
- CN109034155A CN109034155A CN201810818780.9A CN201810818780A CN109034155A CN 109034155 A CN109034155 A CN 109034155A CN 201810818780 A CN201810818780 A CN 201810818780A CN 109034155 A CN109034155 A CN 109034155A
- Authority
- CN
- China
- Prior art keywords
- model
- text
- picture
- region
- submodule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种文字检测及识别的方法及系统,应用于识别图片中的文字信息,根据数据集中的文字区域位置,利用深度神经网络训练文字区域检测模型,然后根据文字区域图片与对应的文字信息训练文字识别模型,通过文字区域检测模型,可以检测出图片中的文字区域,通过文字识别模型,可以识别文字区域图片中的文字信息,两个模型结合起来可以实现图片中的文字信息识别。该方法和系统能够高效准确的完成图片文字检测及识别任务,能够应用到很多场景下的文字自动识别及录入工作,大大减少人力成本。
Description
技术领域
本发明涉及深度学习领域,特别是涉及一种文字检测及识别的方法及系统。
背景技术
在现实生活中,文字无处不在,但很多文字信息最初是通过拍摄以图片形式存在的,如身份证、银行卡、护照、名片、票据、书籍等等。而很多行业,如银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等,需要将这些图片中的文字信息进行录入,最开始的方法是采用人工录入的形式,人力成本很高,现在逐渐被自动化的文字信息录入替代。
文字识别往往包含两个比较关键的步骤,首先需要检测出文字所在的区域,传统的文字区域检测是通过腐蚀膨胀或基于OTSU等方法对图像进行分割,容易受图片噪声的影响;第二个就是文字区域图片的文字识别,传统的方法是先进行字符的切割,然后再进行文字的识别,准确率会受到切割的准确率影响,并且没有考虑文字之间的序列属性。
发明内容
本发明所要解决的技术问题是克服现有技术的不足,提供一种文字检测及识别的方法及系统。
为解决上述技术问题,本发明提供一种文字检测及识别的方法,其特征在于,包括如下步骤:
步骤一:准备数据集,包括文字图片中的文字区域位置、区域文字信息,数据集可以通过人工标注或者自动生成获得;
步骤二:根据文字区域位置,利用深度神经网络训练文字区域检测模型,并对模型进行评估及优化,对于文字区域检测模型,输入为一张图片Imagei,输出为{Regionik},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,Regionik表示第i个图片中第k个文字区域;利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={Regionik}。
步骤三:根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型,并对模型进行评估及优化;对于文字识别模型,输入为步骤二中得到的校正的文字区域图片CImageik,输出为对应的文字信息Stringik;利用深度神经网络训练一个文字区域检测模型,使得G(CImageik)=Stringik;
步骤四:对于待识别的图片,调用F模型,得到t个文字区域矩形,并进行旋转校正,得到t个校正的文字区域图片;
步骤五:对于t个校正的文字区域图片,分别调用G模型,得到t个区域对应的文字信息,将这些信息返回。
所述步骤一中,数据集的采集是在文字区域采用矩形画框,实际存储采用矩形4个点的坐标,所述步骤二中,对于文字区域检测模型,输入为一张图片Imagei,输出{(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)分别表示第i个图片中第k个文字区域矩形的左上角、左下角、右下角、右上角的点的坐标,利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)}。
所述步骤二中,为了得到一个可用的文字区域检测模型,需要对模型进行测试,如果精度低于可用阈值Threshold(F),针对检测精度较低的图片类型,补充一些相关的图片到训练数据集中,重新训练,直到模型可用;另外,对每个Regionik进行倾斜矫正得到CImageik,根据4个点的坐标,可以计算矩形的倾斜角度θik,可以进行旋转Rotate(θik)校正到水平形状,Rotate(θik)表示对第i个图片的第k个文字区域旋转角度θik,得到CImageik。
所述步骤三中,为了得到一个可用的文字识别模型,需要对模型进行测试,如果精度低于可用阈值Threshold(G),针对识别精度较低的文字,补充一些相关的文字图片到训练数据集中,重新训练,直到模型可用。
一种文字检测及识别的系统,其特征在于:包括数据源模块、模型训练模块、图片文字识别模块:
所述数据源模块,用于训练文字区域检测模型和文字识别模型所需要准备的数据集,主要包括:文字图片、文字区域位置、区域文字信息;
所述模型训练模块,利用深度神经网络训练文字区域检测及识别模型;其中包括四个子模块:文字区域检测模型训练子模块、文字区域检测模型子模块、文字识别模型训练子模块、文字识别模型子模块;所述文字区域检测模型训练子模块,是根据文字区域位置,利用深度神经网络训练文字区域检测模型;所述文字区域检测模型子模块,是对模型进行评估及优化,最终得到可用的文字区域检测模型;所述文字识别模型训练子模块,是根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型;所述文字识别模型子模块,是对模型进行评估及优化,最终得到可用的文字识别模型;
所述图片文字识别模块,提供文字识别的接口,接收待识别的图片,通过调用模型最终返回文字信息;其中包括五个子模块:待识别图片接收子模块、文字区域检测子模块、文字区域校正子模块、文字区域识别子模块、文字信息返回子模块;所述待识别图片接收子模块,用于接收待识别的图片信息;所述文字区域检测子模块,对于待识别的图片,调用文字区域检测模型,识别文字所在区域;所述文字区域校正子模块,根据文字区域的坐标位置计算该区域的倾斜角度,对文字区域进行校正;所述文字区域识别子模块,对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息;所述文字信息返回子模块,将最终识别的文字信息返回。
本发明所达到的有益效果:本发明针对文字检测及识别问题进行了方法和系统的设计,根据数据集中的文字区域位置,利用深度神经网络训练文字区域检测模型,然后根据文字区域图片与对应的文字信息训练文字识别模型。通过文字区域检测模型,可以检测出图片中的文字区域,通过文字识别模型,可以识别文字区域图片中的文字信息,两个模型结合起来可以实现图片中的文字信息识别。该方法和系统能够高效准确的完成图片文字检测及识别任务,能够应用到很多场景下的文字自动识别及录入工作,大大减少人力成本。
附图说明
图1为本发明的示例性实施例的方法流程简图;
图2为本发明的示例性实施例的系统结构示意图。
具体实施方式
下面结合附图和示例性实施例对本发明作进一步的说明:
参阅图1所示,本发明实施例的流程,具体步骤为:
步骤11:准备数据集,包括文字图片中的文字区域位置、区域文字信息。数据集有两个途径获得,第一个是人工对现有文字图片进行标注,对每一张图片标注出其文字区域位置、区域文字信息,但是因为深度学习需要的数据集非常庞大,因此此方法既耗时又耗费人力成本;第二个更常用的方法是,自动生成文字图片,也就是在随机的图片上随机生成文字,生成文字的同时记录下文字区域位置、区域文字信息。本实施例中,文字区域采用矩形画框,实际存储采用矩形4个点的坐标,通过第二个方法生成1千万张图片及对应的标签数据。
步骤12:根据文字区域位置,利用深度神经网络训练文字区域检测模型,并对模型进行评估及优化。本实施例中,对于文字区域检测模型,输入为一张图片Imagei,输出为{(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)分别表示第i个图片中第k个文字区域矩形的左上角、左下角、右下角、右上角的点的坐标。利用深度神经网络训练一个文字区域检测模型,使得
F(Imagei)={(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)}
为了得到一个可用的文字区域检测模型,我们需要对模型进行测试,如果精度低于可用阈值Threshold(F),针对检测精度较低的图片类型,补充一些相关的图片到训练数据集中,重新训练,直到模型可用。另外,根据4个点的坐标,可以计算矩形的倾斜角度θik,可以进行旋转Rotate(θik)校正到水平形状,Rotate(θik)表示对第i个图片的第k个文字区域旋转角度θik,得到CImageik。
步骤13:根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型,并对模型进行评估及优化。本实施例中,对于文字识别模型,输入为步骤12中得到的校正的文字区域图片CImageik,输出为对应的文字信息Stringik。利用深度神经网络训练一个文字区域检测模型,使得G(CImageik)=Stringik。
为了得到一个可用的文字识别模型,我们需要对模型进行测试,如果精度低于可用阈值Threshold(G),针对识别精度较低的文字,补充一些相关的文字图片到训练数据集中,重新训练,直到模型可用。
步骤14:对于待识别的图片,调用文字区域检测模型,识别文字所在区域,并提取文字区域图片并进行倾斜校正。本实施例中,对于待识别的图片,调用F模型,得到t个文字区域矩形,并进行旋转校正,得到t个校正的文字区域图片。
步骤15:对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息。本实施例中,对于t个校正的文字区域图片,分别调用G模型,得到t个区域对应的文字信息,将这些信息返回。
参阅图2所示,本发明实施例的系统结构,包括:数据源模块21、模型训练模块22、图片文字识别模块23。
数据源模块21,用于训练文字区域检测模型和文字识别模型所需要准备的数据集,主要包括:文字图片、文字区域位置、区域文字信息。
学员课程推荐模块22,利用深度神经网络训练文字区域检测及识别模型。其中包括四个子模块:文字区域检测模型训练子模块221、文字区域检测模型子模块222、文字识别模型训练子模块223、文字识别模型子模块224。
文字区域检测模型训练子模块221,是根据文字区域位置,利用深度神经网络训练文字区域检测模型。
文字区域检测模型子模块222,是对模型进行评估及优化,最终得到可用的文字区域检测模型。
文字识别模型训练子模块223,是根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型。
文字识别模型子模块224,是对模型进行评估及优化,最终得到可用的文字识别模型。
图片文字识别模块23,提供文字识别的接口,接收待识别的图片,通过调用模型最终返回文字信息。其中包括五个子模块:待识别图片接收子模块231、文字区域检测子模块232、文字区域校正子模块233、文字区域识别子模块234、文字信息返回子模块235。
待识别图片接收子模块231,用于接收待识别的图片信息。
文字区域检测子模块232,对于待识别的图片,调用文字区域检测模型,识别文字所在区域。
文字区域校正子模块233,根据文字区域的坐标位置计算该区域的倾斜角度,对文字区域进行校正。
文字区域识别子模块234,对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息。
文字信息返回子模块235,将最终识别的文字信息返回。
本发明主要用于提供一种文字检测及识别的方法及系统,根据数据集中的文字区域位置,利用深度神经网络训练文字区域检测模型,然后根据文字区域图片与对应的文字信息训练文字识别模型。通过文字区域检测模型,可以检测出图片中的文字区域,通过文字识别模型,可以识别文字区域图片中的文字信息,两个模型结合起来可以实现图片中的文字信息识别。该方法和系统能够高效准确的完成图片文字检测及识别任务,能够应用到很多场景下的文字自动识别及录入工作,大大减少人力成本。
以上实施例不以任何方式限定本发明,凡是对以上实施例以等效变换方式做出的其它改进与应用,都属于本发明的保护范围。
Claims (5)
1.一种文字检测及识别的方法,其特征在于,包括如下步骤:
步骤一:准备数据集,包括文字图片中的文字区域位置、区域文字信息,数据集可以通过人工标注或者自动生成获得;
步骤二:根据文字区域位置,利用深度神经网络训练文字区域检测模型,并对模型进行评估及优化,对于文字区域检测模型,输入为一张图片Imagei,输出为{Regionik},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,Regionik表示第i个图片中第k个文字区域;利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={Regionik}。
步骤三:根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型,并对模型进行评估及优化;对于文字识别模型,输入为步骤二中得到的校正的文字区域图片CImageik,输出为对应的文字信息Stringik;利用深度神经网络训练一个文字区域检测模型,使得G(CImageik)=Stringik;
步骤四:对于待识别的图片,调用F模型,得到t个文字区域矩形,并进行旋转校正,得到t个校正的文字区域图片;
步骤五:对于t个校正的文字区域图片,分别调用G模型,得到t个区域对应的文字信息,将这些信息返回。
2.如权利要求1所述的一种文字检测及识别的方法,其特征在于:所述步骤一中,数据集的采集是在文字区域采用矩形画框,实际存储采用矩形4个点的坐标,所述步骤二中,对于文字区域检测模型,输入为一张图片Imagei,输出{(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)},其中i表示第i个图片,k=1,...,t,t表示第i个图片中有t个文字区域,(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)分别表示第i个图片中第k个文字区域矩形的左上角、左下角、右下角、右上角的点的坐标,利用深度神经网络训练一个文字区域检测模型,使得F(Imagei)={(xik1,yik1),(xik2,yik2),(xik3,yik3),(xik4,yik4)}。
3.如权利要求2所述的一种文字检测及识别的方法,其特征在于:所述步骤二中,为了得到一个可用的文字区域检测模型,需要对模型进行测试,如果精度低于可用阈值Threshold(F),针对检测精度较低的图片类型,补充一些相关的图片到训练数据集中,重新训练,直到模型可用;另外,对每个Regionik进行倾斜矫正得到CImageik,根据4个点的坐标,可以计算矩形的倾斜角度θik,可以进行旋转Rotate(θik)校正到水平形状,Rotate(θik)表示对第i个图片的第k个文字区域旋转角度θik,得到CImageik。
4.如权利要求3所述的一种文字检测及识别的方法,其特征在于:所述步骤三中,为了得到一个可用的文字识别模型,需要对模型进行测试,如果精度低于可用阈值Threshold(G),针对识别精度较低的文字,补充一些相关的文字图片到训练数据集中,重新训练,直到模型可用。
5.一种根据权利要求1-4之一所述方法运行的文字检测及识别的系统,其特征在于:包括数据源模块、模型训练模块、图片文字识别模块:
所述数据源模块,用于训练文字区域检测模型和文字识别模型所需要准备的数据集,主要包括:文字图片、文字区域位置、区域文字信息;
所述模型训练模块,利用深度神经网络训练文字区域检测及识别模型;其中包括四个子模块:文字区域检测模型训练子模块、文字区域检测模型子模块、文字识别模型训练子模块、文字识别模型子模块;所述文字区域检测模型训练子模块,是根据文字区域位置,利用深度神经网络训练文字区域检测模型;所述文字区域检测模型子模块,是对模型进行评估及优化,最终得到可用的文字区域检测模型;所述文字识别模型训练子模块,是根据文字区域图片与对应的文字信息,利用深度神经网络训练文字识别模型;所述文字识别模型子模块,是对模型进行评估及优化,最终得到可用的文字识别模型;
所述图片文字识别模块,提供文字识别的接口,接收待识别的图片,通过调用模型最终返回文字信息;其中包括五个子模块:待识别图片接收子模块、文字区域检测子模块、文字区域校正子模块、文字区域识别子模块、文字信息返回子模块;所述待识别图片接收子模块,用于接收待识别的图片信息;所述文字区域检测子模块,对于待识别的图片,调用文字区域检测模型,识别文字所在区域;所述文字区域校正子模块,根据文字区域的坐标位置计算该区域的倾斜角度,对文字区域进行校正;所述文字区域识别子模块,对于校正后的文字区域图片,调用文字识别模型,识别出对应的文字信息;所述文字信息返回子模块,将最终识别的文字信息返回。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810818780.9A CN109034155A (zh) | 2018-07-24 | 2018-07-24 | 一种文字检测及识别的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810818780.9A CN109034155A (zh) | 2018-07-24 | 2018-07-24 | 一种文字检测及识别的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109034155A true CN109034155A (zh) | 2018-12-18 |
Family
ID=64644633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810818780.9A Pending CN109034155A (zh) | 2018-07-24 | 2018-07-24 | 一种文字检测及识别的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109034155A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977957A (zh) * | 2019-03-04 | 2019-07-05 | 苏宁易购集团股份有限公司 | 一种基于深度学习的发票识别方法及系统 |
CN110309796A (zh) * | 2019-07-05 | 2019-10-08 | 上海中通吉网络技术有限公司 | 面单识别方法、装置和设备 |
CN110363196A (zh) * | 2019-06-20 | 2019-10-22 | 吴晓东 | 一种倾斜文本的文字精准识别的方法 |
CN110490198A (zh) * | 2019-08-12 | 2019-11-22 | 上海眼控科技股份有限公司 | 文本方向校正方法、装置、计算机设备和存储介质 |
CN110516554A (zh) * | 2019-07-31 | 2019-11-29 | 杭州电子科技大学 | 一种多场景多字体中文文字检测识别方法 |
CN110659633A (zh) * | 2019-08-15 | 2020-01-07 | 坎德拉(深圳)科技创新有限公司 | 图像文本信息的识别方法、装置以及存储介质 |
CN111242129A (zh) * | 2020-01-03 | 2020-06-05 | 创新工场(广州)人工智能研究有限公司 | 一种用于端到端的文字检测与识别的方法和装置 |
CN111814539A (zh) * | 2020-05-28 | 2020-10-23 | 平安科技(深圳)有限公司 | 基于红外光和紫外光的文字识别方法、装置和计算机设备 |
CN112905733A (zh) * | 2021-02-02 | 2021-06-04 | 嘉应学院 | 一种基于ocr识别技术的图书保存方法、系统及装置 |
CN113298167A (zh) * | 2021-06-01 | 2021-08-24 | 北京思特奇信息技术股份有限公司 | 一种基于轻量级神经网络模型的文字检测方法及系统 |
WO2021248912A1 (zh) * | 2020-06-10 | 2021-12-16 | 深信服科技股份有限公司 | 一种图片审计方法、装置、计算设备及存储介质 |
CN115004247A (zh) * | 2019-12-02 | 2022-09-02 | 尤帕斯公司 | 训练用于机器人过程自动化的光学字符检测和识别模型 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740774A (zh) * | 2016-01-25 | 2016-07-06 | 浪潮软件股份有限公司 | 一种图像的文本区域定位方法及装置 |
CN105809164A (zh) * | 2016-03-11 | 2016-07-27 | 北京旷视科技有限公司 | 文字识别方法和装置 |
CN106557768A (zh) * | 2016-11-25 | 2017-04-05 | 北京小米移动软件有限公司 | 对图片中的文字进行识别的方法及装置 |
-
2018
- 2018-07-24 CN CN201810818780.9A patent/CN109034155A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740774A (zh) * | 2016-01-25 | 2016-07-06 | 浪潮软件股份有限公司 | 一种图像的文本区域定位方法及装置 |
CN105809164A (zh) * | 2016-03-11 | 2016-07-27 | 北京旷视科技有限公司 | 文字识别方法和装置 |
CN106557768A (zh) * | 2016-11-25 | 2017-04-05 | 北京小米移动软件有限公司 | 对图片中的文字进行识别的方法及装置 |
Non-Patent Citations (1)
Title |
---|
CHRISTIAN BARTZ 等: "STN-OCR: A single Neural Network for Text Detection and Text Recognition", 《COMPUTER VISION AND PATTERN RECOGNITION》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977957A (zh) * | 2019-03-04 | 2019-07-05 | 苏宁易购集团股份有限公司 | 一种基于深度学习的发票识别方法及系统 |
CN110363196B (zh) * | 2019-06-20 | 2022-02-08 | 吴晓东 | 一种倾斜文本的文字精准识别的方法 |
CN110363196A (zh) * | 2019-06-20 | 2019-10-22 | 吴晓东 | 一种倾斜文本的文字精准识别的方法 |
CN110309796A (zh) * | 2019-07-05 | 2019-10-08 | 上海中通吉网络技术有限公司 | 面单识别方法、装置和设备 |
CN110516554A (zh) * | 2019-07-31 | 2019-11-29 | 杭州电子科技大学 | 一种多场景多字体中文文字检测识别方法 |
CN110490198A (zh) * | 2019-08-12 | 2019-11-22 | 上海眼控科技股份有限公司 | 文本方向校正方法、装置、计算机设备和存储介质 |
CN110659633A (zh) * | 2019-08-15 | 2020-01-07 | 坎德拉(深圳)科技创新有限公司 | 图像文本信息的识别方法、装置以及存储介质 |
CN115004247A (zh) * | 2019-12-02 | 2022-09-02 | 尤帕斯公司 | 训练用于机器人过程自动化的光学字符检测和识别模型 |
CN111242129A (zh) * | 2020-01-03 | 2020-06-05 | 创新工场(广州)人工智能研究有限公司 | 一种用于端到端的文字检测与识别的方法和装置 |
WO2021139341A1 (zh) * | 2020-05-28 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于红外光和紫外光的文字识别方法、装置和计算机设备 |
CN111814539A (zh) * | 2020-05-28 | 2020-10-23 | 平安科技(深圳)有限公司 | 基于红外光和紫外光的文字识别方法、装置和计算机设备 |
CN111814539B (zh) * | 2020-05-28 | 2023-07-21 | 平安科技(深圳)有限公司 | 基于红外光和紫外光的文字识别方法、装置和计算机设备 |
WO2021248912A1 (zh) * | 2020-06-10 | 2021-12-16 | 深信服科技股份有限公司 | 一种图片审计方法、装置、计算设备及存储介质 |
CN112905733A (zh) * | 2021-02-02 | 2021-06-04 | 嘉应学院 | 一种基于ocr识别技术的图书保存方法、系统及装置 |
CN113298167A (zh) * | 2021-06-01 | 2021-08-24 | 北京思特奇信息技术股份有限公司 | 一种基于轻量级神经网络模型的文字检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109034155A (zh) | 一种文字检测及识别的方法及系统 | |
CN109840519B (zh) | 一种自适应的智能单据识别录入装置及其使用方法 | |
CN106485243B (zh) | 一种票据识别纠错方法及装置 | |
CN109308476B (zh) | 票据信息处理方法、系统及计算机可读存储介质 | |
CN107067044B (zh) | 一种财务报销全票据智能审核系统 | |
Sun et al. | Template matching-based method for intelligent invoice information identification | |
CN108009602A (zh) | 一种基于条码识别的图书定位方法、电子设备及存储介质 | |
CN109977957A (zh) | 一种基于深度学习的发票识别方法及系统 | |
CN110704633A (zh) | 命名实体识别方法、装置、计算机设备及存储介质 | |
CN107818322A (zh) | 一种用于车辆年检的车辆vin码篡改检测系统及方法 | |
CN109214382A (zh) | 一种基于crnn的票据信息识别算法、设备及存储介质 | |
CN111652232B (zh) | 票据识别方法及装置、电子设备和计算机可读存储介质 | |
CN109359696A (zh) | 一种车款识别方法、系统及存储介质 | |
CN110674815A (zh) | 基于深度学习关键点检测的发票图像畸变校正方法 | |
CN110162599A (zh) | 招聘面试方法、装置及计算机可读存储介质 | |
CN109815765A (zh) | 一种提取含有二维码的营业执照信息的方法及装置 | |
CN110348441A (zh) | 增值税发票识别方法、装置、计算机设备及存储介质 | |
CN110532855A (zh) | 基于深度学习的自然场景证件图像文字识别方法 | |
CN110427853B (zh) | 一种智能票据信息提取处理的方法 | |
CN109002768A (zh) | 基于神经网络文本检测识别的医疗票据类文字提取方法 | |
CN109446345A (zh) | 核电文件校验处理方法以及系统 | |
CN109919076A (zh) | 基于深度学习的确认ocr识别结果可靠性的方法及介质 | |
CN109684957A (zh) | 一种自动按照纸质表单展现系统数据的方法及系统 | |
CN112883926B (zh) | 表格类医疗影像的识别方法及装置 | |
CN108364037A (zh) | 识别手写汉字的方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181218 |
|
RJ01 | Rejection of invention patent application after publication |