CN112329774A - 基于图像的商品尺码表自动生成方法 - Google Patents

基于图像的商品尺码表自动生成方法 Download PDF

Info

Publication number
CN112329774A
CN112329774A CN202011248726.9A CN202011248726A CN112329774A CN 112329774 A CN112329774 A CN 112329774A CN 202011248726 A CN202011248726 A CN 202011248726A CN 112329774 A CN112329774 A CN 112329774A
Authority
CN
China
Prior art keywords
character candidate
image
box
text
sorting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011248726.9A
Other languages
English (en)
Other versions
CN112329774B (zh
Inventor
余卓
卞龙鹏
张翼翔
徐桦
石克阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Tanyu Technology Co ltd
Original Assignee
Hangzhou Weier Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Weier Network Technology Co ltd filed Critical Hangzhou Weier Network Technology Co ltd
Priority to CN202011248726.9A priority Critical patent/CN112329774B/zh
Publication of CN112329774A publication Critical patent/CN112329774A/zh
Application granted granted Critical
Publication of CN112329774B publication Critical patent/CN112329774B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本申请公开了一种基于图像的商品尺码表自动生成方法,包括如下步骤:将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度;除去置信度低于预设阈值的字符候选框;除去不包含文本信息的字符候选框;除去两个在竖直方向重合的字符候选框中置信度较低的一个;按照其中心坐标进行行列排序,并将排序后相邻的字符候选框进行合并为一个文本框;形成待识别小图;将所述待识别小图输入第二卷积神经网络进行识别,获取尺码数据;根据身高、体重和尺码的三者的对应关系,生成指定格式的尺码表格。本申请的有益之处在于提供一种能够适应不同图片的文本的检测、识别的基于图像的商品尺码表自动生成方法。

Description

基于图像的商品尺码表自动生成方法
技术领域
本申请涉及图像处理方法,具体而言,涉及一种基于图像的商品尺码表自动生成方法。
背景技术
现阶段,商家在对衣物等商品配置尺码表时,只能手动配置一张表,耗时久且表格太多易出错。而大部分商品的尺码表可由图像里含有的表格来确定,因此从含有尺码信息的图片中提取尺码信息,然后按照一定规则生成尺码表成了商家重要需求。
发明内容
为了解决了现有技术的不足之处,本申请提供一种基于图像的商品尺码表自动生成方法,包括如下步骤:将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度;对所述第一卷积神经网络生成的字符候选框进行置信度筛选,除去置信度低于预设阈值的字符候选框;对通过所述置信度筛选的字符候选框进行文本信息筛选,除去不包含文本信息的字符候选框;对通过所述文本信息筛选的字符候选框进行非极大值抑制,除去两个在竖直方向重合的字符候选框中置信度较低的一个;对通过极大值抑制的字符候选框按照其中心坐标进行行列排序,并将排序后相邻的字符候选框进行合并为一个文本框;对所述文本框内区域进行截图,形成待识别小图;将所述待识别小图输入第二卷积神经网络进行识别,获取尺码数据;根据身高、体重和尺码的三者的对应关系,生成指定格式的尺码表格。
进一步地,所述第一卷积神经网络采用Faster-RCNN的CTPN文本检测模型。
进一步地,在所述置信度筛选中,置信度的预设阈值取值范围为0.85至0.95。
进一步地,所述文本信息筛选的方法包括如下步骤:判断所述字符候选框的灰度值分布,若灰度值主要集中分布于一个区域,则判定所述字符候选框不含有文本信息;如果所述字符候选框内像素灰度值集中分布于两个及以上的区域,则进行判定灰度值分布最多的两个区域的像素个数N1、N2及框内像素值总个数Ns的数值关系,若N1>Ns*0.1且N2>Ns*0.1,则认为此文本框含有文本信息,反之则认为不含有文本信息。
进一步地,在所述字符候选框按照其中心坐标进行行列排序时,采用冒泡排序方法进行排序。
进一步地,在所述字符候选框按照其中心坐标进行行列排序时,按照先行后列的顺序进行排序。
进一步地,在排序后相邻的字符候选框进行合并为一个文本框时,对于一个所述字符候选框而言,判断按照排序其后的所述字符候选框是否相邻,如果不相邻则,停止判断,如果相邻,则继续判断按照排序的下一个所述字符候选框是否相邻,直至判断为不相邻为止。
进一步地,判断所述字符候选框是否相邻的条件为两个所述字符候选框是否存在重叠的部分。
进一步地,所述第二卷积神经网络采用DenseNet+CTC架构搭建模型。
进一步地,所述基于图像的商品尺码表自动生成方法还包括如下步骤:对所述文本框的截图进行背景色处理从而获得文本信息为深色的待识别小图。
本申请的有益之处在于:提供一种能够适应不同图片的文本的检测、识别的基于图像的商品尺码表自动生成方法。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一种实施例的基于图像的商品尺码表自动生成方法的步骤示意图;
图2是根据本申请一种实施例的基于图像的商品尺码表自动生成方法中图片经过第一卷积神经网络处理后生成字符候选框的示意图;
图3是图2所示图像经过置信度筛选后的示意图;
图4是图3所示图像经过文本信息筛选后的示意图;
图5是图4所示图像经过非极大值抑制后的示意图;
图6是图5所示图像经过相邻合并后的示意图;
图7是一个待处理图像的视图;
图8是经过本申请方法处理后得到的文本框的示意图;
图9是经过本申请方法处理后生产尺码表。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
参照图1至图9所示,基于图像的商品尺码表自动生成方法,包括如下步骤:将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度;对第一卷积神经网络生成的字符候选框进行置信度筛选,除去置信度低于预设阈值的字符候选框;对通过置信度筛选的字符候选框进行文本信息筛选,除去不包含文本信息的字符候选框;对通过文本信息筛选的字符候选框进行非极大值抑制,除去两个在竖直方向重合的字符候选框中置信度较低的一个;对通过极大值抑制的字符候选框按照其中心坐标进行行列排序,并将排序后相邻的字符候选框进行合并为一个文本框;对文本框内区域进行截图,形成待识别小图;将待识别小图输入第二卷积神经网络进行识别,获取尺码数据;根据身高、体重和尺码的三者的对应关系,生成指定格式的尺码表格。
具体而言,第一卷积神经网络采用Faster-RCNN的CTPN文本检测模型。
具体而言,在置信度筛选中,置信度的预设阈值取值范围为0.85至0.95。作为进一步优选,置信度的预设阈值取值为0.9。依次对字符候选框进行置信度筛选,如果置信度小于置信度阈值,则除去字符候选框。
具体而言,文本信息筛选的方法包括如下步骤:判断字符候选框的灰度值分布,若灰度值主要集中分布于一个区域,则判定字符候选框不含有文本信息;如果字符候选框内像素灰度值集中分布于两个及以上的区域,则进行判定灰度值分布最多的两个区域的像素个数N1、N2及框内像素值总个数Ns的数值关系,若N1>Ns*0.1且N2>Ns*0.1,则认为此文本框含有文本信息,反之则认为不含有文本信息。
具体而言,在字符候选框按照其中心坐标进行行列排序时,采用冒泡排序方法进行排序。5.
对于保留的字符候选框,按先行后列的顺序进行排序。即对每个字符候选框,确定其中心(x,y),然后按冒泡排序。两个框进行比较时,先比较候选框的x,若两者的x在同一区域,则认为是同一行,否则较小的x的框排在另一框前面。若是同一行,再比较y,较小的y的框排在另一框前面。
具体而言,在字符候选框按照其中心坐标进行行列排序时,按照先行后列的顺序进行排序。
具体而言,在排序后相邻的字符候选框进行合并为一个文本框时,对于一个字符候选框而言,判断按照排序其后的字符候选框是否相邻,如果不相邻则,停止判断,如果相邻,则继续判断按照排序的下一个字符候选框是否相邻,直至判断为不相邻为止。
具体而言,判断字符候选框是否相邻的条件为两个字符候选框是否存在重叠的部分。具体而言,判断是否重叠即对交集不为0的字符候选框进行水平合并。最终保证每个字符候选框与同一水平的前后字符候选框交集为空,即
Figure BDA0002770893680000041
其中Ap、An分别为水平方向邻近的前后两个字符候选框。
具体而言,第二卷积神经网络采用DenseNet+CTC架构搭建模型。
具体而言,基于图像的商品尺码表自动生成方法还包括如下步骤:对文本框的截图进行背景色处理从而获得文本信息为深色的待识别小图。
对每个文本框,截取框的图片区域,形成待识别的小图。先将小图转换为灰度图,然后取其左上角位置的点的像素值V1,确定背景像素值范围Va=[V1-10,V1+10],然后计算小图中所有像素值不在Va范围内的点的集合D,接着计算集合D的平均像素值,其中Vi是指D内每个像素的像素值。若Vb<Va,则认为此小图文本颜色相对背景为深色,则不进行处理。若Vb>Va,则认为此小图文本颜色相对背景为浅色,需要进行反转,即对此图I进行如下操作:Inew=255-I。将Inew作为此小图的反转图,输入到文本识别模块。
在文本检测模型得出字符修选框后,本申请采用了非文本过滤方法,只留下包含文本信息的字符候选框,一则可以减少检测结果中非文本的区域,提高文本识别的准确率,二则可以将紧邻的非同一表格的文本进行隔离,减少了文本识别的难度,也有利于后期生成尺码表格时,对于身高-体重-尺码三者的定位。
对于字符候选框构成文本框时,本申请直接按水平角度进行连接,不再采用倾斜梯度,减少了计算量,同时也保证了小图中待检测文本处于水平位置,有利于文本识别。
对于待识别的小图,本申请采用了文本颜色的判定,来决定是否需要对原图进行反转,使所有输入识别模块的小图都是背景浅色文本深色的格式,有利于提高识别的精度与速度。因此本申请可以有效识别包含多种背景/文本颜色的图像中的文本。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于图像的商品尺码表自动生成方法,其特征在于:
所述基于图像的商品尺码表自动生成方法包括如下步骤:
将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度;
对所述第一卷积神经网络生成的字符候选框进行置信度筛选,除去置信度低于预设阈值的字符候选框;
对通过所述置信度筛选的字符候选框进行文本信息筛选,除去不包含文本信息的字符候选框;
对通过所述文本信息筛选的字符候选框进行非极大值抑制,除去两个在竖直方向重合的字符候选框中置信度较低的一个;
对通过极大值抑制的字符候选框按照其中心坐标进行行列排序,并将排序后相邻的字符候选框进行合并为一个文本框;
对所述文本框内区域进行截图,形成待识别小图;
将所述待识别小图输入第二卷积神经网络进行识别,获取尺码数据;
根据身高、体重和尺码的三者的对应关系,生成指定格式的尺码表格。
2.根据权利要求1所述的基于图像的商品尺码表自动生成方法,其特征在于:
所述第一卷积神经网络采用Faster-RCNN的CTPN文本检测模型。
3.根据权利要求1所述的基于图像的商品尺码表自动生成方法,其特征在于:
在所述置信度筛选中,置信度的预设阈值取值范围为0.85至0.95。
4.根据权利要求1所述的基于图像的商品尺码表自动生成方法,其特征在于:
所述文本信息筛选的方法包括如下步骤:
判断所述字符候选框的灰度值分布,若灰度值主要集中分布于一个区域,则判定所述字符候选框不含有文本信息;
如果所述字符候选框内像素灰度值集中分布于两个及以上的区域,则进行判定灰度值分布最多的两个区域的像素个数N1、N2及框内像素值总个数Ns的数值关系,若N1>Ns*0.1且N2>Ns*0.1,则认为此文本框含有文本信息,反之则认为不含有文本信息。
5.根据权利要求4所述的基于图像的商品尺码表自动生成方法,其特征在于:
在所述字符候选框按照其中心坐标进行行列排序时,采用冒泡排序方法进行排序。
6.根据权利要求5所述的基于图像的商品尺码表自动生成方法,其特征在于:
在所述字符候选框按照其中心坐标进行行列排序时,按照先行后列的顺序进行排序。
7.根据权利要求1所述的基于图像的商品尺码表自动生成方法,其特征在于:
在排序后相邻的字符候选框进行合并为一个文本框时,对于一个所述字符候选框而言,判断按照排序其后的所述字符候选框是否相邻,如果不相邻则,停止判断,如果相邻,则继续判断按照排序的下一个所述字符候选框是否相邻,直至判断为不相邻为止。
8.根据权利要求7所述的基于图像的商品尺码表自动生成方法,其特征在于:
判断所述字符候选框是否相邻的条件为两个同一水平方向邻近的字符候选框是否存在重叠的部分。
9.根据权利要求1所述的基于图像的商品尺码表自动生成方法,其特征在于:
所述第二卷积神经网络采用DenseNet+CTC架构搭建模型。
10.根据权利要求1所述的基于图像的商品尺码表自动生成方法,其特征在于:
所述基于图像的商品尺码表自动生成方法还包括如下步骤:
对所述文本框的截图进行背景色处理从而获得文本信息为深色的待识别小图。
CN202011248726.9A 2020-11-10 2020-11-10 基于图像的商品尺码表自动生成方法 Active CN112329774B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011248726.9A CN112329774B (zh) 2020-11-10 2020-11-10 基于图像的商品尺码表自动生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011248726.9A CN112329774B (zh) 2020-11-10 2020-11-10 基于图像的商品尺码表自动生成方法

Publications (2)

Publication Number Publication Date
CN112329774A true CN112329774A (zh) 2021-02-05
CN112329774B CN112329774B (zh) 2023-07-28

Family

ID=74318970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011248726.9A Active CN112329774B (zh) 2020-11-10 2020-11-10 基于图像的商品尺码表自动生成方法

Country Status (1)

Country Link
CN (1) CN112329774B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903036A (zh) * 2021-11-10 2022-01-07 北京百度网讯科技有限公司 一种文本识别方法、装置、电子设备、介质及产品

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003186965A (ja) * 2001-12-19 2003-07-04 Hitachi Ltd 服飾品選択支援システム及び方法
CN107169491A (zh) * 2017-05-19 2017-09-15 佛山市南海区广工大数控装备协同创新研究院 一种齿环模具编号检测方法
CN107671002A (zh) * 2017-08-07 2018-02-09 南通纺织丝绸产业技术研究院 基于视觉检测的服装分拣方法及其装置
CN108855971A (zh) * 2018-03-30 2018-11-23 佛山市南海区广工大数控装备协同创新研究院 一种鞋底智能分拣方法
JP2019046484A (ja) * 2018-10-16 2019-03-22 株式会社マーケットヴィジョン 画像認識システム
CN109583449A (zh) * 2018-10-29 2019-04-05 深圳市华尊科技股份有限公司 字符识别方法及相关产品
CN109840520A (zh) * 2017-11-24 2019-06-04 中国移动通信集团广东有限公司 一种发票关键信息识别方法及系统
CN109919154A (zh) * 2019-02-28 2019-06-21 北京科技大学 一种字符智能识别方法及识别装置
CN109919147A (zh) * 2019-03-04 2019-06-21 上海宝尊电子商务有限公司 服装吊牌图像中文本识别的方法
CN110210478A (zh) * 2019-06-04 2019-09-06 天津大学 一种商品外包装文字识别方法
CN110826562A (zh) * 2019-11-13 2020-02-21 上海赛特斯信息科技股份有限公司 针对服装标签和吊牌实现自动化审核处理的系统及其方法
WO2020037762A1 (zh) * 2018-08-21 2020-02-27 深圳码隆科技有限公司 商品信息识别方法和系统
CN110889402A (zh) * 2019-11-04 2020-03-17 广州丰石科技有限公司 一种基于深度学习的营业执照内容识别方法及系统
CN111461843A (zh) * 2020-04-10 2020-07-28 成都晓多科技有限公司 一种用于电商平台的尺码表生成及尺码推荐方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003186965A (ja) * 2001-12-19 2003-07-04 Hitachi Ltd 服飾品選択支援システム及び方法
CN107169491A (zh) * 2017-05-19 2017-09-15 佛山市南海区广工大数控装备协同创新研究院 一种齿环模具编号检测方法
CN107671002A (zh) * 2017-08-07 2018-02-09 南通纺织丝绸产业技术研究院 基于视觉检测的服装分拣方法及其装置
CN109840520A (zh) * 2017-11-24 2019-06-04 中国移动通信集团广东有限公司 一种发票关键信息识别方法及系统
CN108855971A (zh) * 2018-03-30 2018-11-23 佛山市南海区广工大数控装备协同创新研究院 一种鞋底智能分拣方法
WO2020037762A1 (zh) * 2018-08-21 2020-02-27 深圳码隆科技有限公司 商品信息识别方法和系统
JP2019046484A (ja) * 2018-10-16 2019-03-22 株式会社マーケットヴィジョン 画像認識システム
CN109583449A (zh) * 2018-10-29 2019-04-05 深圳市华尊科技股份有限公司 字符识别方法及相关产品
CN109919154A (zh) * 2019-02-28 2019-06-21 北京科技大学 一种字符智能识别方法及识别装置
CN109919147A (zh) * 2019-03-04 2019-06-21 上海宝尊电子商务有限公司 服装吊牌图像中文本识别的方法
CN110210478A (zh) * 2019-06-04 2019-09-06 天津大学 一种商品外包装文字识别方法
CN110889402A (zh) * 2019-11-04 2020-03-17 广州丰石科技有限公司 一种基于深度学习的营业执照内容识别方法及系统
CN110826562A (zh) * 2019-11-13 2020-02-21 上海赛特斯信息科技股份有限公司 针对服装标签和吊牌实现自动化审核处理的系统及其方法
CN111461843A (zh) * 2020-04-10 2020-07-28 成都晓多科技有限公司 一种用于电商平台的尺码表生成及尺码推荐方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
丁明宇 等: "基于深度学习的图片中商品参数识别方法" *
彭雨明;陈伟豪;麦定康;钟乐臻;: "基于数据挖掘技术的图片字符检测与识别" *
李恺: "基于深度学习的文本识别与检索应用研究", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *
蒋良卫等: "基于深度学习技术的图片文字提取技术的研究", 《信息系统工程》 *
靳振伟: "基于CTPN的网店工商信息提取系统的研究和实现", 《现代信息科技》 *
靳振伟;: "基于CTPN的网店工商信息提取系统的研究和实现" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903036A (zh) * 2021-11-10 2022-01-07 北京百度网讯科技有限公司 一种文本识别方法、装置、电子设备、介质及产品
CN113903036B (zh) * 2021-11-10 2023-11-03 北京百度网讯科技有限公司 一种文本识别方法、装置、电子设备、介质及产品

Also Published As

Publication number Publication date
CN112329774B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN114140679B (zh) 一种缺陷融合方法、装置、识别系统及存储介质
JP6203084B2 (ja) 配達物区分処理システム、および配達物区分処理方法
CN108121997A (zh) 使用机器学习模型的图像数据中的对象分类
CN109308700A (zh) 一种基于印刷品字符的视觉识别缺陷检测方法
CN108122239A (zh) 使用深度分割的图像数据中的对象检测
CN108921152B (zh) 基于物体检测网络的英文字符切分方法及装置
CN111461133B (zh) 快递面单品名识别方法、装置、设备及存储介质
CN110942074A (zh) 字符切分识别方法、装置、电子设备、存储介质
JP2017084336A (ja) 画像化された文書からテキストを抽出する方法及び装置
CN109598185B (zh) 图像识别翻译方法、装置、设备及可读存储介质
CN111612747B (zh) 产品表面裂缝快速检测方法及检测系统
CN110196917B (zh) 个性化logo版式定制方法、系统和存储介质
CN112446437A (zh) 一种基于机器视觉的货架商品规格识别方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN111737478A (zh) 文本检测方法、电子设备及计算机可读介质
CN112464797A (zh) 一种吸烟行为检测方法、装置、存储介质及电子设备
CN112329774B (zh) 基于图像的商品尺码表自动生成方法
CN114998217A (zh) 确定玻璃基板缺陷等级的方法、计算机设备及存储介质
CN117011300A (zh) 一种实例分割与二次分类相结合的微小缺陷检测方法
US11657511B2 (en) Heuristics-based detection of image space suitable for overlaying media content
CN115797939A (zh) 一种基于深度学习的两阶段斜体字符识别方法及装置
CN112288372B (zh) 一种可同时识别一维条码和三段码字符的快递单识别方法
CN115222705A (zh) 基于改进yolov5的化纤丝饼外观缺陷检测方法
EP4218246A1 (en) Detection of image space suitable for overlaying media content
CN109829491B (zh) 用于图像检测的信息处理方法、装置以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230426

Address after: 104058, No. 2-10, No. 311 Huangpu Avenue Middle, Tianhe District, Guangzhou City, Guangdong Province, 510000

Applicant after: Guangzhou Tanyu Technology Co.,Ltd.

Address before: 601-5, 1382 Wenyi West Road, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant before: Hangzhou Weier Network Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant