CN113963339A - 一种信息提取方法和装置 - Google Patents
一种信息提取方法和装置 Download PDFInfo
- Publication number
- CN113963339A CN113963339A CN202111024160.6A CN202111024160A CN113963339A CN 113963339 A CN113963339 A CN 113963339A CN 202111024160 A CN202111024160 A CN 202111024160A CN 113963339 A CN113963339 A CN 113963339A
- Authority
- CN
- China
- Prior art keywords
- card number
- text
- number text
- horizontal
- card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000012795 verification Methods 0.000 claims description 55
- 238000004422 calculation algorithm Methods 0.000 claims description 32
- 238000012937 correction Methods 0.000 claims description 20
- 230000009466 transformation Effects 0.000 claims description 13
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 11
- 238000007635 classification algorithm Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 102100032202 Cornulin Human genes 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90348—Query processing by searching ordered data, e.g. alpha-numerically ordered data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Finance (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种信息提取方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从卡片图像中定位出卡号文本区域,基于卡号文本区域得到水平的卡号文本条,对水平的卡号文本条进行卡号文本方向校验,以确定水平的卡号文本条中卡号文本的方向为第一方向,对水平的卡号文本条中第一方向的卡号文本进行识别,以提取卡片图像中的卡号信息。该实施方式能够提取出图像中任意旋转角度的卡号信息,扩大了数据的处理范围,并能提升卡片信息提取的准确性和鲁棒性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息提取方法和装置。
背景技术
在保险的理赔环节中,客户会上传多张理赔影像资料,银行卡图像是理赔作业流程中必不可少的一项资料,该资料上涵盖的银行卡信息是客户能否成功收到理赔款的决定性因素。因此需要通过银行卡图像上的文字识别来提取客户的银行卡号。目前理赔影像资料中,客户上传的银行卡图像存在任意角度旋转、模糊和曝光等情况,依靠人工识别银行卡信息费时费力,而且由于银行卡号位数较多,手工输入时可能出现错误。而传统的银行卡识别方法只能针对特定旋转角度的银行卡进行识别,对任意倾斜角度的银行卡识别效果不佳。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
当卡片图像的旋转角度比较随意时,对卡号的识别比较困难,且无法有效地进行卡号的校验及校正,信息提取的准确性差。
发明内容
有鉴于此,本发明实施例提供一种信息提取方法和装置,能够提取出图像中任意旋转角度的卡号信息,扩大了数据的处理范围,并能提升卡片信息提取的准确性和鲁棒性。
为实现上述目的,根据本发明实施例的一个方面,提供了一种信息提取方法。
一种信息提取方法,包括:从卡片图像中定位出卡号文本区域;基于所述卡号文本区域得到水平的卡号文本条;对所述水平的卡号文本条进行卡号文本方向校验,以确定所述水平的卡号文本条中卡号文本的方向为第一方向;对所述水平的卡号文本条中所述第一方向的卡号文本进行识别,以提取所述卡片图像中的卡号信息。
可选地,所述基于所述卡号文本区域得到水平的卡号文本条,包括:利用仿射变换算法将所述卡号文本区域旋转至水平方向,得到卡号文本朝向所述第一方向或第二方向的所述水平的卡号文本条,其中,所述第一方向与所述第二方向为相反方向。
可选地,对所述水平的卡号文本条进行卡号文本方向校验,以确定所述水平的卡号文本条中卡号文本的方向为第一方向,包括:利用图像分类算法,对所述水平的卡号文本条按照卡号文本方向分类;将卡号文本方向为所述第二方向的所述水平的卡号文本条旋转,以使卡号文本方向变为所述第一方向。
可选地,所述利用图像分类算法,对所述水平的卡号文本条按照卡号文本方向分类,包括:对所述水平的卡号文本条按照如下方式扩充:将所述水平的卡号文本条沿垂直方向进行整数倍复制,使得复制之后的垂直方向和水平方向的长度比最接近于1但小于1;将扩充后的所述水平的卡号文本条输入图像分类网络,以确定所述水平的卡号文本条的卡号文本方向为所述第一方向或所述第二方向。
可选地,所述对所述水平的卡号文本条中所述第一方向的卡号文本进行识别,以提取所述卡片图像中的卡号信息,包括:从所述水平的卡号文本条中识别出所述第一方向的卡号文本;按照卡号编码规则对识别出的卡号文本进行文本校验;输出所述文本校验通过的卡号文本对应的卡号信息。
可选地,所述卡号文本为银行卡号文本;所述按照卡号编码规则对识别出的卡号文本进行文本校验,包括:对所述识别出的卡号文本从最后一位字符开始遍历,对于奇数位的字符直接求和以得到奇数位和,对处于偶数位的字符进行预设处理后再求和以得到偶数位和,将所述奇数位和与所述偶数位和相加,判断相加得到的结果是否满足预设条件,在满足所述预设条件的情况下,确定所述识别出的卡号文本通过所述文本校验。
可选地,还包括:将文本校验未通过的卡号文本的前N位与卡号码表中的前N位码进行匹配,得到匹配分值,其中,N为预设值,所述卡号码表包括各类卡号的前N位码;对所述匹配分值排序,得到对应匹配分值最高的预设数量的前N位码,遍历该预设数量的前N位码以得到目标前N位码,所述目标前N位码是遍历到的第一个满足如下条件的前N位码:将所述文本校验未通过的卡号文本的前N位替换为该前N位码之后,所得到的校正后的卡号文本能够通过所述文本校验;输出前N位替换为所述目标前N位码的卡号文本对应的卡号信息。
根据本发明实施例的另一方面,提供了一种信息提取装置。
一种信息提取装置,包括:文本区域定位模块,用于从卡片图像中定位出卡号文本区域;文本条确定模块,用于基于所述卡号文本区域得到水平的卡号文本条;文本方向校验模块,用于对所述水平的卡号文本条进行卡号文本方向校验,以确定所述水平的卡号文本条中卡号文本的方向为第一方向;卡号信息提取模块,用于对所述水平的卡号文本条中所述第一方向的卡号文本进行识别,以提取所述卡片图像中的卡号信息。
可选地,所述文本条确定模块还用于:利用仿射变换算法将所述卡号文本区域旋转至水平方向,得到卡号文本朝向所述第一方向或第二方向的所述水平的卡号文本条,其中,所述第一方向与所述第二方向为相反方向。
可选地,所述文本方向校验模块还用于:利用图像分类算法,对所述水平的卡号文本条按照卡号文本方向分类;将卡号文本方向为所述第二方向的所述水平的卡号文本条旋转,以使卡号文本方向变为所述第一方向。
可选地,所述文本方向校验模块包括文本方向分类子模块,用于:对所述水平的卡号文本条按照如下方式扩充:将所述水平的卡号文本条沿垂直方向进行整数倍复制,使得复制之后的垂直方向和水平方向的长度比最接近于1但小于1;将扩充后的所述水平的卡号文本条输入图像分类网络,以确定所述水平的卡号文本条的卡号文本方向为所述第一方向或所述第二方向。
可选地,所述卡号信息提取模块还用于:从所述水平的卡号文本条中识别出所述第一方向的卡号文本;按照卡号编码规则对识别出的卡号文本进行文本校验;输出所述文本校验通过的卡号文本对应的卡号信息。
可选地,所述卡号信息提取模块还用于:从所述水平的卡号文本条中识别出所述第一方向的卡号文本;按照卡号编码规则对识别出的卡号文本进行文本校验;输出所述文本校验通过的卡号文本对应的卡号信息。
可选地,所述卡号文本为银行卡号文本;所述卡号信息提取模块包括文本校验子模块,用于:对所述识别出的卡号文本从最后一位字符开始遍历,对于奇数位的字符直接求和以得到奇数位和,对处于偶数位的字符进行预设处理后再求和以得到偶数位和,将所述奇数位和与所述偶数位和相加,判断相加得到的结果是否满足预设条件,在满足所述预设条件的情况下,确定所述识别出的卡号文本通过所述文本校验。
可选地,所述卡号信息提取模块包括文本校正子模块,用于:将文本校验未通过的卡号文本的前N位与卡号码表中的前N位码进行匹配,得到匹配分值,其中,N为预设值,所述卡号码表包括各类卡号的前N位码;对所述匹配分值排序,得到对应匹配分值最高的预设数量的前N位码,遍历该预设数量的前N位码以得到目标前N位码,所述目标前N位码是遍历到的第一个满足如下条件的前N位码:将所述文本校验未通过的卡号文本的前N位替换为该前N位码之后,所得到的校正后的卡号文本能够通过所述文本校验;所述卡号信息提取模块还用于:输出前N位替换为所述目标前N位码的卡号文本对应的卡号信息。
根据本发明实施例的又一方面,提供了一种电子设备。
一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明实施例所提供的信息提取方法。
根据本发明实施例的又一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所提供的信息提取方法。
上述发明中的一个实施例具有如下优点或有益效果:从卡片图像中定位出卡号文本区域,基于卡号文本区域得到水平的卡号文本条,对水平的卡号文本条进行卡号文本方向校验,以确定水平的卡号文本条中卡号文本的方向为第一方向,对水平的卡号文本条中第一方向的卡号文本进行识别,以提取卡片图像中的卡号信息。能够提取出图像中任意旋转角度的卡号信息,扩大了数据的处理范围,并能提升卡片信息提取的准确性和鲁棒性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明一个实施例的信息提取方法的主要步骤示意图;
图2是根据本发明一个实施例的银行卡图像信息提取流程示意图;
图3是根据本发明一个实施例的信息提取装置的主要模块示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明一个实施例的信息提取方法的主要步骤示意图。如图1所示,本发明一个实施例的信息提取方法主要包括如下的步骤S101至步骤S104。
步骤S101:从卡片图像中定位出卡号文本区域;
步骤S102:基于卡号文本区域得到水平的卡号文本条;
步骤S103:对水平的卡号文本条进行卡号文本方向校验,以确定水平的卡号文本条中卡号文本的方向为第一方向;
步骤S104:对水平的卡号文本条中第一方向的卡号文本进行识别,以提取卡片图像中的卡号信息。
卡片图像中是根据原始图像通过目标检测方法得到的,对于含有卡片图像的原始图像,可通过目标检测算法从该原始图像中得到卡片图像。以卡片为银行卡为例,银行卡检测可以视为目标检测中的一种特殊示例,对于含有银行卡图像的原始图像,通过目标检测方法可定位出该银行卡图像。目标检测方法多种多样,例如FAST-RCNN、YOLO、SSD等方法。本发明实施例采用的目标检测算法是基于深度学习理论的EfficientDet算法,该方法提出了目标检测联合网络复杂度新的调整策略,在模型的深度、宽度和分辨率等参数间选择合适的平衡点,在不牺牲模型计算速度的前提下,大大提高了目标检测的准确度。
从卡片图像中定位出卡号文本区域具体可通过文本检测方法实现,本发明实施例优选采用的是基于分割原理的PAN算法(一种基于分割的文本检测算法),具体在下文实施例中将详细介绍。
基于卡号文本区域得到水平的卡号文本条,具体包括:利用仿射变换算法将卡号文本区域旋转至水平方向,得到卡号文本朝向第一方向或第二方向的水平的卡号文本条,其中,第一方向与第二方向为相反方向。第一方向优先为卡号文本的正向,即卡号文本正常展示的方向。相应地,第二方向为卡号文本的倒向(卡号文本倒立显示),倒向需要将文本旋转180度的情况下才能正常展示。
对水平的卡号文本条进行卡号文本方向校验,以确定水平的卡号文本条中卡号文本的方向为第一方向,具体包括:利用图像分类算法,对水平的卡号文本条按照卡号文本方向分类;将卡号文本方向为第二方向的水平的卡号文本条旋转,以使卡号文本方向变为第一方向。
利用图像分类算法,对水平的卡号文本条按照卡号文本方向分类,具体包括:对水平的卡号文本条按照如下方式扩充:将水平的卡号文本条沿垂直方向进行整数倍复制,使得复制之后的垂直方向和水平方向的长度比最接近于1但小于1;将扩充后的水平的卡号文本条输入图像分类网络,以确定水平的卡号文本条的卡号文本方向为第一方向或第二方向。
在一个实施例中,具体可以采用基于深度学习的EfficientNet算法对水平的卡号文本条进行分类。由于图像分类网络的输入通常为正方形,而银行卡等卡号文本条为长方形,且其长宽比差异较大,无法直接作为网络输入。本发明实施例首先对水平的卡号文本条进行扩充,将其沿垂直方向进行整数倍复制,使得复制之后的垂直方向和水平方向的长度比最接近于1但小于1。对于分类为文字方向朝下(即文本处于倒向)的文本条需要旋转180度,使其文字方向朝上(即文本处于正向),以便于后续的文字识别算法进行处理。
对水平的卡号文本条中第一方向的卡号文本进行识别,以提取卡片图像中的卡号信息,具体包括:从水平的卡号文本条中识别出第一方向的卡号文本;按照卡号编码规则对识别出的卡号文本进行文本校验;输出文本校验通过的卡号文本对应的卡号信息。
卡号文本具体可为银行卡号文本。按照卡号编码规则对识别出的卡号文本进行文本校验,具体包括:对识别出的卡号文本从最后一位字符开始遍历,对于奇数位的字符(即银行卡号奇数位的数字)直接求和以得到奇数位和,对处于偶数位的字符进行预设处理后再求和以得到偶数位和,将奇数位和与偶数位和相加,判断相加得到的结果是否满足预设条件,在满足预设条件的情况下,确定识别出的卡号文本通过文本校验。对处于偶数位的字符进行预设处理具体可以包括将处于偶数位的字符(即银行卡号偶数位的数字)乘以2,如果得到乘积为两位数则减去9。判断相加得到的结果是否满足预设条件,具体即判断奇数位和与偶数位和相加的和是否能被10整除,若能被10整除,则满足预设条件,否则,不满足预设条件。
在一个实施例中,还可以将文本校验未通过的卡号文本的前N位与卡号码表中的前N位码进行匹配,得到匹配分值,其中,N为预设值,卡号码表包括各类卡号的前N位码,匹配具体可以是利用字符串编辑距离算法进行字符串匹配;对匹配分值按照从高到低排序,得到对应匹配分值最高的预设数量的前N位码,遍历该预设数量的前N位码以得到目标前N位码,目标前N位码是遍历到的第一个满足如下条件的前N位码:将文本校验未通过的卡号文本的前N位替换为该前N位码之后,所得到的校正后的卡号文本能够通过文本校验;输出前N位替换为目标前N位码的卡号文本对应的卡号信息。
本发明实施例通过上述方式,可以实现利用卡号码表对文本校验未通过的卡号文本进行校正。其中,对匹配分值按照从高到低排序的过程中,如果存在相同匹配分值的多个前N位码,对于该相同匹配分值的多个前N位码按设定规则排序(例如随机排序或按匹配顺序排序等,本发明实施例对此不作限定),对匹配分值按照从高到低排序之后取序列中匹配分值最高的预设数量的前N位码,遍历该预设数量的前N位码,具体可以遍历这些前N位码的序号,将文本校验未通过的卡号文本的前N位替换为当前遍历到的序号对应的前N位码,得到校正后的卡号文本,对校正后的卡号文本进行文本校验,并判断对该校正后的卡号文本的文本校验是否通过,若文本校验通过则退出遍历,并输出该校正后的卡号文本对应的卡号信息;否则,继续遍历下一前N位码,直到用所遍历到的某一前N位码替换该文本校验未通过的卡号文本的前N位后得到的校正后的卡号文本能够通过文本校验,退出遍历并输出相应校正后的卡号文本对应的卡号信息。
如果遍历完该预设数量的前N位码,所得到的校正后的卡号文本均不能通过文本校验,校正流程结束。在遍历完该预设数量的前N位码,且所得到的校正后的卡号文本均不能通过文本校验的情况下,则输出文本校验未通过的卡号文本对应的卡号信息。
对于银行卡而言,N具体可以为6。预设数量可以根据需要设置,例如设置为100。
字符串匹配可以采用各种字符串匹配方法,本发明实施例优选采用字符串编辑距离算法得到匹配分值,匹配程度越高匹配分值就越高。卡号码表是预先存储的,可以根据卡片的各种编码来生成卡号码表,以银行卡为例,可以根据相关机构(例如银联)分配给各个银行的可用码可以生成卡号码表,该可用码为银行卡卡号的前6位码,根据各前6位码存储生成卡号码表。
以银行卡为例,本发明实施例的方法可以对任意旋转角度的银行卡图像进行识别,在识别完银行卡号后对其进行校验,若不满足银行卡校验规则(即卡号编码规则),则利用银行卡码表进行校正。若校正后的结果符合银行卡号编码规则,则输出校正后的结果,否则输出校正前的结果。利用仿射变换校正任意旋转角度的银行卡号文本条和利用银行卡码表校正识别的卡号,不仅扩大了能够处理的银行卡图像范围,而且也提高了银行卡图像的信息识别准确度。银行卡信息自动识别降低了人工录入的时间成本,在保险理赔场景中是提高理赔作业自动化识别的关键环节。
下面以保险场景下的银行卡图像信息提取为例,详细介绍本发明实施例的信息提取方法。
首先通过银行卡区域检测,定位图像中的银行卡区域,然后通过卡号文本条检测,定位文本条区域(即卡号文本区域),得到卡号的最小外接矩形。使用文本条旋转的方法对任意倾斜角度的卡号文本条进行校正,得到水平的卡号文本条。再通过图像分类算法将水平的卡号文本条进行分类,判断其是否需要旋转180度以使数字朝上(数字朝上即数字处于正向)。在数字朝上的基础上,通过文字识别对银行卡号文本条进行识别。最后校验识别结果,即按照卡号编码规则对识别出的卡号文本进行文本校验,若识别到的银行卡号不满足校验规则,则文本校验未通过,通过银行卡前六位码表(即卡号码表)进行校正。若校正后的结果符合银行卡号校验规则,则输出校正后的结果;若不符合,则输出校正前的结果。
本发明一个实施例的银行卡图像信息提取流程如图2所示,包括:
步骤S201:使用目标检测算法定位银行卡在图像中的区域,并将银行卡区域进行裁剪;
步骤S202:将裁剪的银行卡区域作为输入图像,使用文本检测算法确定银行卡号文本条在银行卡中的位置;
步骤S203:使用仿射变换算法将检测到的任意倾斜角度的银行卡号文本条旋转至水平方向,得到水平的银行卡号文本条;
步骤S204:使用图像分类算法确定水平的银行卡号文本条的文字方向是否为正向,若不是,则将水平的银行卡号文本条旋转180度,以使文字转为正向;
步骤S205:使用文字识别算法对卡号文本条进行识别;
步骤S206:对卡号文本条的识别结果进行文本校验,若不符合银行卡校验规则(即卡号编码规则,简称校验规则),则根据银行卡前六位数字码表进行校正;若校正后的结果符合校验规则,输出校正后的银行卡号,若不符合则输出校正前的识别结果。
下面对上述银行卡图像信息提取流程的各步骤进行详细介绍。
首先从图像中检测出银行卡区域。银行卡检测可以视为目标检测中的一种特殊示例,检测方法多种多样,例如FAST-RCNN、YOLO、SSD等方法。本发明实施例采用的目标检测算法是基于深度学习理论的EfficientDet算法,该方法提出了目标检测联合网络复杂度新的调整策略,在模型的深度、宽度和分辨率等参数间选择合适的平衡点,在不牺牲模型计算速度的前提下,大大提高了目标检测的准确度。
从银行卡区域中检测到银行卡号的最小外接矩形。银行卡号检测属于文本检测的范畴,当前的主流方法主要可分为检测和分割两大类。本发明实施例采用的文本检测方法是基于分割原理的PAN算法(一种基于分割的文本检测算法),该算法基于深度学习理论,通过引入级联模块,在不增加太多计算量的情况下使得不同的尺寸特征更深,更有表达力,同时将不同深度的级联模块特征进行融合,得到文本条区域的分割图像,由于该算法基于分割的思想,可以检测出任意倾斜角度的文本条。使用多边形最小外接矩形计算函数得到文本条区域的最小外接矩形。根据实际情况,银行卡中只会存在一个银行卡号,且该卡号文本框是银行卡中最长的文本条,通过遍历所有的最小外接矩形,选择其中长或者宽最大的最小外接矩形作为银行卡号区域。通过去除不必要的文本框,可以有效降低需要识别的文本框,提高后续流程的处理速度。
使用仿射变换将任意倾斜角度的最小外接矩形旋转至水平方向。本发明实施例通过对卡号文本条(即银行卡号文本条)旋转至水平方向,使得对于各种版式的卡片(例如横版银行卡或竖版银行卡、或其他特殊版式银行卡),都能得到水平的卡号文本。仿射变换是指在向量空间中进行一次线性变换(乘以一个矩阵)和一次平移(加上一个向量),变换到另一个向量空间的过程,该变换在图像处理领域有着广泛的应用,特别是在文字识别领域,由于现实中的文字存在各种旋转角度,必须将其校正至水平方向才能进行识别,否则文字识别的错误率将较高。
使用图像分类算法确认仿射变换后的水平的卡号文本条的文字方向是否朝上(即文字处于正向),若不朝上则将水平文本条旋转180度后使其文字方向朝上。对于经过仿射变换的水平文本条(即水平的银行卡号文本条)有两类,一类是文字方向朝上,一类是文字方向朝下(文字处于倒向)。因此可以将其视为一个分类问题,本发明实施例采用基于深度学习的EfficientNet算法对水平文本条进行分类。由于图像分类网络的输入通常为正方形,而银行卡号文本条为长方形,且其长宽比差异较大,无法直接作为网络输入。本发明实施例首先对水平文本条进行扩充,将其沿垂直方向进行整数倍复制,使得复制之后的垂直方向和水平方向的长度比最接近于1但小于1。对于分类为文字方向朝下的文本条需要旋转180度,使其文字方向朝上,即:需要通过旋转文本条方向将原本倒向的文字转为正向,以便于后续的文字识别算法进行处理。
使用文字识别算法识别文字方向朝上的水平文本条的信息。文字识别方法通常分为单字识别和多字识别,单字识别是指将文本条中的文字进行切分,单独识别每一个文字,多字识别则不进行切分,对整个文本条进行识别。本发明实施例优选采用基于深度学习理论的CRNN算法(一种端到端的文字识别的网络)对整个文本条进行多字识别。
对银行卡号文本条的识别结果进行校验。由于银行卡号满足一定的编码规则,并不是所有的16至19位数字都能组成合法的银行卡号,因此通过银行卡号校验方法可以确定银行卡号识别的结果是否错误。如果满足校验规则(即卡号编码规则),则直接返回识别结果。如果不满足校验规则,则进入后续银行卡号校正流程。本发明实施例采用的银行卡号校验算法为Luhn算法(模10算法)。具体算法为,从卡号最后一位数字开始遍历,奇数位不变直接相加求和;偶数位乘以2,如果乘积为两位数则减去9,然后求和;将奇数位和与偶数位和相加,若能被10整除,则满足银行卡号编码规则。
使用银行卡号前六位码表(即卡号码表)对不符合银行卡号校验规则的识别结果进行校正,卡号码表中包括各种银行卡号的前六位码(卡号前N位码的一个具体示例),该前六位码是相关机构(例如银联)分配给各个银行的可用码,若校正后符合银行卡号校验规则,则返回校正后的卡号;若不符合,则返回校正前的识别结果。具体地,选取识别结果的前六位与码表中前六位进行字符串匹配,按照得分值(即匹配分值)从高到低排列。遍历得分值最高的前一百位序号,使用卡号码表中对应序号的值(前六位码)代替识别结果的前六位,若校正后的结果符合银行卡校验规则,则退出遍历,返回校正后的结果;若遍历完前一百位仍不符合校验规则,对于未校正成功的识别结果返回其校正前的识别结果。由于对于任一张银行卡,其银行卡号的前六位通常是固定的某些数字,因此,本发明实施例将识别结果的前六位与卡号码表中的前六位码进行字符串匹配,例如,将某一银行卡号与卡号码表中的各前六位码匹配,按照匹配分值从高到低排序,如果存在相同匹配分值的多个前六位码,对于该相同匹配分值的多个前六位码可按设定规则排序(例如随机排序或按匹配顺序排序等,本发明实施例对此不作限定),通过上述排序得到匹配分值最高的100个前六位码,遍历该前一百位序号,将该银行卡号的前六位替换为当前遍历到的序号对应的前六位码,得到校正后的银行卡号,判断该校正后的银行卡号是否符合银行卡号校验规则,若符合,则退出遍历,否则,继续遍历下一前六位码,如果遍历完100个前六位码,未得到使得校正后的银行卡号符合银行卡号校验规则的前六位码,则表示校正未成功。
通过本发明实施例的上述校正过程,可以校正卡号前六位中出现的识别错误,有效地提高了识别准确率。
本发明实施例通过仿射变换可以将任意倾斜角度的文本条旋转至水平方向,相比于传统只能对某些固定倾斜度图像进行处理的银行卡识别方法,本发明实施例有效地扩大了数据的处理范围,能提升了银行卡信息提取的鲁棒性。由于正确的银行卡号是客户成功领取赔付款的关键性因素,本发明实施例通过上述流程,能够精准有效地提取出图像中任意旋转角度的银行卡号码信息,并有效地简化客户理赔的信息录入流程,提升用户体验,同时也可以减少人工作业量,提高保险作业的自动化程度。
图3是根据本发明一个实施例的信息提取装置的主要模块示意图。如图3所示,本发明一个实施例的信息提取装置300主要包括:文本区域定位模块301、文本条确定模块302、文本方向校验模块303、卡号信息提取模块304。
文本区域定位模块301,用于从卡片图像中定位出卡号文本区域;
文本条确定模块302,用于基于卡号文本区域得到水平的卡号文本条;
文本方向校验模块303,用于对水平的卡号文本条进行卡号文本方向校验,以确定水平的卡号文本条中卡号文本的方向为第一方向;
卡号信息提取模块304,用于对水平的卡号文本条中第一方向的卡号文本进行识别,以提取卡片图像中的卡号信息。
文本条确定模块302具体可以利用仿射变换算法将卡号文本区域旋转至水平方向,得到卡号文本朝向第一方向或第二方向的水平的卡号文本条,其中,第一方向与第二方向为相反方向。
文本方向校验模块303可利用图像分类算法,对水平的卡号文本条按照卡号文本方向分类;将卡号文本方向为第二方向的水平的卡号文本条旋转,以使卡号文本方向变为第一方向。
文本方向校验模块可包括文本方向分类子模块,用于:对水平的卡号文本条按照如下方式扩充:将水平的卡号文本条沿垂直方向进行整数倍复制,使得复制之后的垂直方向和水平方向的长度比最接近于1但小于1;将扩充后的水平的卡号文本条输入图像分类网络,以确定水平的卡号文本条的卡号文本方向为第一方向或第二方向。
卡号信息提取模块304具体用于:从水平的卡号文本条中识别出第一方向的卡号文本;按照卡号编码规则对识别出的卡号文本进行文本校验;输出文本校验通过的卡号文本对应的卡号信息。
卡号文本具体可以为银行卡号文本。
卡号信息提取模块304可以包括文本校验子模块,用于:对识别出的卡号文本从最后一位字符开始遍历,对于奇数位的字符直接求和以得到奇数位和,对处于偶数位的字符进行预设处理后再求和以得到偶数位和,将奇数位和与偶数位和相加,判断相加得到的结果是否满足预设条件,在满足预设条件的情况下,确定识别出的卡号文本通过文本校验。
卡号信息提取模块304包括文本校正子模块,用于:将文本校验未通过的卡号文本的前N位与卡号码表中的前N位码进行匹配,得到匹配分值,其中,N为预设值,卡号码表包括各类卡号的前N位码;对匹配分值排序,得到对应匹配分值最高的预设数量的前N位码,遍历该预设数量的前N位码以得到目标前N位码,目标前N位码是遍历到的第一个满足如下条件的前N位码:将文本校验未通过的卡号文本的前N位替换为该前N位码之后,所得到的校正后的卡号文本能够通过文本校验;卡号信息提取模块304还用于:输出前N位替换为目标前N位码的卡号文本对应的卡号信息。
另外,在本发明实施例中所述信息提取装置的具体实施内容,在上面所述信息提取方法中已经详细说明了,故在此重复内容不再说明。
图4示出了可以应用本发明实施例的信息提取方法或信息提取装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的信息提取方法一般由服务器405执行,相应地,信息提取装置一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。图5示出的终端设备或服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括文本区域定位模块、文本条确定模块、文本方向校验模块、卡号信息提取模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,文本区域定位模块还可以被描述为“用于从卡片图像中定位出卡号文本区域的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:从卡片图像中定位出卡号文本区域;基于所述卡号文本区域得到水平的卡号文本条;对所述水平的卡号文本条进行卡号文本方向校验,以确定所述水平的卡号文本条中卡号文本的方向为第一方向;对所述水平的卡号文本条中所述第一方向的卡号文本进行识别,以提取所述卡片图像中的卡号信息。
根据本发明实施例的技术方案,可以根据客户上传的银行卡图像识别出其中的银行卡号码,利用仿射变换将任意倾斜角度的银行卡号文本条旋转至水平方向,有效地提升了数据的处理范围和信息提取算法的鲁棒性,并对文本条进行垂直方向的复制以满足图像分类网络的输入条件,且可对识别的银行卡号码进行校验,当银行卡号码不符合校验规则,尝试对识别出的银行卡号码进行校正,若校正后的结果符合银行卡校验规则,则返回校正后的结果,若不符合则返回校验前的识别结果,有效降低信息录入的时间成本,提高信息录入的准确性,节省人力物力,提高理赔作业自动化。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种信息提取方法,其特征在于,包括:
从卡片图像中定位出卡号文本区域;
基于所述卡号文本区域得到水平的卡号文本条;
对所述水平的卡号文本条进行卡号文本方向校验,以确定所述水平的卡号文本条中卡号文本的方向为第一方向;
对所述水平的卡号文本条中所述第一方向的卡号文本进行识别,以提取所述卡片图像中的卡号信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述卡号文本区域得到水平的卡号文本条,包括:
利用仿射变换算法将所述卡号文本区域旋转至水平方向,得到卡号文本朝向所述第一方向或第二方向的所述水平的卡号文本条,其中,所述第一方向与所述第二方向为相反方向。
3.根据权利要求1所述的方法,其特征在于,对所述水平的卡号文本条进行卡号文本方向校验,以确定所述水平的卡号文本条中卡号文本的方向为第一方向,包括:
利用图像分类算法,对所述水平的卡号文本条按照卡号文本方向分类;
将卡号文本方向为所述第二方向的所述水平的卡号文本条旋转,以使卡号文本方向变为所述第一方向。
4.根据权利要求3所述的方法,其特征在于,所述利用图像分类算法,对所述水平的卡号文本条按照卡号文本方向分类,包括:
对所述水平的卡号文本条按照如下方式扩充:将所述水平的卡号文本条沿垂直方向进行整数倍复制,使得复制之后的垂直方向和水平方向的长度比最接近于1但小于1;
将扩充后的所述水平的卡号文本条输入图像分类网络,以确定所述水平的卡号文本条的卡号文本方向为所述第一方向或所述第二方向。
5.根据权利要求1所述的方法,其特征在于,所述对所述水平的卡号文本条中所述第一方向的卡号文本进行识别,以提取所述卡片图像中的卡号信息,包括:
从所述水平的卡号文本条中识别出所述第一方向的卡号文本;
按照卡号编码规则对识别出的卡号文本进行文本校验;
输出所述文本校验通过的卡号文本对应的卡号信息。
6.根据权利要求5所述的方法,其特征在于,所述卡号文本为银行卡号文本;
所述按照卡号编码规则对识别出的卡号文本进行文本校验,包括:
对所述识别出的卡号文本从最后一位字符开始遍历,对于奇数位的字符直接求和以得到奇数位和,对处于偶数位的字符进行预设处理后再求和以得到偶数位和,将所述奇数位和与所述偶数位和相加,判断相加得到的结果是否满足预设条件,在满足所述预设条件的情况下,确定所述识别出的卡号文本通过所述文本校验。
7.根据权利要求5所述的方法,其特征在于,还包括:
将文本校验未通过的卡号文本的前N位与卡号码表中的前N位码进行匹配,得到匹配分值,其中,N为预设值,所述卡号码表包括各类卡号的前N位码;
对所述匹配分值排序,得到对应匹配分值最高的预设数量的前N位码,遍历该预设数量的前N位码以得到目标前N位码,所述目标前N位码是遍历到的第一个满足如下条件的前N位码:将所述文本校验未通过的卡号文本的前N位替换为该前N位码之后,所得到的校正后的卡号文本能够通过所述文本校验;
输出前N位替换为所述目标前N位码的卡号文本对应的卡号信息。
8.一种信息提取装置,其特征在于,包括:
文本区域定位模块,用于从卡片图像中定位出卡号文本区域;
文本条确定模块,用于基于所述卡号文本区域得到水平的卡号文本条;
文本方向校验模块,用于对所述水平的卡号文本条进行卡号文本方向校验,以确定所述水平的卡号文本条中卡号文本的方向为第一方向;
卡号信息提取模块,用于对所述水平的卡号文本条中所述第一方向的卡号文本进行识别,以提取所述卡片图像中的卡号信息。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111024160.6A CN113963339B (zh) | 2021-09-02 | 2021-09-02 | 一种信息提取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111024160.6A CN113963339B (zh) | 2021-09-02 | 2021-09-02 | 一种信息提取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113963339A true CN113963339A (zh) | 2022-01-21 |
CN113963339B CN113963339B (zh) | 2024-08-13 |
Family
ID=79460734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111024160.6A Active CN113963339B (zh) | 2021-09-02 | 2021-09-02 | 一种信息提取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113963339B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658326A (zh) * | 2017-10-11 | 2019-04-19 | 深圳市中兴微电子技术有限公司 | 一种图像显示方法及装置、计算机可读存储介质 |
CN109977935A (zh) * | 2019-02-27 | 2019-07-05 | 平安科技(深圳)有限公司 | 一种文本识别方法及装置 |
CN110147787A (zh) * | 2019-05-16 | 2019-08-20 | 深圳市信联征信有限公司 | 基于深度学习的银行卡号自动识别方法及系统 |
KR20190106853A (ko) * | 2019-08-27 | 2019-09-18 | 엘지전자 주식회사 | 텍스트 인식 장치 및 방법 |
CN110516676A (zh) * | 2019-08-21 | 2019-11-29 | 河海大学常州校区 | 一种基于图像处理的银行卡号识别系统 |
CN110543812A (zh) * | 2019-07-19 | 2019-12-06 | 拉扎斯网络科技(上海)有限公司 | 信息提取方法及装置、电子设备及存储介质 |
CA3050025A1 (en) * | 2018-07-19 | 2020-01-19 | Tata Consultancy Services Limited | Systems and methods for end-to-end handwritten text recognition using neural networks |
CN110807454A (zh) * | 2019-09-19 | 2020-02-18 | 平安科技(深圳)有限公司 | 基于图像分割的文字定位方法、装置、设备及存储介质 |
CN111368697A (zh) * | 2020-02-28 | 2020-07-03 | 中国建设银行股份有限公司 | 一种信息识别方法和装置 |
CN111723801A (zh) * | 2020-06-26 | 2020-09-29 | 南京甄视智能科技有限公司 | 鱼眼相机图片中目标检测矫正的方法与系统 |
CN111783761A (zh) * | 2020-06-30 | 2020-10-16 | 苏州科达科技股份有限公司 | 证件文本的检测方法、装置及电子设备 |
CN111950353A (zh) * | 2020-06-30 | 2020-11-17 | 深圳市雄帝科技股份有限公司 | 印章文本识别方法、装置及电子设备 |
CN112016547A (zh) * | 2020-08-20 | 2020-12-01 | 上海天壤智能科技有限公司 | 基于深度学习的图像文字识别方法、系统及介质 |
CN112508015A (zh) * | 2020-12-15 | 2021-03-16 | 山东大学 | 一种铭牌识别方法、计算机设备、存储介质 |
CN112818979A (zh) * | 2020-08-26 | 2021-05-18 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、设备及存储介质 |
KR20210072639A (ko) * | 2019-12-09 | 2021-06-17 | 박지윤 | 문자를 포함한 이미지 정렬 처리방법 |
-
2021
- 2021-09-02 CN CN202111024160.6A patent/CN113963339B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658326A (zh) * | 2017-10-11 | 2019-04-19 | 深圳市中兴微电子技术有限公司 | 一种图像显示方法及装置、计算机可读存储介质 |
CA3050025A1 (en) * | 2018-07-19 | 2020-01-19 | Tata Consultancy Services Limited | Systems and methods for end-to-end handwritten text recognition using neural networks |
CN109977935A (zh) * | 2019-02-27 | 2019-07-05 | 平安科技(深圳)有限公司 | 一种文本识别方法及装置 |
CN110147787A (zh) * | 2019-05-16 | 2019-08-20 | 深圳市信联征信有限公司 | 基于深度学习的银行卡号自动识别方法及系统 |
CN110543812A (zh) * | 2019-07-19 | 2019-12-06 | 拉扎斯网络科技(上海)有限公司 | 信息提取方法及装置、电子设备及存储介质 |
CN110516676A (zh) * | 2019-08-21 | 2019-11-29 | 河海大学常州校区 | 一种基于图像处理的银行卡号识别系统 |
US20210064871A1 (en) * | 2019-08-27 | 2021-03-04 | Lg Electronics Inc. | Apparatus and method for recognition of text information |
KR20190106853A (ko) * | 2019-08-27 | 2019-09-18 | 엘지전자 주식회사 | 텍스트 인식 장치 및 방법 |
CN110807454A (zh) * | 2019-09-19 | 2020-02-18 | 平安科技(深圳)有限公司 | 基于图像分割的文字定位方法、装置、设备及存储介质 |
KR20210072639A (ko) * | 2019-12-09 | 2021-06-17 | 박지윤 | 문자를 포함한 이미지 정렬 처리방법 |
CN111368697A (zh) * | 2020-02-28 | 2020-07-03 | 中国建设银行股份有限公司 | 一种信息识别方法和装置 |
CN111723801A (zh) * | 2020-06-26 | 2020-09-29 | 南京甄视智能科技有限公司 | 鱼眼相机图片中目标检测矫正的方法与系统 |
CN111950353A (zh) * | 2020-06-30 | 2020-11-17 | 深圳市雄帝科技股份有限公司 | 印章文本识别方法、装置及电子设备 |
CN111783761A (zh) * | 2020-06-30 | 2020-10-16 | 苏州科达科技股份有限公司 | 证件文本的检测方法、装置及电子设备 |
CN112016547A (zh) * | 2020-08-20 | 2020-12-01 | 上海天壤智能科技有限公司 | 基于深度学习的图像文字识别方法、系统及介质 |
CN112818979A (zh) * | 2020-08-26 | 2021-05-18 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、设备及存储介质 |
CN112508015A (zh) * | 2020-12-15 | 2021-03-16 | 山东大学 | 一种铭牌识别方法、计算机设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113963339B (zh) | 2024-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9684843B2 (en) | Video capture in data capture scenario | |
CN114612921B (zh) | 表单识别方法、装置、电子设备和计算机可读介质 | |
CN113627439A (zh) | 文本结构化处理方法、处理装置、电子设备以及存储介质 | |
CN112818852A (zh) | 印章校验方法、装置、设备及存储介质 | |
CN111368697A (zh) | 一种信息识别方法和装置 | |
CN112632952A (zh) | 一种对比文件的方法和装置 | |
CN106611148B (zh) | 基于图像的离线公式识别方法和装置 | |
CN113313114B (zh) | 证件信息获取方法、装置、设备以及存储介质 | |
CN112396048A (zh) | 图片信息提取方法、装置、计算机设备及存储介质 | |
CN113887375A (zh) | 一种文本识别方法、装置、设备及存储介质 | |
US20230306619A1 (en) | Three-dimensional reconstruction method, apparatus, and device, and computer readable storage medium | |
CN111178352A (zh) | 一种验证码字符识别的方法和装置 | |
CN111611388A (zh) | 账号分类方法、装置和设备 | |
CN112989154A (zh) | 一种短标题生成方法和装置 | |
JP7515697B2 (ja) | 画像サンプル生成方法、テキスト認識方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
CN113963339B (zh) | 一种信息提取方法和装置 | |
CN111368693A (zh) | 一种身份证信息的识别方法和装置 | |
US20230237272A1 (en) | Table column identification using machine learning | |
CN111881778B (zh) | 文本检测的方法、装置、设备和计算机可读介质 | |
CN115690795A (zh) | 简历信息提取方法、装置、电子设备和存储介质 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
CN113742485A (zh) | 一种处理文本的方法和装置 | |
CN114049686A (zh) | 签名识别模型训练方法、装置及电子设备 | |
CN114240780A (zh) | 印鉴识别的方法、装置、设备、介质和产品 | |
CN114339208A (zh) | 视频测试方法、装置、电子设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |