CN112380957A - 他项权证信息识别方法、装置、计算机设备和存储介质 - Google Patents
他项权证信息识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112380957A CN112380957A CN202011249540.5A CN202011249540A CN112380957A CN 112380957 A CN112380957 A CN 112380957A CN 202011249540 A CN202011249540 A CN 202011249540A CN 112380957 A CN112380957 A CN 112380957A
- Authority
- CN
- China
- Prior art keywords
- image
- certificate
- rectangular frame
- preset
- ticket
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
Abstract
本申请涉及图像提取技术领域,提供了一种他项权证信息识别方法、装置、计算机设备和存储介质,获取他项权证的证件图像;对所述证件图像进行预处理;将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中。基于图像识别技术自动从他项权证的证件图像中识别出信息显示在页面中,同时还可以对印章层进行校正,对校正后的所述印章层进行印章的验证,以验证他项权证的有效性。
Description
技术领域
本申请涉及图像提取的技术领域,特别涉及一种他项权证信息识别方法、装置、计算机设备和存储介质。
背景技术
目前,传统他项权证的信息上传页面中,抵押专员需要获取到客户的纸质他项权证证书,并通过肉眼的识别,手工录入他项权证的每个字段信息,这容易给用户造成较差的体验且存在一定的失误率,且录入效率低下。同时,抵押专员资源大量投入于检查、录入、上传等简单、重复、低价值的劳动中,使得整体工作效率难以提升,运营成本居高不下,客户满意度也受到了影响。
发明内容
本申请的主要目的为提供一种他项权证信息识别方法、装置、计算机设备和存储介质,旨在克服目前依靠人工进行信息录入时容易出错以及录入效率低下的缺陷。
为实现上述目的,本申请提供了一种他项权证信息识别方法,应用于后台终端,包括以下步骤:
获取他项权证的证件图像;
对所述证件图像进行预处理;
将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;
对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;
对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中;
对所述印章层进行校正,对校正后的所述印章层进行哈希计算得到对应的哈希值,并在预设的数据库中查找是否存在所述哈希值;若存在,则识别所述印章层中的印章为真实印章;若不存在,则识别所述印章层中的印章为伪造印章。
进一步地,所述获取他项权证的证件图像的步骤,包括:
接收前端上传的第一图像、第二图像以及第三图像;其中,所述第一图像、第二图像以及第三图像为所述前端对所述证件图像基于预设裁剪规则裁剪所得;
根据预设的拼接规则,将所述第一图像、第二图像以及第三图像拼接为所述证件图像;其中所述预设的拼接规则与所述预设裁剪规则所对应。
进一步地,所述前端对所述证件图像基于预设裁剪规则裁剪的步骤,包括:
获取他项权证的原始证件图像,并获取所述原始证件图像的像素大小以及存储大小;
判断所述原始证件图像的像素大小以及存储大小是否均小于对应的预设值;
若否,则检测出所述原始证件图像的中心点,并以所述中心点为几何中心作一第一矩形框;
以所述第一矩形框的边框进行裁剪,得到所述第一矩形框中的第一图像,以及所述第一矩形框外的裁剪图像;
在所述裁剪图像中以所述中心点为几何中心作一第二矩形框,所述第二矩形框的长、宽均大于所述第一矩形框的长、宽;
以所述第二矩形框的边框进行裁剪,得到所述第二矩形框中的第二图像,以及所述第二矩形框外的第三图像;
将所述第一图像、第二图像以及第三图像分别进行上传至后台终端。
进一步地,所述获取他项权证的证件图像的步骤之后,包括:
裁剪所述证件图像的空白区域,将裁剪后的所述证件图像调整为预设分辨率以及预设尺寸大小的第四图像;
将所述第四图像填充至预设的第一区域中;
截取所述第一区域中多个指定位置的第一图像;
采用文字识别算法识别所述第一图像中包括的标示文字信息;所述标示文字信息包括他证号以及权利人;
在预设的数据库中查询所述标示文字信息,并验证所述他证号以及权利人是否匹配;若匹配,则验证所述证件图像合格。
进一步地,所述获取他项权证的证件图像的步骤之后,包括:
通过JavaScript函数调用Flash通过ExternalInterface.addCallback注册的摄像头关闭方法;
调用NetStream对象的attachAudio方法传入null,以对所有NetStream数组中的每一个NetStream对象进行清理操作;
调用NetConnection对象的close方法,并将所述close方法置为null,以对所有NetConnection数组中的每一个NetConnection对象进行清理操作;
将摄像头对象置为null,将调用Camera.getCamera方法传入null,调用摄像头显示控件的attachCamera方法传入null、clear方法,并且调用Flash的removeChild方法从Flash中移除摄像头显示控件,调用Flash的ExternalInterface.call方法更改摄像头关闭状态为成功。
本申请还提供了一种他项权证信息识别装置,应用于后台终端,包括:
获取单元,用于获取他项权证的证件图像;
预处理单元,用于对所述证件图像进行预处理;
比对单元,用于将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;
提取单元,用于对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;
识别单元,用于对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中;
验证单元,用于对所述印章层进行校正,对校正后的所述印章层进行哈希计算得到对应的哈希值,并在预设的数据库中查找是否存在所述哈希值;若存在,则识别所述印章层中的印章为真实印章;若不存在,则识别所述印章层中的印章为伪造印章。
进一步地,所述获取单元,具体用于:
接收前端上传的第一图像、第二图像以及第三图像;其中,所述第一图像、第二图像以及第三图像为所述前端对所述证件图像基于预设裁剪规则裁剪所得;
根据预设的拼接规则,将所述第一图像、第二图像以及第三图像拼接为所述证件图像;其中所述预设的拼接规则与所述预设裁剪规则所对应。
进一步地,所述前端对所述证件图像基于预设裁剪规则裁剪,包括:
获取他项权证的原始证件图像,并获取所述原始证件图像的像素大小以及存储大小;
判断所述原始证件图像的像素大小以及存储大小是否均小于对应的预设值;
若否,则检测出所述原始证件图像的中心点,并以所述中心点为几何中心作一第一矩形框;
以所述第一矩形框的边框进行裁剪,得到所述第一矩形框中的第一图像,以及所述第一矩形框外的裁剪图像;
在所述裁剪图像中以所述中心点为几何中心作一第二矩形框,所述第二矩形框的长、宽均大于所述第一矩形框的长、宽;
以所述第二矩形框的边框进行裁剪,得到所述第二矩形框中的第二图像,以及所述第二矩形框外的第三图像;
将所述第一图像、第二图像以及第三图像分别进行上传至后台终端。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请提供的他项权证信息识别方法、装置、计算机设备和存储介质,获取他项权证的证件图像;对所述证件图像进行预处理;将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中。基于图像识别技术自动从他项权证的证件图像中识别出信息显示在页面中,同时还可以对印章层进行校正,对校正后的所述印章层进行印章的验证,以验证他项权证的有效性。
附图说明
图1是本申请一实施例中他项权证信息识别方法步骤示意图;
图2是本申请一实施例中他项权证信息识别装置结构框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例中提供了一种他项权证信息识别方法,应用于后台终端,包括以下步骤:
步骤S1,获取他项权证的证件图像;
步骤S2,对所述证件图像进行预处理;
步骤S3,将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;
步骤S4,对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;
步骤S5,对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中;
步骤S6,对所述印章层进行校正,对校正后的所述印章层进行哈希计算得到对应的哈希值,并在预设的数据库中查找是否存在所述哈希值;若存在,则识别所述印章层中的印章为真实印章;若不存在,则识别所述印章层中的印章为伪造印章。
在本实施例中,上述方法应用于自动录入他项权证的信息的场景中,采用图像识别技术进行自动录入信息,避免人工录入时的错误,且可以显著提高录入效率。本申请中的方法还可以应用于智慧城市的场景中,以推动智慧城市的建设。上述后台终端为后台服务器等识别证件图像以录入信息的设备。
上述步骤S1中,上述证件图像可以通过扫描仪扫描获取,或者通过摄像头采集获取,获取到证件图像时,判断图像文件大小、分辨率限制,对不同的图像格式,进行不同的存储格式,不同的压缩方式处理,确定红色签章在他项权证的证件图像中的位置。
上述步骤S2中,由于证件纸张的厚薄、光洁度和印刷质量都会造成文字畸变,产生断笔、粘连和污点等干扰,所以在进行文字识别之前,要对带有噪声的证件图像进行处理。预处理一般包括灰度化、二值化,倾斜检测与校正,行、字切分,平滑,规范化
灰度化:将原本由三维描述的像素点,映射为一维描述的像素点;
二值化:为了让计算机更快的,更好的识别文字,需要对彩色图进行处理,使图片只剩下前景信息和背景信息,定义前景信息为黑色,背景信息为白色;
噪声去除:根据噪声的特征进行去噪;
倾斜矫正:由计算机自动分析文本图像的版面特征,估计图像的倾斜角度,并根据倾斜角度对文本图像进行校正;
版面分析:将文档图片分段落,分行。
上述步骤S3中,特征库中预存有多个证件图像模板,该证件图像模板中展示出了证件中不同区域所展示的字段内容。将上述预处理后的图像与特征库中的证件图像模板进行比对,确定出各个字段所在的位置,并从上述预处理后的图像中截取出各个字段所在位置的图像,即将上述预处理的图像截取得到多个小图像。
上述步骤S4-S6中,对各个字段所在位置的图像进行OCR文字识别,所识别到的信息包括他证号、证明权利或事项、权利人(申请人)、义务人、坐落、不动产单元号、其他、附记等信息。
为了提升识别效果,避免印章覆盖住文字的情况导致文字/日期解析不正确,在本实施例中,将图像中的文字和印章等信息分层提取出来并进行读取解析;
在本实施例中,在印章层中识别到印章的位置,需要对印章进行校正,自动摆正印章,并验证印章的真伪性。
在本实施例中,上述印章盖在他项权证的证件上时,则对印章层进行哈希计算得到一个真实哈希值存储在数据库中。在验证印章层中的印章是否真实时,只需要对印章层进行同样的哈希计算,便可以得到一个哈希值,并在数据库中查找该哈希值,若查找到,则表明该印章为真实印章;若查找不到,则表明为虚假印章。验证印章的真伪时,若采用图像识别、图像匹配等方式进行验证,比较耗时间,对设备性能要求较高。在本实施例中,只需要对印章层进行哈希计算,计算量相对较小,可以快速进行验证,且对设备性能要求不高。在其它实施例中,可以通过扫描恢复技术识别印章的真伪。
在一实施例中,所述获取他项权证的证件图像的步骤S1,包括:
接收前端上传的第一图像、第二图像以及第三图像;其中,所述第一图像、第二图像以及第三图像为所述前端对所述证件图像基于预设裁剪规则裁剪所得;
根据预设的拼接规则,将所述第一图像、第二图像以及第三图像拼接为所述证件图像;其中所述预设的拼接规则与所述预设裁剪规则所对应。
具体地,在一实施例中,所述前端对所述证件图像基于预设裁剪规则裁剪的步骤,包括:
获取他项权证的原始证件图像,并获取所述原始证件图像的像素大小以及存储大小;
判断所述原始证件图像的像素大小以及存储大小是否均小于对应的预设值;
若否,则检测出所述原始证件图像的中心点,并以所述中心点为几何中心作一第一矩形框;
以所述第一矩形框的边框进行裁剪,得到所述第一矩形框中的第一图像,以及所述第一矩形框外的裁剪图像;
在所述裁剪图像中以所述中心点为几何中心作一第二矩形框,所述第二矩形框的长、宽均大于所述第一矩形框的长、宽;
以所述第二矩形框的边框进行裁剪,得到所述第二矩形框中的第二图像,以及所述第二矩形框外的第三图像;
将所述第一图像、第二图像以及第三图像分别进行上传至后台终端。
在本实施例中,提出一种获取证件图像的具体过程,前端将证件图像基于预设裁剪规则裁剪为第一图像、第二图像以及第三图像,后台终端接收到上述第一图像、第二图像以及第三图像之后,再将其拼接,还原为证件图像。上述过程主要为了避免前端上传证件图像时,由于证件图像的像素大小以及存储大小超出规定无法上传时,对其进行裁剪处理便于上传。
在本实施例中,上述前端可以是用户的手机端,或者是扫描仪等可以采集图像的终端,其通过摄像头或者扫描仪获取到纸质他项权证的原始证件图像;由于扫描仪的扫描规格或者摄像头的规格的不同,其对应获取到的原始证件图像的各项参数会有所不同,例如像素大小、存储大小等;在上传图像的系统中,对应设置有相应的上传要求,即在上传上述图像时,只上传满足上传条件的图像。
因此,需要获取上述原始证件图像的像素大小以及存储大小;进而判断所述原始证件图像的像素大小以及存储大小是否均小于对应的预设值,即判断上述原始证件图像是否满足上传要求。若像素大小以及存储大小均小于对应的预设值,则满足上传要求,则可以直接上传上述原始证件图像;若其中任意一项不小于对应的预设值,则可以认定为不满足上传要求,此时需要对其进行相应的图像处理,以使得上述原始证件图像其满足上传要求。
具体地,检测出上述原始证件图像的中心点,并以该中心点为几何中心作一个矩形框,即上述第一矩形框,该矩形框的几何中心即为该矩形框的重心点;以上述第一矩形框的边框进行裁剪,得到所述第一矩形框中的第一图像,以及所述第一矩形框外的裁剪图像;该第一图像的大小等于上述第一矩形框的大小,该第一图像只为上述原始证件图像的一部分,其存储大小以及像素大小远小于上述原始证件图像的存储大小以及像素大小;在其他实施例中,还可以根据上述原始证件图像的像素大小或者存储大小确定上述第一矩形框的边长;例如当上述原始证件图像的存储大小为对应的预设值的两倍时,则上述第一矩形框的长宽可以分别为所述原始证件图像的长宽的一半,则上述第一矩形框的面积为上述原始证件图像的四分之一。
上述第一矩形框外的裁剪图像指的是上述原始证件图像中去除第一图像的图像内容之外的图像;由于上述原始证件图像中去除了上述第一图像的图像内容,则其存储大小可以得到降低。
为了进一步地降低上述裁剪图像的存储大小,则可以在裁剪图像中以所述中心点为几何中心作一个第二矩形框,所述第二矩形框的长、宽均大于所述第一矩形框的长、宽;并以所述第二矩形框的边框进行裁剪,得到所述第二矩形框中的第二图像,以及所述第二矩形框外的第三图像;上述第二图像为一矩形图像,且由于该第二图像中心具有一个等于第一矩形框的空白区域,则其存储大小较小;而上述第三图像指的是上述裁剪图像中去除第二图像的图像内容之后的图像,其存储大小得到进一步降低。可以理解的是,上述第二矩形框的长宽也可以根据上述原始证件图像的像素大小或者存储大小来确定。在得到上述第三图像之后,可以检查上述第三图像的存储大小,并判断其是否大于对应的预设值,若不大于,则可以进入下一步骤;若依然大于,则可以继续在第三图像中作矩形框进行图像分割,在此不再进行赘述。
将上述第一图像、第二图像以及第三图像分别进行上传,由于上述图像均只是上述原始证件图像中的一部分,因此,可以使得存储大小显著降低,可以通过上述系统依次进行上传。同时,上述第一图像、第二图像以及第三图像中的具有图像内容的区域形状明显不同,且第三图像中的空白区域切合上述第二图像的外部形状,第二图像中的空白区域切合上述第一图像的外部形状。
在分别上传上述第一图像、第二图像以及第三图像之后,则可以根据上述第一图像、第二图像以及第三图像的形状进行组合拼接得到一张拼接图像,作为所述他项权证的证件图像;即直接将上述第二图像置于上述第三图像的空白区域,再将所述第一图像置于上述第二图像的空白区域,最后进行合成得到完整的证件图像。在上述过程中,由于上述第一图像、第二图像以及第三图像中的具有图像内容的区域形状明显不同,无需对其进行标记顺序,只需要根据其形状,将其对应进行组合、合成为最终的证件图像。不仅可以使得上述原始证件图像可以成功上传,而且在图像处理过程中的数据处理量较低;同时,没有对上述原始证件图像进行压缩处理,不会降低其图像质量,保持清晰度不变。
在一实施例中,所述获取他项权证的证件图像的步骤S1之后,包括:
裁剪所述证件图像的空白区域,将裁剪后的所述证件图像调整为预设分辨率以及预设尺寸大小的第四图像;
将所述第四图像填充至预设的第一区域中;
截取所述第一区域中多个指定位置的第一图像;
采用文字识别算法识别所述第一图像中包括的标示文字信息;所述标示文字信息包括他证号以及权利人;
在预设的数据库中查询所述标示文字信息,并验证所述他证号以及权利人是否匹配;若匹配,则验证所述证件图像合格。
在本实施例中,为了便于图像识别,快速从证件图像中识别出他证号以及权利人信息,从而根据识别出的他证号以及权利人信息验证证件图像是否合格。因此,对证件图像进行标准化处理,具体地,裁剪所述证件图像在四周边缘的空白区域,仅留下中部具有图像的部分,再将裁剪后的所述证件图像调整为预设分辨率以及预设尺寸大小的第四图像,得到标准化的图像。
在预设的第一区域中,预先设置有多个指定位置,该指定位置是标准化的证件图像中具有用户所需要信息对应的位置。因此,只需要将上述标准化的第四图像填充至预设的第一区域中,然后截取到第一区域中中多个指定位置的第一图像,便可以得到用户需要的指定信息所对应的图像;进而再对第一图像进行文字识别,便可以得到指定信息,例如他证号以及权利人。
在一实施例中,上述步骤S1中通过终端的摄像头获取他项权证的证件图像,因此,在获取到证件图像之后,需要关闭上述摄像头,本实施例中,采用字段调用后台方法并修改参数的方式自动关闭摄像头,避免其一直开启,降低设备功耗。
具体地,所述获取他项权证的证件图像的步骤S1之后,包括:
通过JavaScript函数调用Flash通过ExternalInterface.addCallback注册的摄像头关闭方法;
调用NetStream对象的attachAudio方法传入null,以对所有NetStream数组中的每一个NetStream对象进行清理操作;
调用NetConnection对象的close方法,并将所述close方法置为null,以对所有NetConnection数组中的每一个NetConnection对象进行清理操作;
将摄像头对象置为null,将调用Camera.getCamera方法传入null,调用摄像头显示控件的attachCamera方法传入null、clear方法,并且调用Flash的removeChild方法从Flash中移除摄像头显示控件,调用Flash的ExternalInterface.call方法更改摄像头关闭状态为成功。
参照图2,本申请一实施例中还提供了一种他项权证信息识别装置,应用于后台终端,包括:
获取单元10,用于获取他项权证的证件图像;
预处理单元20,用于对所述证件图像进行预处理;
比对单元30,用于将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;
提取单元40,用于对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;
识别单元50,用于对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中;
验证单元60,用于对所述印章层进行校正,对校正后的所述印章层进行哈希计算得到对应的哈希值,并在预设的数据库中查找是否存在所述哈希值;若存在,则识别所述印章层中的印章为真实印章;若不存在,则识别所述印章层中的印章为伪造印章。
在一实施例中,所述获取单元10,具体用于:
接收前端上传的第一图像、第二图像以及第三图像;其中,所述第一图像、第二图像以及第三图像为所述前端对所述证件图像基于预设裁剪规则裁剪所得;
根据预设的拼接规则,将所述第一图像、第二图像以及第三图像拼接为所述证件图像;其中所述预设的拼接规则与所述预设裁剪规则所对应。
在一实施例中,所述前端对所述证件图像基于预设裁剪规则裁剪,包括:
获取他项权证的原始证件图像,并获取所述原始证件图像的像素大小以及存储大小;
判断所述原始证件图像的像素大小以及存储大小是否均小于对应的预设值;
若否,则检测出所述原始证件图像的中心点,并以所述中心点为几何中心作一第一矩形框;
以所述第一矩形框的边框进行裁剪,得到所述第一矩形框中的第一图像,以及所述第一矩形框外的裁剪图像;
在所述裁剪图像中以所述中心点为几何中心作一第二矩形框,所述第二矩形框的长、宽均大于所述第一矩形框的长、宽;
以所述第二矩形框的边框进行裁剪,得到所述第二矩形框中的第二图像,以及所述第二矩形框外的第三图像;
将所述第一图像、第二图像以及第三图像分别进行上传至后台终端。
在一实施例中,上述他项权证信息识别装置,还包括:
裁剪单元,用于裁剪所述证件图像的空白区域,将裁剪后的所述证件图像调整为预设分辨率以及预设尺寸大小的第四图像;
填充单元,用于将所述第四图像填充至预设的第一区域中;
截取单元,用于截取所述第一区域中多个指定位置的第一图像;
文字识别单元,用于采用文字识别算法识别所述第一图像中包括的标示文字信息;所述标示文字信息包括他证号以及权利人;
查询单元,用于在预设的数据库中查询所述标示文字信息,并验证所述他证号以及权利人是否匹配;若匹配,则验证所述证件图像合格。
在一实施例中,上述他项权证信息识别装置,还包括:
第一调用单元,用于通过JavaScript函数调用Flash通过ExternalInterface.addCallback注册的摄像头关闭方法;
第二调用单元,用于调用NetStream对象的attachAudio方法传入null,以对所有NetStream数组中的每一个NetStream对象进行清理操作;
第三调用单元,用于调用NetConnection对象的close方法,并将所述close方法置为null,以对所有NetConnection数组中的每一个NetConnection对象进行清理操作;
第四调用单元,用于将摄像头对象置为null,将调用Camera.getCamera方法传入null,调用摄像头显示控件的attachCamera方法传入null、clear方法,并且调用Flash的removeChild方法从Flash中移除摄像头显示控件,调用Flash的ExternalInterface.call方法更改摄像头关闭状态为成功。
在本实施例中,上述装置实施例中的各个单元的具体实现请参照上述方法实施例中所述,在此不再进行赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储他项权证信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种他项权证信息识别方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种他项权证信息识别方法。可以理解的是,本实施例中的计算机可读存储介质可以是易失性可读存储介质,也可以为非易失性可读存储介质。
综上所述,为本申请实施例中提供的他项权证信息识别方法、装置、计算机设备和存储介质,获取他项权证的证件图像;对所述证件图像进行预处理;将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中。基于图像识别技术自动从他项权证的证件图像中识别出信息显示在页面中,同时还可以对印章层进行校正,对校正后的所述印章层进行印章的验证,以验证他项权证的有效性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种他项权证信息识别方法,应用于后台终端,其特征在于,包括以下步骤:
获取他项权证的证件图像;
对所述证件图像进行预处理;
将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;
对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;
对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中;
对所述印章层进行校正,对校正后的所述印章层进行哈希计算得到对应的哈希值,并在预设的数据库中查找是否存在所述哈希值;若存在,则识别所述印章层中的印章为真实印章;若不存在,则识别所述印章层中的印章为伪造印章。
2.根据权利要求1所述的他项权证信息识别方法,其特征在于,所述获取他项权证的证件图像的步骤,包括:
接收前端上传的第一图像、第二图像以及第三图像;其中,所述第一图像、第二图像以及第三图像为所述前端对所述证件图像基于预设裁剪规则裁剪所得;
根据预设的拼接规则,将所述第一图像、第二图像以及第三图像拼接为所述证件图像;其中所述预设的拼接规则与所述预设裁剪规则所对应。
3.根据权利要求2所述的他项权证信息识别方法,其特征在于,所述前端对所述证件图像基于预设裁剪规则裁剪的步骤,包括:
获取他项权证的原始证件图像,并获取所述原始证件图像的像素大小以及存储大小;
判断所述原始证件图像的像素大小以及存储大小是否均小于对应的预设值;
若否,则检测出所述原始证件图像的中心点,并以所述中心点为几何中心作一第一矩形框;
以所述第一矩形框的边框进行裁剪,得到所述第一矩形框中的第一图像,以及所述第一矩形框外的裁剪图像;
在所述裁剪图像中以所述中心点为几何中心作一第二矩形框,所述第二矩形框的长、宽均大于所述第一矩形框的长、宽;
以所述第二矩形框的边框进行裁剪,得到所述第二矩形框中的第二图像,以及所述第二矩形框外的第三图像;
将所述第一图像、第二图像以及第三图像分别进行上传至后台终端。
4.根据权利要求1所述的他项权证信息识别方法,其特征在于,所述获取他项权证的证件图像的步骤之后,包括:
裁剪所述证件图像的空白区域,将裁剪后的所述证件图像调整为预设分辨率以及预设尺寸大小的第四图像;
将所述第四图像填充至预设的第一区域中;
截取所述第一区域中多个指定位置的第一图像;
采用文字识别算法识别所述第一图像中包括的标示文字信息;所述标示文字信息包括他证号以及权利人;
在预设的数据库中查询所述标示文字信息,并验证所述他证号以及权利人是否匹配;若匹配,则验证所述证件图像合格。
5.根据权利要求1所述的他项权证信息识别方法,其特征在于,所述获取他项权证的证件图像的步骤之后,包括:
通过JavaScript函数调用Flash通过ExternalInterface.addCallback注册的摄像头关闭方法;
调用NetStream对象的attachAudio方法传入null,以对所有NetStream数组中的每一个NetStream对象进行清理操作;
调用NetConnection对象的close方法,并将所述close方法置为null,以对所有NetConnection数组中的每一个NetConnection对象进行清理操作;
将摄像头对象置为null,将调用Camera.getCamera方法传入null,调用摄像头显示控件的attachCamera方法传入null、clear方法,并且调用Flash的removeChild方法从Flash中移除摄像头显示控件,调用Flash的ExternalInterface.call方法更改摄像头关闭状态为成功。
6.一种他项权证信息识别装置,应用于后台终端,其特征在于,包括:
获取单元,用于获取他项权证的证件图像;
预处理单元,用于对所述证件图像进行预处理;
比对单元,用于将预处理后的证件图像与特征库中的预设证件图像模板进行比对,确定出所述证件图像中各个字段所在的位置,并截取出各个字段所在位置的图像;
提取单元,用于对各个字段所在位置的图像进行分层提取,得到文字层以及印章层;
识别单元,用于对所述文字层进行OCR文字识别,并将识别到的信息显示在页面中;
验证单元,用于对所述印章层进行校正,对校正后的所述印章层进行哈希计算得到对应的哈希值,并在预设的数据库中查找是否存在所述哈希值;若存在,则识别所述印章层中的印章为真实印章;若不存在,则识别所述印章层中的印章为伪造印章。
7.根据权利要求6所述的他项权证信息识别装置,其特征在于,所述获取单元,具体用于:
接收前端上传的第一图像、第二图像以及第三图像;其中,所述第一图像、第二图像以及第三图像为所述前端对所述证件图像基于预设裁剪规则裁剪所得;
根据预设的拼接规则,将所述第一图像、第二图像以及第三图像拼接为所述证件图像;其中所述预设的拼接规则与所述预设裁剪规则所对应。
8.根据权利要求7所述的他项权证信息识别装置,其特征在于,所述前端对所述证件图像基于预设裁剪规则裁剪,包括:
获取他项权证的原始证件图像,并获取所述原始证件图像的像素大小以及存储大小;
判断所述原始证件图像的像素大小以及存储大小是否均小于对应的预设值;
若否,则检测出所述原始证件图像的中心点,并以所述中心点为几何中心作一第一矩形框;
以所述第一矩形框的边框进行裁剪,得到所述第一矩形框中的第一图像,以及所述第一矩形框外的裁剪图像;
在所述裁剪图像中以所述中心点为几何中心作一第二矩形框,所述第二矩形框的长、宽均大于所述第一矩形框的长、宽;
以所述第二矩形框的边框进行裁剪,得到所述第二矩形框中的第二图像,以及所述第二矩形框外的第三图像;
将所述第一图像、第二图像以及第三图像分别进行上传至后台终端。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011249540.5A CN112380957A (zh) | 2020-11-10 | 2020-11-10 | 他项权证信息识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011249540.5A CN112380957A (zh) | 2020-11-10 | 2020-11-10 | 他项权证信息识别方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112380957A true CN112380957A (zh) | 2021-02-19 |
Family
ID=74579185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011249540.5A Pending CN112380957A (zh) | 2020-11-10 | 2020-11-10 | 他项权证信息识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112380957A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268778A (zh) * | 2021-05-31 | 2021-08-17 | 杭州趣链科技有限公司 | 电子文件的处理方法、系统、装置、介质及智能印章 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102023860A (zh) * | 2010-12-07 | 2011-04-20 | 苏州阔地网络科技有限公司 | 一种网页上实现摄像头关闭的方法 |
CN108491870A (zh) * | 2018-03-14 | 2018-09-04 | 平安科技(深圳)有限公司 | 电子装置、物理印章识别方法和计算机可读存储介质 |
CN109255627A (zh) * | 2018-08-21 | 2019-01-22 | 平安科技(深圳)有限公司 | 房产信息校验方法、终端设备及计算机可读存储介质 |
CN109829269A (zh) * | 2018-12-26 | 2019-05-31 | 平安科技(深圳)有限公司 | 基于电子印章验证电子文档的方法、装置及系统 |
-
2020
- 2020-11-10 CN CN202011249540.5A patent/CN112380957A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102023860A (zh) * | 2010-12-07 | 2011-04-20 | 苏州阔地网络科技有限公司 | 一种网页上实现摄像头关闭的方法 |
CN108491870A (zh) * | 2018-03-14 | 2018-09-04 | 平安科技(深圳)有限公司 | 电子装置、物理印章识别方法和计算机可读存储介质 |
CN109255627A (zh) * | 2018-08-21 | 2019-01-22 | 平安科技(深圳)有限公司 | 房产信息校验方法、终端设备及计算机可读存储介质 |
CN109829269A (zh) * | 2018-12-26 | 2019-05-31 | 平安科技(深圳)有限公司 | 基于电子印章验证电子文档的方法、装置及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268778A (zh) * | 2021-05-31 | 2021-08-17 | 杭州趣链科技有限公司 | 电子文件的处理方法、系统、装置、介质及智能印章 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10885644B2 (en) | Detecting specified image identifiers on objects | |
US11062163B2 (en) | Iterative recognition-guided thresholding and data extraction | |
CN110569341B (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
US9769354B2 (en) | Systems and methods of processing scanned data | |
US20200410074A1 (en) | Identity authentication method and apparatus, electronic device, and storage medium | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
CN108090511B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
US11144752B1 (en) | Physical document verification in uncontrolled environments | |
CN112926564B (zh) | 图片分析方法、系统、计算机设备和计算机可读存储介质 | |
WO2021143088A1 (zh) | 多证件类型同步检测方法、装置、计算机设备及存储介质 | |
CN111046644A (zh) | 一种答题卡模板生成方法、识别方法、装置及存储介质 | |
CN112507782A (zh) | 文本图像的识别方法及装置 | |
CN114359553B (zh) | 一种基于物联网的签章定位方法、系统及存储介质 | |
CN111858977B (zh) | 票据信息采集方法、装置、计算机设备和存储介质 | |
CN111414905A (zh) | 一种文本检测方法、文本检测装置、电子设备及存储介质 | |
CN110866457A (zh) | 一种电子保单的获得方法、装置、计算机设备和存储介质 | |
CN113221897B (zh) | 图像矫正方法、图像文本识别方法、身份验证方法及装置 | |
CN113111880A (zh) | 证件图像校正方法、装置、电子设备及存储介质 | |
CN114694161A (zh) | 一种特定版式证件的文本识别方法、设备及存储介质 | |
CN112380957A (zh) | 他项权证信息识别方法、装置、计算机设备和存储介质 | |
CN113920520A (zh) | 图像文本识别方法、系统、存储介质及电子设备 | |
CN116758550A (zh) | 表单图像的文本识别方法及其装置、电子设备、存储介质 | |
CN115731377A (zh) | 一种基于图片识别的投标人信息核验系统、方法及装置 | |
CN110232322B (zh) | 身份证的验证方法、装置、计算机设备和存储介质 | |
CN112861836B (zh) | 文本图像处理方法、文本及卡证图像质量评价方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |