CN111914741A - 房产证识别方法、装置和设备 - Google Patents
房产证识别方法、装置和设备 Download PDFInfo
- Publication number
- CN111914741A CN111914741A CN202010754796.5A CN202010754796A CN111914741A CN 111914741 A CN111914741 A CN 111914741A CN 202010754796 A CN202010754796 A CN 202010754796A CN 111914741 A CN111914741 A CN 111914741A
- Authority
- CN
- China
- Prior art keywords
- property certificate
- picture
- house
- certificate form
- form template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000000605 extraction Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种房产证识别方法、装置和设备,方法包括:获取待识别房产证图片;对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片;从预先构建的房产证表格模板库中获取与所述房产证表格图片相匹配的目标房产证表格模板;根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述房产证表格图片进行单元格截取,得到多个截取单元格;对每个所述截取单元格的内容进行识别,得到房产证信息。采用本发明的技术方案,能够在少量房产证数据下,准确的识别房产证的数据。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种房产证识别方法、装置和设备。
背景技术
房产证(Premises Permit)是指购房者通过交易,取得房屋的合法所有权,可依法对所购房屋行使占有、使用、收益和处分的权利的证件。在房产交易时,房产证是不可或缺的证件,尤其是在二手房交易过程中工作人员和买房者都会反复查看房产证信息,然后将房产证信息填写到不同订单中。
现有技术中,在对房产证的信息采集时,为了提高采集效率,可以预先训练一个图片分类模型,将房产证图片输入至该图片分类模型中,然后根据图片分类结果确定图像内容识别的图片识别区域,再基于图片识别区域来进行图像内容识别获取房产证内容,进而能够有效识别解析各类型的房产证图片内容。
但是,在训练图片分类模型时,需要大量的房产证数据进行训练,测试、人工标注等流程后,才能得到比较准确的图片分类模型。而获取大量的房产证数据的难度和成本均比较高,进而也导致训练图片分类模型的难度较大。因此,如何在少量房产证数据下,准确的识别房产证的数据是本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提出一种房产证识别方法、装置和设备,以实现在少量房产证数据下,准确的识别房产证的数据。
基于上述目的,本发明提供了一种房产证识别方法,包括:
获取待识别房产证图片;
对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片;
从预先构建的房产证表格模板库中获取与所述房产证表格图片相匹配的目标房产证表格模板;
根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述房产证表格图片进行单元格截取,得到多个截取单元格;
对每个所述截取单元格的内容进行识别,得到房产证信息。
进一步地,上述所述的房产证识别方法中,所述房产证表格模板库的构建过程包括:
对样本房产证图片进行表格提取,得到所述样本房产证图片对应的样本房产证表格图片;
将所述样本房产证表格图片的尺寸调整为预设尺寸,得到调整样本房产证表格图片;
获取并设定所述调整样本房产证表格图片的感兴趣单元格的坐标,得到目标样本房产证表格图片作为房产证表格模板,以构建所述房产证表格模板库。
进一步地,上述所述的房产证识别方法中,获取并设定所述调整样本房产证表格图片的感兴趣单元格的坐标,包括:
获取所述调整样本房产证表格图片中感兴趣单元格的内容,形成键值对;
将键值对中值对应的坐标作为所述感兴趣单元格的坐标。
进一步地,上述所述的房产证识别方法,还包括:
对所述房产证表格模板进行特征提取,得到房产证表格模板的特征信息;
将所述房产证表格模板的特征信息存储在所述房产证表格模板库中。
进一步地,上述所述的房产证识别方法中,对所述房产证表格模板进行特征提取,得到房产证表格模板的特征信息,包括:
对所述房产证表格模板进行多角度旋转,得到每个角度的房产证表格模板;
对每个角度的房产证表格模板进行方向梯度直方图片HOG特征提取,得到每个角度的房产证表格模板的HOG特征信息。
进一步地,上述所述的房产证识别方法中,从预先构建的房产证表格模板库中获取与所述房产证表格图片相匹配的目标房产证表格模板,包括:
从预先构建的房产证表格模板库中获取与所述房产证表格图片的HOG特征信息相匹配的已存储HOG特征信息对应的房产证表格模板作为所述目标房产证表格模板。
进一步地,上述所述的房产证识别方法中,对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片之后,还包括:
将所述房产证表格图片的尺寸调整为所述预设尺寸,得到调整房产证表格图片;
对所述调整房产证表格图片进行HOG特征提取,得到所述房产证表格图片的HOG特征信息。
进一步地,上述所述的房产证识别方法中,根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述房产证表格图片进行单元格截取,得到多个截取单元格,包括:
根据所述已存储HOG特征信息对应的旋转角度,对所述房产证表格图片进行矫正,得到矫正房产证表格图片;
根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述矫正房产证表格图片进行单元格截取,得到多个截取单元格。
本发明还提供一种房产证识别装置,包括:
图片获取模块,用于获取待识别房产证图片;
表格提取模块,用于对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片;
模板获取模块,用于从预先构建的房产证表格模板库中获取与所述房产证表格图片相匹配的目标房产证表格模板;
截取模块,用于根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述房产证表格图片进行单元格截取,得到多个截取单元格;
识别模块,用于对每个所述截取单元格的内容进行识别,得到房产证信息。
本发明还提供一种房产证识别设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一项所述的房产证识别方法。
从上面所述可以看出,本发明提供的房产证识别方法、装置和设备,通过对获取的待识别房产证图片进行表格提取,得到待识别房产证图片对应的房产证表格图片后,从预先构建的房产证表格模板库中获取与房产证表格图片相匹配的目标房产证表格模板,实现了利用少量房产证数据构建的房产证表格模板库对待识别房产证图片进行准确分类,并在确定目标房产证表格模板后,利用预设的目标房产证表格模板的感兴趣单元格的坐标,对房产证表格图片进行单元格截取,得到多个截取单元格后,对每个截取单元格的内容进行识别,得到房产证信息,省去了内容定位环节,提高了房产证识别效率。采用本发明的技术方案,能够在少量房产证数据下,准确的识别房产证的数据。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明房产证识别方法实施例的流程图;
图2为本发明的房产证识别装置实施例的结构示意图;
图3为本发明的房产证识别设备实施例的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
图1为本发明房产证识别方法实施例的流程图,如图1所示,本实施例的房产证识别方法具体可以包括如下步骤:
100、获取待识别房产证图片;
本实施例中,可以通过摄像头、手机等获取待识别房产证图片。
101、对待识别房产证图片进行表格提取,得到待识别房产证图片对应的房产证表格图片;
具体地,可以对待识别房产证图片进行预处理,消除待识别房产证图片的冗杂信息,并对处理的图像进行二值化以及一系列形态学操作,提取待识别房产证图片中的表格,从而得到待识别房产证图片对应的房产证表格图片。其中,本实施例的形态学操作包括腐蚀、膨胀等。
102、从预先构建的房产证表格模板库中获取与房产证表格图片相匹配的目标房产证表格模板;
本实施例中,房产证表格模板库的构建过程包括:
a、对样本房产证图片进行表格提取,得到样本房产证图片对应的样本房产证表格图片;
具体地,可以获取不同地区对应的房产证图片作为样本房产证图片,利用步骤101中提取表格的方法,对样本房产证图片进行表格提取,得到样本房产证图片对应的样本房产证表格图片。
b、将样本房产证表格图片的尺寸调整为预设尺寸,得到调整样本房产证表格图片;
c、获取并设定调整样本房产证表格图片的感兴趣单元格的坐标,得到目标样本房产证表格图片作为房产证表格模板,以构建房产证表格模板库。
本实施例中,可以将得到的样本房产证表格图片的尺寸调整为预设尺寸,得到调整样本房产证表格图片后,获取并设定调整样本房产证表格图片的感兴趣单元格的坐标,得到目标样本房产证表格图片作为房产证表格模板,以构建房产证表格模板库。这样,由于样本房产证表格图片的尺寸会调整为预设尺寸,这样,调整样本房产证表格图片的感兴趣单元格的坐标则是固定不变的。
本实施例中,由于每个地区对应的房产证的格式是统一的,存在差别的情况也是因为年代不同导致的,因此而本实施例中,在构建房产证表格模板库时,只需针对每个地区对应的房产证选取少量房产证甚至只选一个房产证作为样本即可,提取每个地区对应的房产证表格图片作为房产证表格模板,且该构建过程相对于模型训练的构建过程计算量小,无需人工标注,更加容易实现,且成本较低。
在实际应用中,在获取并设定所述调整样本房产证表格图片的感兴趣单元格的坐标时,由于房产证中标题栏的内容是不会发生改变的,例如,房产证中的地址、权利人等标题栏的内容,因此,本实施例中,可以获取所述调整样本房产证表格图片中感兴趣单元格的内容,形成键值对;并将键值对中值对应的坐标作为所述感兴趣单元格的坐标。
例如,调整样本房产证表格图片中感兴趣单元格的内容为:地址-X省,Y市Z区,地址可以作为键,上海作为值,从而形成键值对。由于感兴趣单元格中地址这一词是不会发生改变的,可能改变的只是地址对应的具体内容,因此,可以只将键值对中值对应的坐标作为感兴趣单元格的坐标,这样,只要识别出感兴趣单元格的坐标对应的感兴趣单元格的内容,即可得到包含地址的内容。
在一个具体实现过程中,在得到待识别房产证图片对应的房产证表格图片后,可以从预先构建的房产证表格模板库中获取与房产证表格图片相匹配的目标房产证表格模板。
具体地,在构建房产证表格模板库时,可以对所述房产证表格模板进行特征提取,得到房产证表格模板的特征信息;将所述房产证表格模板的特征信息存储在所述房产证表格模板库中。其中,在获取样本房产证图片时,可能会在任意角度下获取,而不同角度下房产证表格模板的特征信息是不同的,因此,在执行对房产证表格模板进行特征提取,得到房产证表格模板的特征信息的操作时,可以对房产证表格模板进行多角度旋转,得到每个角度的房产证表格模板;对每个角度的房产证表格模板进行(Histogram of OrientedGridients,HOG)特征提取,得到每个角度的房产证表格模板的HOG特征信息,从而可以提高多角度以及透视变换下的房产证识别鲁棒性。这样,预先构建的房产证表格模板库中存储有每个房产证表格模板的HOG特征信息。因此,本实施例中,在得到房产证表格图片后,可以对房产证表格图片进行方HOG特征提取,得到房产证表格图片的HOG特征信息,进而将得到的房产证表格图片的HOG特征信息与预先构建的房产证表格模板库中的已存储HOG特征信息进行比对,得到与房产证表格图片的HOG特征信息相匹配的已存储HOG特征信息,并将与房产证表格图片的HOG特征信息相匹配的已存储HOG特征信息对应的房产证表格模板作为目标房产证表格模板。
需要说明的是,本实施例中,对房产证表格图片进行方HOG特征提取,得到房产证表格图片的HOG特征信息时,可以按照如下方式提取:将房产证表格图片的尺寸调整为预设尺寸,得到调整房产证表格图片,以保证调整房产证表格图片与目标房产证表格模板对应的房产证表格图片得到大小一致,这样,在对调整房产证表格图片进行HOG特征提取时,能够得到准确地房产证表格图片的HOG特征信息,从而保证能够获取到比较准确的目标房产证表格模板。
103、根据预设的目标房产证表格模板的感兴趣单元格的坐标,对房产证表格图片进行单元格截取,得到多个截取单元格;
本实施例中,在确定待识别房产证图片对应的房产证表格图片所对应的目标房产证表格模板后,由于目标房产证表格模板的感兴趣单元格的坐标是已经设定好的,所以,可以根据目标房产证表格模板的感兴趣单元格的坐标,对房产证表格图片进行单元格截取,得到多个截取单元格,相当于直接利用目标房产证表格模板的感兴趣单元格的坐标在房产证表格图片进行投影后,即可得到所需的截取单元格。这样,每个截取单元格必然包括需要识别到内容,从而省去了对待识别内容的定位环节。例如,若待识别内容为文字,本申请中则不需要检测文本区域,而是利用感兴趣单元格的坐标直接进行单元格截取即可,从而提高了房产证识别效率。
在实际应用中,获取的待识别房产证图片的角度是不固定的,所以得到的房产证表格图片的角度也是不固定的,因此,在确定房产证表格图片所对应的目标房产证表格模板后,还可以根据目标房产证表格模板的角度(不同的已存储HOG特征信息对应不同的旋转角度是已知的),确定房产证表格图片的角度(目标房产证表格模板的角度与房产证表格图片的角度相同),根据已存储HOG特征信息对应的旋转角度,对房产证表格图片进行矫正,得到矫正房产证表格图片;根据预设的目标房产证表格模板的感兴趣单元格的坐标,对矫正房产证表格图片进行单元格截取,得到多个截取单元格。
104、对每个截取单元格的内容进行识别,得到房产证信息。
本实施例中,可以一次性截取多个截取单元格,对每个截取单元格的内容进行识别,得到房产证信息;也可以每次只截取一个单元格,进行内容识别后,再截取下一个单元格,本实施例不做具体限制。
具体地,本实施例中,可以利用光学字符识别(Optical Character Recognition,OCR)技术对每个截取单元格的内容进行识别,得到房产证信息。例如,某一截取单元格的内容为上海,得到的房产信息为:地址-上海。
本实施例的房产证识别方法,通过对获取的待识别房产证图片进行表格提取,得到待识别房产证图片对应的房产证表格图片后,从预先构建的房产证表格模板库中获取与房产证表格图片相匹配的目标房产证表格模板,实现了利用少量房产证数据构建的房产证表格模板库对待识别房产证图片进行准确分类,并在确定目标房产证表格模板后,利用预设的目标房产证表格模板的感兴趣单元格的坐标,对房产证表格图片进行单元格截取,得到多个截取单元格后,对每个截取单元格的内容进行识别,得到房产证信息,省去了内容定位环节,提高了房产证识别效率。采用本发明的技术方案,能够在少量房产证数据下,准确的识别房产证的数据。
需要说明的是,本发明实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本发明实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成的方法。
图2为本发明的房产证识别装置实施例的结构示意图,如图2所示,本实施例的房产证识别装置包括图片获取模块20、表格提取模块21、模板获取模块22、单元格截取模块23和识别模块24。
图片获取模块20,用于获取待识别房产证图片;
表格提取模块21,用于对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片;
模板获取模块22,用于从预先构建的房产证表格模板库中获取与房产证表格图片相匹配的目标房产证表格模板;
具体地,房产证表格模板库的构建过程包括:
a、对样本房产证图片进行表格提取,得到样本房产证图片对应的样本房产证表格图片;
b、将样本房产证表格图片的尺寸调整为预设尺寸,得到调整样本房产证表格图片;
c、获取并设定调整样本房产证表格图片的感兴趣单元格的坐标,得到目标样本房产证表格图片作为房产证表格模板,以构建房产证表格模板库。
在一个具体实现过程中,可以获取调整样本房产证表格图片中感兴趣单元格的内容,形成键值对;将键值对中值对应的坐标作为感兴趣单元格的坐标。
本实施例中,还可以对房产证表格模板进行特征提取,得到房产证表格模板的特征信息;将房产证表格模板的特征信息存储在房产证表格模板库中。其中,对房产证表格模板进行特征提取,得到房产证表格模板的特征信息可以包括:对房产证表格模板进行多角度旋转,得到每个角度的房产证表格模板;对每个角度的房产证表格模板进行方向梯度直方图片HOG特征提取,得到每个角度的房产证表格模板的HOG特征信息。
本实施例中,模板获取模块22,具体用于从预先构建的房产证表格模板库中获取与房产证表格图片的HOG特征信息相匹配的已存储HOG特征信息对应的房产证表格模板作为目标房产证表格模板。其中,房产证表格图片的HOG特征信息可以按照如下方式提取:将房产证表格图片的尺寸调整为预设尺寸,得到调整房产证表格图片;对调整房产证表格图片进行HOG特征提取,得到房产证表格图片的HOG特征信息。
单元格截取模块23,用于根据预设的目标房产证表格模板的感兴趣单元格的坐标,对房产证表格图片进行单元格截取,得到多个截取单元格;
具体地,可以根据已存储HOG特征信息对应的旋转角度,对房产证表格图片进行矫正,得到矫正房产证表格图片;根据预设的目标房产证表格模板的感兴趣单元格的坐标,对矫正房产证表格图片进行单元格截取,得到多个截取单元格。
识别模块24,用于对每个截取单元格的内容进行识别,得到房产证信息。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
图3为本发明的房产证识别设备实施例的结构示意图,如图3所示,本实施例的通行设备可以包括:处理器1010和存储器1020。本领域技术人员可知的,该设备还可以包括输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本发明还提供一种存储介质,其特征在于,所述存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述实施例的房产证识别方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种房产证识别方法,其特征在于,包括:
获取待识别房产证图片;
对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片;
从预先构建的房产证表格模板库中获取与所述房产证表格图片相匹配的目标房产证表格模板;
根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述房产证表格图片进行单元格截取,得到多个截取单元格;
对每个所述截取单元格的内容进行识别,得到房产证信息。
2.根据权利要求1所述的房产证识别方法,其特征在于,所述房产证表格模板库的构建过程包括:
对样本房产证图片进行表格提取,得到所述样本房产证图片对应的样本房产证表格图片;
将所述样本房产证表格图片的尺寸调整为预设尺寸,得到调整样本房产证表格图片;
获取并设定所述调整样本房产证表格图片的感兴趣单元格的坐标,得到目标样本房产证表格图片作为房产证表格模板,以构建所述房产证表格模板库。
3.根据权利要求2所述的房产证识别方法,其特征在于,获取并设定所述调整样本房产证表格图片的感兴趣单元格的坐标,包括:
获取所述调整样本房产证表格图片中感兴趣单元格的内容,形成键值对;
将键值对中值对应的坐标作为所述感兴趣单元格的坐标。
4.根据权利要求2所述的房产证识别方法,其特征在于,还包括:
对所述房产证表格模板进行特征提取,得到房产证表格模板的特征信息;
将所述房产证表格模板的特征信息存储在所述房产证表格模板库中。
5.根据权利要求4所述的房产证识别方法,其特征在于,对所述房产证表格模板进行特征提取,得到房产证表格模板的特征信息,包括:
对所述房产证表格模板进行多角度旋转,得到每个角度的房产证表格模板;
对每个角度的房产证表格模板进行方向梯度直方图片HOG特征提取,得到每个角度的房产证表格模板的HOG特征信息。
6.根据权利要求5所述的房产证识别方法,其特征在于,从预先构建的房产证表格模板库中获取与所述房产证表格图片相匹配的目标房产证表格模板,包括:
从预先构建的房产证表格模板库中获取与所述房产证表格图片的HOG特征信息相匹配的已存储HOG特征信息对应的房产证表格模板作为所述目标房产证表格模板。
7.根据权利要求6所述的房产证识别方法,其特征在于,对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片之后,还包括:
将所述房产证表格图片的尺寸调整为所述预设尺寸,得到调整房产证表格图片;
对所述调整房产证表格图片进行HOG特征提取,得到所述房产证表格图片的HOG特征信息。
8.根据权利要求5所述的房产证识别方法,其特征在于,根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述房产证表格图片进行单元格截取,得到多个截取单元格,包括:
根据所述已存储HOG特征信息对应的旋转角度,对所述房产证表格图片进行矫正,得到矫正房产证表格图片;
根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述矫正房产证表格图片进行单元格截取,得到多个截取单元格。
9.一种房产证识别装置,其特征在于,包括:
图片获取模块,用于获取待识别房产证图片;
表格提取模块,用于对所述待识别房产证图片进行表格提取,得到所述待识别房产证图片对应的房产证表格图片;
模板获取模块,用于从预先构建的房产证表格模板库中获取与所述房产证表格图片相匹配的目标房产证表格模板;
截取模块,用于根据预设的所述目标房产证表格模板的感兴趣单元格的坐标,对所述房产证表格图片进行单元格截取,得到多个截取单元格;
识别模块,用于对每个所述截取单元格的内容进行识别,得到房产证信息。
10.一种房产证识别设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任意一项所述的房产证识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010754796.5A CN111914741B (zh) | 2020-07-30 | 2020-07-30 | 房产证识别方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010754796.5A CN111914741B (zh) | 2020-07-30 | 2020-07-30 | 房产证识别方法、装置和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914741A true CN111914741A (zh) | 2020-11-10 |
CN111914741B CN111914741B (zh) | 2024-04-19 |
Family
ID=73286878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010754796.5A Active CN111914741B (zh) | 2020-07-30 | 2020-07-30 | 房产证识别方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914741B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113988028A (zh) * | 2021-09-14 | 2022-01-28 | 北京左医科技有限公司 | 基于模版匹配和ocr坐标的图片表格还原方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140355883A1 (en) * | 2013-06-03 | 2014-12-04 | Alipay.com Co., Ltd. | Method and system for recognizing information |
CN105654092A (zh) * | 2015-11-25 | 2016-06-08 | 小米科技有限责任公司 | 特征提取方法及装置 |
CN106295638A (zh) * | 2016-07-29 | 2017-01-04 | 北京小米移动软件有限公司 | 证件图像倾斜校正方法和装置 |
CN108038504A (zh) * | 2017-12-11 | 2018-05-15 | 深圳房讯通信息技术有限公司 | 一种解析房产证照片内容的方法 |
CN109241894A (zh) * | 2018-08-28 | 2019-01-18 | 南京安链数据科技有限公司 | 一种基于表格定位和深度学习的针对性票据内容识别系统和方法 |
CN110309831A (zh) * | 2019-06-10 | 2019-10-08 | 北京工业大学 | 基于机器视觉的非智能水表识读方法 |
CN111460927A (zh) * | 2020-03-17 | 2020-07-28 | 北京交通大学 | 对房产证图像进行结构化信息提取的方法 |
-
2020
- 2020-07-30 CN CN202010754796.5A patent/CN111914741B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140355883A1 (en) * | 2013-06-03 | 2014-12-04 | Alipay.com Co., Ltd. | Method and system for recognizing information |
CN105654092A (zh) * | 2015-11-25 | 2016-06-08 | 小米科技有限责任公司 | 特征提取方法及装置 |
CN106295638A (zh) * | 2016-07-29 | 2017-01-04 | 北京小米移动软件有限公司 | 证件图像倾斜校正方法和装置 |
CN108038504A (zh) * | 2017-12-11 | 2018-05-15 | 深圳房讯通信息技术有限公司 | 一种解析房产证照片内容的方法 |
CN109241894A (zh) * | 2018-08-28 | 2019-01-18 | 南京安链数据科技有限公司 | 一种基于表格定位和深度学习的针对性票据内容识别系统和方法 |
CN110309831A (zh) * | 2019-06-10 | 2019-10-08 | 北京工业大学 | 基于机器视觉的非智能水表识读方法 |
CN111460927A (zh) * | 2020-03-17 | 2020-07-28 | 北京交通大学 | 对房产证图像进行结构化信息提取的方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113988028A (zh) * | 2021-09-14 | 2022-01-28 | 北京左医科技有限公司 | 基于模版匹配和ocr坐标的图片表格还原方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111914741B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476227B (zh) | 基于ocr的目标字段识别方法、装置及存储介质 | |
CN110378966B (zh) | 车路协同相机外参标定方法、装置、设备及存储介质 | |
CN111626383B (zh) | 字体识别方法及装置、电子设备、存储介质 | |
JP2019520662A (ja) | 商標画像のコンテンツ・ベースの検索及び取得 | |
US10679094B2 (en) | Automatic ruler detection | |
CN111639648A (zh) | 证件识别方法、装置、计算设备和存储介质 | |
CN113837151B (zh) | 表格图像处理方法、装置、计算机设备及可读存储介质 | |
CN113239227B (zh) | 图像数据结构化方法、装置、电子设备及计算机可读介质 | |
CN109102324B (zh) | 模型训练方法、基于模型的红包物料铺设预测方法及装置 | |
CN111832579B (zh) | 地图兴趣点数据处理方法、装置、电子设备以及可读介质 | |
CN113496208B (zh) | 视频的场景分类方法及装置、存储介质、终端 | |
WO2022037299A1 (zh) | 异常行为检测方法、装置、电子设备及计算机可读存储介质 | |
WO2015074405A1 (en) | Methods and devices for obtaining card information | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
CN111914741A (zh) | 房产证识别方法、装置和设备 | |
CN108427110A (zh) | 测距方法、装置及电子设备 | |
US20230401670A1 (en) | Multi-scale autoencoder generation method, electronic device and readable storage medium | |
CN110138707B (zh) | 数据交互的方法、客户端、应用和电子设备 | |
CN111179129A (zh) | 课件质量的评价方法、装置、服务器及存储介质 | |
CN111062374A (zh) | 身份证信息的识别方法、装置、系统、设备及可读介质 | |
CN115620005A (zh) | 一种图像识别方法、装置、设备及存储介质 | |
CN112395450B (zh) | 图片文字检测方法、装置、计算机设备及存储介质 | |
US9330310B2 (en) | Methods and devices for obtaining card information | |
CN114549857A (zh) | 图像信息识别方法、装置、计算机设备和存储介质 | |
CN115393838A (zh) | 指针式仪表读数识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |