CN117218659A - 不动产权证中信息的获取方法、装置、电子设备和介质 - Google Patents
不动产权证中信息的获取方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN117218659A CN117218659A CN202311112245.9A CN202311112245A CN117218659A CN 117218659 A CN117218659 A CN 117218659A CN 202311112245 A CN202311112245 A CN 202311112245A CN 117218659 A CN117218659 A CN 117218659A
- Authority
- CN
- China
- Prior art keywords
- text
- target
- initial
- text information
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000014509 gene expression Effects 0.000 claims abstract description 95
- 239000000463 material Substances 0.000 claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 230000015654 memory Effects 0.000 claims description 33
- 238000001514 detection method Methods 0.000 claims description 25
- 238000009826 distribution Methods 0.000 claims description 25
- 238000012937 correction Methods 0.000 claims description 24
- 230000005856 abnormality Effects 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 230000000007 visual effect Effects 0.000 claims description 9
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 102100032202 Cornulin Human genes 0.000 description 2
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Character Input (AREA)
Abstract
本申请提供了一种不动产权证中信息的获取方法、装置、电子设备和介质,方法包括:获取待处理的不动产权证的初始图像,并对初始图像进行预处理,获取不动产权证的目标图像;对目标图像进行文本区域检测,获取目标图像对应的文本预测框;对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息;通过预先设置的属性特征素材库中的正则表达式,对初始文本信息进行特征匹配,确定待处理不动产权证对应的目标文本信息,本申请不动产权证中信息的获取方法,降低了获取不动产权证中信息的成本,提高了获取不动产权证中信息的效率,通过属性特征素材库中的正则表达式确定目标文本信息,提高了获取不动产权证中信息的准确性和可靠性。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种不动产权证中信息的获取方法、装置、电子设备和介质。
背景技术
在房地产评估系统中,往往需要采集不动产权证上的各种文本信息,例如:房产证号、产权人姓名、身份证号、房屋坐落和使用年限等信息,相关技术中,往往建立各种版本的不动产权证模板库,根据不动产权证模板库和不动产权证图像,获取不动产权证上的各种文本信息,然而,该方法的需要建立全覆盖的不动产权证模板库,穷举出各种版本的不动产权证模板,工作较为复杂,同时,获取到的不动产权证中信息的准确性较低,因此,如何提高获取不动产权证中信息的准确性和高效性,已成为亟待解决的问题。
发明内容
本申请的目的旨在至少在一定程度上解决上述技术中的技术问题之一。
本申请第一方面提供了一种不动产权证中信息的获取方法,包括:获取待处理的不动产权证的初始图像,并对所述初始图像进行预处理,获取所述不动产权证的目标图像;对所述目标图像进行文本区域检测,获取所述目标图像对应的文本预测框;对所述文本预测框进行文本信息识别,获取所述文本预测框中的初始文本信息;通过预先设置的属性特征素材库中的正则表达式,对所述初始文本信息进行特征匹配,确定所述待处理不动产权证对应的目标文本信息。
本申请第一方面提供的不动产权证中信息的获取方法,还具备如下技术特征,包括:
根据本申请一个实施例,所述对所述目标图像进行文本区域检测,获取所述目标图像对应的文本预测框,包括:将所述目标图像输入文本框检测模型中,所述文本框检测模型包括顺序连接的视觉几何群VGG16网络、卷积层、双向长短期记忆BiLSTM网络、全连接FC层和输出层;由所述VCG16网络提取所述目标图像的特征,得到第一特征图,并将所述第一特征图输入所述卷积层;由所述卷积层,对所述第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对所述特征向量进行im2col操作,获取第二特征图,其中,所述im2col用于优化卷积运算;将所述第二特征图输入到双向长短期记忆网络BiLSTM中进行序列特征提取,将提取到的序列特征依次输入到所述全连接层FC和所述输出层,获取所述目标图像对应的文本预测框。
根据本申请一个实施例,所述对所述文本预测框进行文本信息识别,获取所述文本预测框中的初始文本信息,包括:
将所述文本预测框输入文本识别模型中,所述文本识别模型包括卷积层、循环层和解码层;由所述卷积层,对所述文本预测框的特征序列进行提取,获取所述文本预测框对应的特征序列,并将所述特征序列输入所述循环层;通过所述循环层中的双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,并将所述标签分布输入所述解码层;由所述解码层,通过所述标签分布对所述特征序列进行解码,获取所述文本预测框中的初始文本信息。
根据本申请一个实施例,所述通过预先设置的属性特征素材库中的正则表达式,对所述初始文本信息进行特征匹配,确定所述待处理不动产权证对应的目标文本信息,包括:通过所述属性特征素材库中的正则表达式,分别对每个初始文本信息进行特征匹配,获取所述每个初始文本信息与正则表达式之间的相似度;根据所述相似度,确定所述每个初始文本信息对应的目标正则表达式,并基于所述目标正则表达式确定所述每个初始文本信息的属性特征;对所述初始文本信息进行关键信息提取,确定与所述属性特征对应的目标文本信息。
根据本申请一个实施例,所述根据所述相似度,确定所述每个初始文本信息对应的目标正则表达式,包括:基于所述相似度,获取每个初始文本信息对应的相似度最高的正则表达式;将所述相似度最高的正则表达式,确定为所述始文本信息对应的目标正则表达式。
根据本申请一个实施例,所述基于所述目标正则表达式确定所述每个初始文本信息的属性特征,包括:获取所述属性特征素材库中的正则表达式与属性特征之间的映射关系;通过所述映射关系,获取所述目标正则表达式的属性特征,将所述目标正则表达式的属性特征作为所述每个初始文本信息的属性特征。
根据本申请一个实施例,所述对所述初始文本信息进行关键信息提取,确定与所述属性特征对应的目标文本信息,包括:基于所述目标正则表达式,对所述每个初始文本信息进行校正,得到校正文本信息;对所述校正文信息进行关键性信息提取,得到与所述属性特征对应的目标文本信息。
根据本申请一个实施例,所述基于所述目标正则表达式,对所述每个初始文本信息进行校正,得到校正文本信息,包括:判断所述初始文本信息中是否存在异常,若判定存在异常,获取所述初始文本信息中的异常类型和异常位置;获取与所述异常类型匹配的目标校正策略;基于所述目标校正策略,从所述目标正则表达式中获取校正内容,并按照所述异常位置,将所述校正内容校正至所述初始文本信息中,得到校正文本信息。
根据本申请一个实施例,所述对所述初始图像进行预处理,获取所述不动产权证的目标图像,包括:对所述初始图像进行二值化处理得到二值化图像,获取所述二值化图像的文本区域图像;获取所述文本区域图像的最大外接矩形和所述最大外接矩形的倾斜角度;根据所述最大外接矩形和所述最大外接矩形的倾斜角度,对所述文本区域图像进行仿射变换,获取所述不动产权证的目标图像。
本申请第二方面提供了一种不动产权证中信息的获取装置,包括:第一获取模块,用于获取待处理的不动产权证的初始图像,并对所述初始图像进行预处理,获取所述不动产权证的目标图像;第二获取模块,用于对所述目标图像进行文本区域检测,获取所述目标图像对应的文本预测框;第三获取模块,用于对所述文本预测框进行文本信息识别,获取所述文本预测框中的初始文本信息;确定模块,用于通过预先设置的属性特征素材库中的正则表达式,对所述初始文本信息进行特征匹配,确定所述待处理不动产权证对应的目标文本信息。
本申请第二方面提供的一种不动产权证中信息的获取装置,还具备如下技术特征,包括:
根据本申请一个实施例,所述第二获取模块,用于:将所述目标图像输入文本框检测模型中,所述文本框检测模型包括顺序连接的视觉几何群VGG16网络、卷积层、双向长短期记忆BiLSTM网络、全连接FC层和输出层;由所述VCG16网络提取所述目标图像的特征,得到第一特征图,并将所述第一特征图输入所述卷积层;由所述卷积层,对所述第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对所述特征向量进行im2col操作,获取第二特征图,其中,所述im2col用于优化卷积运算;将所述第二特征图输入到双向长短期记忆网络BiLSTM中进行序列特征提取,将提取到的序列特征依次输入到所述全连接层FC和所述输出层,获取所述目标图像对应的文本预测框。
根据本申请一个实施例,所述第三获取模块,用于:将所述文本预测框输入文本识别模型中,所述文本识别模型包括卷积层、循环层和解码层;由所述卷积层,对所述文本预测框的特征序列进行提取,获取所述文本预测框对应的特征序列,并将所述特征序列输入所述循环层;通过所述循环层中的双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,并将所述标签分布输入所述解码层;由所述解码层,通过所述标签分布对所述特征序列进行解码,获取所述文本预测框中的初始文本信息。
根据本申请一个实施例,所述确定模块,还用于:基于所述相似度,获取每个初始文本信息对应的相似度最高的正则表达式;将所述相似度最高的正则表达式,确定为所述始文本信息对应的目标正则表达式。
根据本申请一个实施例,所述确定模块,还用于:获取所述属性特征素材库中的正则表达式与属性特征之间的映射关系;通过所述映射关系,获取所述目标正则表达式的属性特征,将所述目标正则表达式的属性特征作为所述每个初始文本信息的属性特征。
根据本申请一个实施例,所述确定模块,还用于:基于所述目标正则表达式,对所述每个初始文本信息进行校正,得到校正文本信息;对所述校正文信息进行关键性信息提取,得到与所述属性特征对应的目标文本信息。
根据本申请一个实施例,所述确定模块,还用于:判断所述初始文本信息中是否存在异常,若判定存在异常,获取所述初始文本信息中的异常类型和异常位置;获取与所述异常类型匹配的目标校正策略;基于所述目标校正策略,从所述目标正则表达式中获取校正内容,并按照所述异常位置,将所述校正内容校正至所述初始文本信息中,得到校正文本信息。
根据本申请一个实施例,所述第一获取模块,还用于:对所述初始图像进行二值化处理得到二值化图像,获取所述二值化图像的文本区域图像;获取所述文本区域图像的最大外接矩形和所述最大外接矩形的倾斜角度;根据所述最大外接矩形和所述最大外接矩形的倾斜角度,对所述文本区域图像进行仿射变换,获取所述不动产权证的目标图像。
本申请第三方面实施例提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请第一方面提供的不动产权证中信息的获取方法。
本申请第四方面实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请第一方面提供的不动产权证中信息的获取方法。
本申请第五方面实施例提供了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行本申请第一方面提供的不动产权证中信息的获取方法。
本申请提供的不动产权证中信息的获取方法及装置,通过获取待处理的不动产权证的初始图像,并对初始图像进行预处理,获取不动产权证的目标图像;对目标图像进行文本区域检测,获取目标图像对应的文本预测框;对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息;通过预先设置的属性特征素材库中的正则表达式,对初始文本信息进行特征匹配,确定待处理不动产权证对应的目标文本信息,本申请不动产权证中信息的获取方法,降低了获取不动产权证中信息的成本,提高了获取不动产权证中信息的效率,通过属性特征素材库中的正则表达式确定目标文本信息,提高了获取不动产权证中信息的准确性和可靠性。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一实施例的不动产权证中信息的获取方法的流程示意图;
图2为本申请另一实施例的不动产权证中信息的获取方法的流程示意图;
图3为本申请一实施例的文本框检测模型的结构示意图;
图4为本申请另一实施例的不动产权证中信息的获取方法的流程示意图;
图5为本申请另一实施例的不动产权证中信息的获取方法的流程示意图;
图6为本申请一实施例的不动产权证中信息的获取装置的结构示意图;
图7是本申请一实施例的电子设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的不动产权证中信息的获取方法、装置、电子设备和介质。
图1为本申请一实施例的不动产权证中信息的获取方法的流程示意图,如图1所示,该方法包括:
S101,获取待处理的不动产权证的初始图像,并对初始图像进行预处理,获取不动产权证的目标图像。
需要说明的是,本申请对于获取待处理的不动产权证的初始图像的具体方式不作限定,可以根据实际情况进行选取。
可选地,可以获取待处理的不动产权证,通过图像采集装置对待处理的不动产权证进行图像采集,以获取待处理的不动产权证的初始图像。
在本申请实施例中,在获取到初始图像后,可以对初始图像进行预处理,获取不动产权证的目标图像。
可选地,可以对初始图像进行二值化处理得到二值化图像,获取二值化图像的文本区域图像,并获取文本区域图像的最大外接矩形和最大外接矩形的倾斜角度,根据最大外接矩形和最大外接矩形的倾斜角度,对文本区域图像进行仿射变换,获取不动产权证的目标图像。
举例而言,首先对初始图像进行二值化处理,获取二值化图像,并检测二值化图像的文字区域的,获取文本区域图像的最大范围,形成文本区域图像的最大外接矩形和最大外接矩形的倾斜角度,根据最大外接矩形和最大外接矩形的倾斜角度,对文本区域图像中的像素坐标进行仿射变换,得到校准后的不动产权证的图像即目标图像。
S102,对目标图像进行文本区域检测,获取目标图像对应的文本预测框。
在本申请实施例中,在获取到目标图像后,可以对目标图像进行文本区域检测,获取目标图像对应的文本预测框。
其中,文本预测框指的是目标图像文本区域的预测框。
需要说明的是,本申请对目标图像进行文本区域检测,获取目标图像对应的文本预测框的具体方式不作限定,可以根据实际情况进行选取。
可选地,可以基于文本框检测模型对目标图像进行文本区域检测,获取目标图像对应的文本预测框。
举例而言,文本检测框模型可以为连接文本区域网络(Connection TextProposal Network,简称CTPN)模型,通过CTPN模型对目标图像进行文本区域检测,以获取目标图像对应的文本预测框。
S103,对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息。
在本申请实施例中,在获取到文本预测框后,可以对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息。
需要说明的是,本申请对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息的具体方式不作限定,可以根据实际情况进行选取。
可选地,可以基于文本识别模型对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息。
举例而言,文本识别模型可以为卷积循环神经网络(Convolutional RecurrentNeural Network,简称CRNN)模型,通过CRNN模型对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息。
S104,通过预先设置的属性特征素材库中的正则表达式,对初始文本信息进行特征匹配,确定待处理不动产权证对应的目标文本信息。
可选地,针对不动产权证,属性特征素材库可以包括不动产权证编号、产权人姓名、身份证号、房屋坐落、使用年限等多种属性特征,进而基于每种属性特征构建对应的正则表达式。
在获取到初始文本信息后,可以通过预先设置的属性特征素材库中的正则表达式,对初始文本信息进行特征匹配,确定待处理不动产权证对应的目标文本信息。
本申请提出的不动产权证中信息的获取方法,通过获取待处理的不动产权证的初始图像,并对初始图像进行预处理,获取不动产权证的目标图像;对目标图像进行文本区域检测,获取目标图像对应的文本预测框;对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息;通过预先设置的属性特征素材库中的正则表达式,对初始文本信息进行特征匹配,确定待处理不动产权证对应的目标文本信息,本申请不动产权证中信息的获取方法,降低了获取不动产权证中信息的成本,提高了获取不动产权证中信息的效率,通过属性特征素材库中的正则表达式确定目标文本信息,提高了获取不动产权证中信息的准确性和可靠性。
上述实施例中,关于对目标图像进行文本区域检测,获取目标图像对应的文本预测框的具体过程,可结合图2进一步理解,图2为本申请另一实施例的不动产权证中信息的获取方法的流程示意图,如图2所示,该方法包括:
S201,将目标图像输入文本框检测模型中,文本框检测模型包括顺序连接的视觉几何群VGG16网络、卷积层、双向长短期记忆BiLSTM网络、全连接FC层和输出层。
S202,由VCG16网络提取目标图像的特征,得到第一特征图,并将第一特征图输入卷积层。
S203,由卷积层,对第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对特征向量进行im2col操作,获取第二特征图,其中,im2col用于优化卷积运算。
S204,将第二特征图输入到双向长短期记忆网络BiLSTM中进行序列特征提取,将提取到的序列特征依次输入到全连接层FC和输出层,获取目标图像对应的文本预测框。
举例而言,如图3所示,首先通过顺序连接的视觉几何群(Visual Geometry GroupNetwork,简称VGG)16网络的前5个卷积层(conv5)得到第一特征图,由卷积层对第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对特征向量进行im2col操作,获取第二特征图,其中,滑动窗口为3×3,将第二特征图输入到双向长短期记忆(Bi-directionalLong Short-Term Memory,简称BiLSTM)网络中进行序列特征提取,将提取到的序列特征依次输入到全连接层(fully connected layers,简称FC)和输出层,获取目标图像对应的文本预测框,其中,将提取到的序列特征依次输入到FC层和输出层,如图3所示,可以获取三个输出结果,即2k vertical coordinates:表示选择框的高度和中心的y轴的坐标、2kscores表示k个锚框anchor的类别信息,表明是否为字符、k side-refinement表示选择框的水平偏移量,判断所选的k个anchor中哪些属于文本框或背景框,进一步地,通过对输出结果进行处理,以得到目标图像对应的文本预测框。
本申请提出的不动产权证中信息的获取方法,通过将目标图像输入文本框检测模型中,文本框检测模型包括顺序连接的视觉几何群VGG16网络、卷积层、双向长短期记忆BiLSTM网络、全连接FC层和输出层,由VCG16网络提取目标图像的特征,得到第一特征图,并将第一特征图输入卷积层,由卷积层,对第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对特征向量进行im2col操作,获取第二特征图,其中,im2col用于优化卷积运算,将第二特征图输入到双向长短期记忆网络BiLSTM中进行序列特征提取,将提取到的序列特征依次输入到全连接层FC和所述输出层,获取目标图像对应的文本预测框,本申请通过文本框检测模型对目标图像进行文本区域检测,可以更加精确地得到目标图像对应的文本预测框,最大程度地保留了目标图像中的文本特征,为后续获取不动产权证中的信息奠定了基础。
上述实施例中,关于对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息的具体过程,可结合图4进一步理解,图4为本申请另一实施例的不动产权证中信息的获取方法的流程示意图,如图4所示,该方法包括:
S401,将文本预测框输入文本识别模型中,文本识别模型包括卷积层、循环层和解码层。
S402,由卷积层,对文本预测框的特征序列进行提取,获取文本预测框对应的特征序列,并将特征序列输入循环层。
在本申请实施例中,通过卷积层(Convolutional Neural Networks,简称CNN),对文本预测框的特征序列进行提取,以获取文本预测框对应的特征序列,可选地,卷积层共包含7层卷积神经网络。
RNN(循环层),使用双向RNN(BLSTM)对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签(真实值)分布;
CTC loss(转录层),使用CTC损失,把从循环层获取的一系列标签分布转换成最终的标签序列。
S403,通过循环层中的双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,并将标签分布输入解码层。
需要说明的是,由于循环层(Recurrent Neural Network,简称RNN)存在梯度消失的问题,不能获取更多上下文信息,本申请中的文本识别模型利用的是双层长短期记忆网络(Long Short-Term Memory,简称LSTM),通过双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,可以得到每个特征序列完整的上下文信息,并将标签分布输入解码层。
S404,由解码层,通过标签分布对特征序列进行解码,获取文本预测框中的初始文本信息。
需要说明的是,在解码层通过连接时序分类(Connectionist temporalclassification,简称CTC)作为解码方式,通过标签分布对特征序列进行解码,获取文本预测框中的初始文本信息。
本申请提出的不动产权证中信息的获取方法,通过将文本预测框输入文本识别模型中,文本识别模型包括卷积层、循环层和解码层,由卷积层,对文本预测框的特征序列进行提取,获取文本预测框对应的特征序列,并将特征序列输入循环层,通过循环层中的双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,并将标签分布输入转录层,由解码层,通过标签分布对特征序列进行解码,获取文本预测框中的初始文本信息,由此,通过文本识别模型提高了获取文本预测框中的初始文本信息的准确性和高效性,为后续更加准确地确定不动产权证中的信息奠定了基础。
上述实施例中,关于通过预先设置的属性特征素材库中的正则表达式,对初始文本信息进行特征匹配,确定待处理不动产权证对应的目标文本信息的具体过程,可结合图5进一步理解,图5为本申请另一实施例的不动产权证中信息的获取方法的流程示意图,如图5示,该方法包括:
S501,通过属性特征素材库中的正则表达式,分别对每个初始文本信息进行特征匹配,获取每个初始文本信息与正则表达式之间的相似度。
可选地,本申请可以预先构建能够匹配不同特征信息的包含多种正则表达式的属性特征素材库。
需要说明的是,可以将每个初始文本信息与属性特征素材库中的正则表达式一一进行特征匹配,计算每个初始文本信息与正则表达式之间的相似度。
S502,根据相似度,确定每个初始文本信息对应的目标正则表达式,并基于目标正则表达式确定每个初始文本信息的属性特征。
可选地,在获取到相似度后,可以基于相似度,获取每个初始文本信息对应的相似度最高的正则表达式,将相似度最高的正则表达式,确定为始文本信息对应的目标正则表达式。
需要说明的是,在获取到目标正则表达式后,可以获取属性特征素材库中的正则表达式与属性特征之间的映射关系,通过映射关系,获取目标正则表达式的属性特征,将目标正则表达式的属性特征作为每个初始文本信息的属性特征。
可选地,属性特征可以为不动产权证编号、产权人姓名、身份证号、房屋坐落、使用年限等
S503,对初始文本信息进行关键信息提取,确定与属性特征对应的目标文本信息。
在本申请实施例中,可以基于目标正则表达式,对每个初始文本信息进行校正,得到校正文本信息,对校正文信息进行关键性信息提取,得到与属性特征对应的目标文本信息。
可选地,关键信息可以为不动产权证编号信息、使用年限信息等。
需要说明的是,本申请对于基于目标正则表达式,对每个初始文本信息进行校正的具体方式不作限定,可以根据实际情况进行选取。
可选地,判断初始文本信息中是否存在异常,若判定存在异常,获取初始文本信息中的异常类型和异常位置,获取与异常类型匹配的目标校正策略,基于目标校正策略,从目标正则表达式中获取校正内容,并按照异常位置,将校正内容校正至初始文本信息中,得到校正文本信息。
本申请提出的不动产权证中信息的获取方法,通过属性特征素材库中的正则表达式,分别对每个初始文本信息进行特征匹配,获取每个初始文本信息与正则表达式之间的相似度,根据相似度,确定每个初始文本信息对应的目标正则表达式,并基于目标正则表达式确定每个初始文本信息的属性特征,对初始文本信息进行关键信息提取,确定与属性特征对应的目标文本信息,对初始文本信息进行关键信息提取,确定与属性特征对应的目标文本信息,由此,减少了人眼去获取不动产权证中信息所需的人力和时间,降低了获取不动产权证中信息的成本,提高了获取不动产权证中信息的效率,通过属性特征素材库中的正则表达式确定最终的目标文本信息,保证了获取不动产权证中信息的准确性和可靠性,同时,对不动产权证的图像的要求较低,即不动产权证的图像中文本倾斜、图像反转、内容残缺、局部模糊等多种场景下,均可以准确地获取不动产权证中的文本信息。
图6为本申请一实施例的不动产权证中信息的获取装置的结构示意图,如图6所示,不动产权证中信息的获取装置600,包括第一获取模块61、第一获取模块62、第三获取模块63和确定模块64,其中:
第一获取模块61,用于获取待处理的不动产权证的初始图像,并对所述初始图像进行预处理,获取所述不动产权证的目标图像;
第二获取模块62,用于对所述目标图像进行文本区域检测,获取所述目标图像对应的文本预测框;
第三获取模块63,用于对所述文本预测框进行文本信息识别,获取所述文本预测框中的初始文本信息;
确定模块64,用于通过预先设置的属性特征素材库中的正则表达式,对所述初始文本信息进行特征匹配,确定所述待处理不动产权证对应的目标文本信息。
本申请第二方面提供的一种不动产权证中信息的获取装置,还具备如下技术特征,包括:
根据本申请一个实施例,第二获取模块62,用于:将所述目标图像输入文本框检测模型中,所述文本框检测模型包括顺序连接的视觉几何群VGG16网络、卷积层、双向长短期记忆BiLSTM网络、全连接FC层和输出层;由所述VCG16网络提取所述目标图像的特征,得到第一特征图,并将所述第一特征图输入所述卷积层;由所述卷积层,对所述第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对所述特征向量进行im2col操作,获取第二特征图,其中,所述im2col用于优化卷积运算;将所述第二特征图输入到双向长短期记忆网络BiLSTM中进行序列特征提取,将提取到的序列特征依次输入到所述全连接层FC和所述输出层,获取所述目标图像对应的文本预测框。
根据本申请一个实施例,第三获取模块63,用于:将所述文本预测框输入文本识别模型中,所述文本识别模型包括卷积层、循环层和解码层;由所述卷积层,对所述文本预测框的特征序列进行提取,获取所述文本预测框对应的特征序列,并将所述特征序列输入所述循环层;通过所述循环层中的双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,并将所述标签分布输入所述解码层;由所述解码层,通过所述标签分布对所述特征序列进行解码,获取所述文本预测框中的初始文本信息。
根据本申请一个实施例,确定模块64,还用于:基于所述相似度,获取每个初始文本信息对应的相似度最高的正则表达式;将所述相似度最高的正则表达式,确定为所述始文本信息对应的目标正则表达式。
根据本申请一个实施例,确定模块64,还用于:获取所述属性特征素材库中的正则表达式与属性特征之间的映射关系;通过所述映射关系,获取所述目标正则表达式的属性特征,将所述目标正则表达式的属性特征作为所述每个初始文本信息的属性特征。
根据本申请一个实施例,确定模块64,还用于:基于所述目标正则表达式,对所述每个初始文本信息进行校正,得到校正文本信息;对所述校正文信息进行关键性信息提取,得到与所述属性特征对应的目标文本信息。
根据本申请一个实施例,确定模块64,还用于:判断所述初始文本信息中是否存在异常,若判定存在异常,获取所述初始文本信息中的异常类型和异常位置;获取与所述异常类型匹配的目标校正策略;基于所述目标校正策略,从所述目标正则表达式中获取校正内容,并按照所述异常位置,将所述校正内容校正至所述初始文本信息中,得到校正文本信息。
根据本申请一个实施例,第一获取模块61,还用于:对所述初始图像进行二值化处理得到二值化图像,获取所述二值化图像的文本区域图像;获取所述文本区域图像的最大外接矩形和所述最大外接矩形的倾斜角度;根据所述最大外接矩形和所述最大外接矩形的倾斜角度,对所述文本区域图像进行仿射变换,获取所述不动产权证的目标图像。
本申请提出的不动产权证中信息的获取装置,通过获取待处理的不动产权证的初始图像,并对初始图像进行预处理,获取不动产权证的目标图像;对目标图像进行文本区域检测,获取目标图像对应的文本预测框;对文本预测框进行文本信息识别,获取文本预测框中的初始文本信息;通过预先设置的属性特征素材库中的正则表达式,对初始文本信息进行特征匹配,确定待处理不动产权证对应的目标文本信息,本申请不动产权证中信息的获取方法,降低了获取不动产权证中信息的成本,提高了获取不动产权证中信息的效率,通过属性特征素材库中的正则表达式确定目标文本信息,提高了获取不动产权证中信息的准确性和可靠性。
为达到上述实施例,本申请还提供了一种电子设备、一种计算机可读存储介质和一种计算机程序产品。
图7为本申请一实施例的电子设备的框图,如图7所示,设备1000包括存储器101、处理器102及存储在存储101上并可在处理器102上运行的计算机程序,处理器102执行程序指令时,实现执行图1至图5的实施例不动产权证中信息的获取方法。
为了实现上述实施例,本申请还提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行图1至图5的实施例的不动产权证中信息的获取方法。
为了实现上述实施例,本申请还提供一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行图1至图5的实施例的不动产权证中信息的获取方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (20)
1.一种不动产权证中信息的获取方法,其特征在于,所述方法,包括:
获取待处理的不动产权证的初始图像,并对所述初始图像进行预处理,获取所述不动产权证的目标图像;
对所述目标图像进行文本区域检测,获取所述目标图像对应的文本预测框;
对所述文本预测框进行文本信息识别,获取所述文本预测框中的初始文本信息;
通过预先设置的属性特征素材库中的正则表达式,对所述初始文本信息进行特征匹配,确定所述待处理不动产权证对应的目标文本信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标图像进行文本区域检测,获取所述目标图像对应的文本预测框,包括:
将所述目标图像输入文本框检测模型中,所述文本框检测模型包括顺序连接的视觉几何群VGG16网络、卷积层、双向长短期记忆BiLSTM网络、全连接FC层和输出层;
由所述VCG16网络提取所述目标图像的特征,得到第一特征图,并将所述第一特征图输入所述卷积层;
由所述卷积层,对所述第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对所述特征向量进行im2col操作,获取第二特征图,其中,所述im2col用于优化卷积运算;
将所述第二特征图输入到双向长短期记忆网络BiLSTM中进行序列特征提取,将提取到的序列特征依次输入到所述全连接层FC和所述输出层,获取所述目标图像对应的文本预测框。
3.根据权利要求1所述的方法,其特征在于,所述对所述文本预测框进行文本信息识别,获取所述文本预测框中的初始文本信息,包括:
将所述文本预测框输入文本识别模型中,所述文本识别模型包括卷积层、循环层和解码层;
由所述卷积层,对所述文本预测框的特征序列进行提取,获取所述文本预测框对应的特征序列,并将所述特征序列输入所述循环层;
通过所述循环层中的双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,并将所述标签分布输入所述解码层;
由所述解码层,通过所述标签分布对所述特征序列进行解码,获取所述文本预测框中的初始文本信息。
4.根据权利要求1所述的方法,其特征在于,所述通过预先设置的属性特征素材库中的正则表达式,对所述初始文本信息进行特征匹配,确定所述待处理不动产权证对应的目标文本信息,包括:
通过所述属性特征素材库中的正则表达式,分别对每个初始文本信息进行特征匹配,获取所述每个初始文本信息与正则表达式之间的相似度;
根据所述相似度,确定所述每个初始文本信息对应的目标正则表达式,并基于所述目标正则表达式确定所述每个初始文本信息的属性特征;
对所述初始文本信息进行关键信息提取,确定与所述属性特征对应的目标文本信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述相似度,确定所述每个初始文本信息对应的目标正则表达式,包括:
基于所述相似度,获取每个初始文本信息对应的相似度最高的正则表达式;
将所述相似度最高的正则表达式,确定为所述始文本信息对应的目标正则表达式。
6.根据权利要求4所述的方法,其特征在于,所述基于所述目标正则表达式确定所述每个初始文本信息的属性特征,包括:
获取所述属性特征素材库中的正则表达式与属性特征之间的映射关系;
通过所述映射关系,获取所述目标正则表达式的属性特征,将所述目标正则表达式的属性特征作为所述每个初始文本信息的属性特征。
7.根据权利要求4所述的方法,其特征在于,所述对所述初始文本信息进行关键信息提取,确定与所述属性特征对应的目标文本信息,包括:
基于所述目标正则表达式,对所述每个初始文本信息进行校正,得到校正文本信息;
对所述校正文信息进行关键性信息提取,得到与所述属性特征对应的目标文本信息。
8.根据权利要求7所述的方法,其特征在于,所述基于所述目标正则表达式,对所述每个初始文本信息进行校正,得到校正文本信息,包括:
判断所述初始文本信息中是否存在异常,若判定存在异常,获取所述初始文本信息中的异常类型和异常位置;
获取与所述异常类型匹配的目标校正策略;
基于所述目标校正策略,从所述目标正则表达式中获取校正内容,并按照所述异常位置,将所述校正内容校正至所述初始文本信息中,得到校正文本信息。
9.根据权利要求1所述的方法,其特征在于,所述对所述初始图像进行预处理,获取所述不动产权证的目标图像,包括:
对所述初始图像进行二值化处理得到二值化图像,获取所述二值化图像的文本区域图像;
获取所述文本区域图像的最大外接矩形和所述最大外接矩形的倾斜角度;
根据所述最大外接矩形和所述最大外接矩形的倾斜角度,对所述文本区域图像进行仿射变换,获取所述不动产权证的目标图像。
10.一种不动产权证中信息的获取装置,其特征在于,所述装置,包括:
第一获取模块,用于获取待处理的不动产权证的初始图像,并对所述初始图像进行预处理,获取所述不动产权证的目标图像;
第二获取模块,用于对所述目标图像进行文本区域检测,获取所述目标图像对应的文本预测框;
第三获取模块,用于对所述文本预测框进行文本信息识别,获取所述文本预测框中的初始文本信息;
确定模块,用于通过预先设置的属性特征素材库中的正则表达式,对所述初始文本信息进行特征匹配,确定所述待处理不动产权证对应的目标文本信息。
11.根据权利要求10所述的装置,其特征在于,所述第二获取模块,用于:
将所述目标图像输入文本框检测模型中,所述文本框检测模型包括顺序连接的视觉几何群VGG16网络、卷积层、双向长短期记忆BiLSTM网络、全连接FC层和输出层;
由所述VCG16网络提取所述目标图像的特征,得到第一特征图,并将所述第一特征图输入所述卷积层;
由所述卷积层,对所述第一特征图进行滑动卷积,获取每次滑动卷积对应的特征向量,并对所述特征向量进行im2col操作,获取第二特征图,其中,所述im2col用于优化卷积运算;
将所述第二特征图输入到双向长短期记忆网络BiLSTM中进行序列特征提取,将提取到的序列特征依次输入到所述全连接层FC和所述输出层,获取所述目标图像对应的文本预测框。
12.根据权利要求10所述的装置,其特征在于,所述第三获取模块,用于:
将所述文本预测框输入文本识别模型中,所述文本识别模型包括卷积层、循环层和解码层;
由所述卷积层,对所述文本预测框的特征序列进行提取,获取所述文本预测框对应的特征序列,并将所述特征序列输入所述循环层;
通过所述循环层中的双层长短期记忆网络LSTM,获取每个特征序列对应的标签分布,并将所述标签分布输入所述解码层;
由所述解码层,通过所述标签分布对所述特征序列进行解码,获取所述文本预测框中的初始文本信息。
13.根据权利要求10所述的装置,其特征在于,所述确定模块,用于:
通过所述属性特征素材库中的正则表达式,分别对每个初始文本信息进行特征匹配,获取所述每个初始文本信息与正则表达式之间的相似度;
根据所述相似度,确定所述每个初始文本信息对应的目标正则表达式,并基于所述目标正则表达式确定所述每个初始文本信息的属性特征;
对所述初始文本信息进行关键信息提取,确定与所述属性特征对应的目标文本信息。
14.根据权利要求13所述的装置,其特征在于,所述确定模块,还用于:
基于所述相似度,获取每个初始文本信息对应的相似度最高的正则表达式;
将所述相似度最高的正则表达式,确定为所述始文本信息对应的目标正则表达式。
15.根据权利要求13所述的装置,其特征在于,所述确定模块,还用于:
获取所述属性特征素材库中的正则表达式与属性特征之间的映射关系;
通过所述映射关系,获取所述目标正则表达式的属性特征,将所述目标正则表达式的属性特征作为所述每个初始文本信息的属性特征。
16.根据权利要求13所述的装置,其特征在于,所述确定模块,还用于:
基于所述目标正则表达式,对所述每个初始文本信息进行校正,得到校正文本信息;
对所述校正文信息进行关键性信息提取,得到与所述属性特征对应的目标文本信息。
17.根据权利要求16所述的装置,其特征在于,所述确定模块,还用于:
判断所述初始文本信息中是否存在异常,若判定存在异常,获取所述初始文本信息中的异常类型和异常位置;
获取与所述异常类型匹配的目标校正策略;
基于所述目标校正策略,从所述目标正则表达式中获取校正内容,并按照所述异常位置,将所述校正内容校正至所述初始文本信息中,得到校正文本信息。
18.根据权利要求10所述的装置,其特征在于,所述第一获取模块,还用于:
对所述初始图像进行二值化处理得到二值化图像,获取所述二值化图像的文本区域图像;
获取所述文本区域图像的最大外接矩形和所述最大外接矩形的倾斜角度;
根据所述最大外接矩形和所述最大外接矩形的倾斜角度,对所述文本区域图像进行仿射变换,获取所述不动产权证的目标图像。
19.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311112245.9A CN117218659A (zh) | 2023-08-30 | 2023-08-30 | 不动产权证中信息的获取方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311112245.9A CN117218659A (zh) | 2023-08-30 | 2023-08-30 | 不动产权证中信息的获取方法、装置、电子设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117218659A true CN117218659A (zh) | 2023-12-12 |
Family
ID=89041703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311112245.9A Pending CN117218659A (zh) | 2023-08-30 | 2023-08-30 | 不动产权证中信息的获取方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117218659A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021304A (zh) * | 2016-05-05 | 2016-10-12 | 乐视控股(北京)有限公司 | 一种网页地址校正方法及系统 |
CN109886264A (zh) * | 2019-01-08 | 2019-06-14 | 深圳禾思众成科技有限公司 | 一种文字检测方法、设备及计算机可读存储介质 |
CN111198948A (zh) * | 2020-01-08 | 2020-05-26 | 深圳前海微众银行股份有限公司 | 文本分类校正方法、装置、设备及计算机可读存储介质 |
CN113850208A (zh) * | 2021-09-29 | 2021-12-28 | 平安科技(深圳)有限公司 | 一种图片信息结构化方法、装置、设备及介质 |
CN114077826A (zh) * | 2021-10-27 | 2022-02-22 | 联想(北京)有限公司 | 一种数据处理的方法、装置及计算机可读介质 |
CN114120299A (zh) * | 2021-10-14 | 2022-03-01 | 平安银行股份有限公司 | 信息获取方法、装置、存储介质及设备 |
CN114647728A (zh) * | 2022-03-18 | 2022-06-21 | 中国建设银行股份有限公司 | 文本处理方法、装置、电子设备及存储介质 |
CN115600592A (zh) * | 2022-10-27 | 2023-01-13 | 中国农业银行股份有限公司(Cn) | 文本内容的关键信息提取方法、装置、设备及介质 |
-
2023
- 2023-08-30 CN CN202311112245.9A patent/CN117218659A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021304A (zh) * | 2016-05-05 | 2016-10-12 | 乐视控股(北京)有限公司 | 一种网页地址校正方法及系统 |
CN109886264A (zh) * | 2019-01-08 | 2019-06-14 | 深圳禾思众成科技有限公司 | 一种文字检测方法、设备及计算机可读存储介质 |
CN111198948A (zh) * | 2020-01-08 | 2020-05-26 | 深圳前海微众银行股份有限公司 | 文本分类校正方法、装置、设备及计算机可读存储介质 |
CN113850208A (zh) * | 2021-09-29 | 2021-12-28 | 平安科技(深圳)有限公司 | 一种图片信息结构化方法、装置、设备及介质 |
CN114120299A (zh) * | 2021-10-14 | 2022-03-01 | 平安银行股份有限公司 | 信息获取方法、装置、存储介质及设备 |
CN114077826A (zh) * | 2021-10-27 | 2022-02-22 | 联想(北京)有限公司 | 一种数据处理的方法、装置及计算机可读介质 |
CN114647728A (zh) * | 2022-03-18 | 2022-06-21 | 中国建设银行股份有限公司 | 文本处理方法、装置、电子设备及存储介质 |
CN115600592A (zh) * | 2022-10-27 | 2023-01-13 | 中国农业银行股份有限公司(Cn) | 文本内容的关键信息提取方法、装置、设备及介质 |
Non-Patent Citations (5)
Title |
---|
ZHI TIAN等: "Detecting Text in Natural Image with Connectionist Text Proposal Network", 《SPRINGER INTERNATIONAL PUBLISHING AG 2016》, pages 56 * |
佛系小僧: "快速理解文本识别模型CRNN", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/163694234》, pages 1 - 6 * |
佛系小僧: "文本检测和识别概述", 《 HTTPS://ZHUANLAN.ZHIHU.COM/P/159652421》, pages 1 - 4 * |
山顶洞人: "opencv 提取图像中的面积最大的轮廓外接矩形", 《HTTPS://BLOG.CSDN.NET/QQ_39197555/ARTICLE/DETAILS/108997933》, 10 October 2020 (2020-10-10), pages 1 - 4 * |
黄爸爸好: "【OCR技术系列之五】自然场景文本检测技术综述(CTPN, SegLink, EAST)", 《HTTP://WWW.360DOC.COM/CONTENT/21/0331/23/46368139_970007884.SHTML》, pages 1 - 14 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110570389B (zh) | 车辆损伤识别方法及装置 | |
JP4928310B2 (ja) | ナンバープレート認識装置、その制御方法、コンピュータプログラム | |
CN109409398B (zh) | 图像处理装置、图像处理方法以及存储介质 | |
Gao et al. | Faster multi-defect detection system in shield tunnel using combination of FCN and faster RCNN | |
US20130070997A1 (en) | Systems, methods, and media for on-line boosting of a classifier | |
WO2020038138A1 (zh) | 样本标注方法及装置、损伤类别的识别方法及装置 | |
CN110991447B (zh) | 基于深度学习的列车车号精确定位与识别方法 | |
CN113313149B (zh) | 一种基于注意力机制和度量学习的菜品识别方法 | |
CN111652208A (zh) | 用户界面组件的识别方法、装置、电子设备及存储介质 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
Wang et al. | NAS-YOLOX: a SAR ship detection using neural architecture search and multi-scale attention | |
CN113762274B (zh) | 一种答题卡目标区域检测方法、系统、存储介质及设备 | |
KR101842535B1 (ko) | 부호의 광학적 검출 방법 | |
JPH0756882A (ja) | コンテナのコードを照合する方法及び装置 | |
CN117218659A (zh) | 不动产权证中信息的获取方法、装置、电子设备和介质 | |
CN113326749B (zh) | 目标检测方法、装置以及存储介质、电子设备 | |
CN110689481A (zh) | 车辆种类识别方法及装置 | |
CN116912872A (zh) | 图纸识别方法、装置、设备及可读存储介质 | |
CN112784737B (zh) | 结合像素分割和线段锚的文本检测方法、系统及装置 | |
CN115171066A (zh) | 感知风险的确定方法、装置、设备及存储介质 | |
CN112784781B (zh) | 基于差异感知元学习的伪造人脸检测方法和装置 | |
CN113869364A (zh) | 图像处理方法、装置、电子设备及介质 | |
CN114494678A (zh) | 文字识别方法和电子设备 | |
CN112085747A (zh) | 一种基于局部关系指导的图像分割方法 | |
CN113496219B (zh) | 基于人脸图像分析的血缘关系自动识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |