CN113569834A

CN113569834A - 营业执照识别方法、装置、电子设备及存储介质

Info

Publication number: CN113569834A
Application number: CN202110898348.7A
Authority: CN
Inventors: 王诗源; 史忠伟
Original assignee: Wu Ba Tongcheng Information Technology Co ltd
Current assignee: Wu Ba Tongcheng Information Technology Co ltd; Beijing 58 Information Technology Co Ltd
Priority date: 2021-08-05
Filing date: 2021-08-05
Publication date: 2021-10-29

Abstract

本发明提供了一种营业执照识别方法、装置、电子设备及存储介质。上述方法包括：获取营业执照图像；通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域；对每一文本区域进行文字识别，得到每一文本区域对应的文字识别结果；根据每一文本区域对应的文字识别结果生成目标营业执照。上述方案，利用文本分割网络模型可以对营业执照图像进行结构化分析，自动提取营业执照图像中的不同文本类别的文本区域，不仅可以自动提取文本内容，还简化了现有技术中先进行版面分析再进行文本识别的计算过程，提高文本识别效率。

Description

营业执照识别方法、装置、电子设备及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种营业执照识别方法、装置、电子设备及存储介质。

背景技术

目前，用户上传营业执照是其获取认证的一种手段，一般需要填写营业执照的内容，对于内容比较多的文本，填写过程耗时又耗力，还容易填错，并且，现有技术对营业执照的文本识别的步骤比较繁杂且计算量较大，降低了文本识别的效率。

发明内容

本发明实施例提供一种营业执照识别方法、装置、电子设备及存储介质，以解决现有技术对营业执照的文本识别效率较低的问题。

第一方面，本发明实施例提供了一种营业执照识别方法，包括：

获取营业执照图像；

通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域；

对每一文本区域进行文字识别，得到每一文本区域对应的文字识别结果；

根据每一文本区域对应的文字识别结果生成目标营业执照。

可选的，所述通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域，包括：

将所述营业执照图像输入至所述文本分割网络模型中，获取所述营业执照图像中的不同文本位置信息以及对应的文本类别信息；

根据所述文本位置信息以及所述文本类别信息，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域。

可选的，所述通过文本分割网络模型，对所述营业执照图像进行不同文本类型的区域分割，得到不同文本类型的文本区域之前，所述方法还包括：

获取营业执照样本图像集；

将所述营业执照样本图像集中的每一营业执照样本图像输入至神经网络模型中进行特征提取，得到文本特征图；

根据所述文本特征图，获取文本信息，所述文本信息包括：文本位置信息以及对应的文本类别信息；

根据所述文本信息与预设文本信息对所述神经网络模型进行训练，得到文本分割网络模型。

可选的，所述根据所述文本特征图，获取文本信息，包括：

将所述文本特征图通过连通域分析算法进行处理，获取文本位置信息；

根据所述文本位置信息，获取文本类别信息。

可选的，所述根据所述文本信息与预设文本信息对所述神经网络模型进行训练，得到文本分割网络模型，包括：

根据所述文本信息与预设文本信息，获取所述神经网络模型的损失值；

根据所述损失值与预设损失值的差值，对所述神经网络模型进行迭代优化，直至迭代次数达到预设次数和/或所述损失值达到预设损失值，得到文本分割网络模型。

第二方面，本发明实施例提供了一种营业执照识别装置，包括：

第一获取模块，用于获取营业执照图像；

分割模块，用于通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域；

识别模块，用于对每一文本区域进行文字识别，得到每一文本区域对应的文字识别结果；

生成模块，用于根据每一文本区域对应的文字识别结果生成目标营业执照。

可选的，所述分割模块，包括：

第一获取单元，用于将所述营业执照图像输入至所述文本分割网络模型中，获取所述营业执照图像中的不同文本位置信息以及对应的文本类别信息；

分割单元，用于根据所述文本位置信息以及所述文本类别信息，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域。

可选的，所述装置还包括：

第二获取模块，用于获取营业执照样本图像集；

提取模块，用于将所述营业执照样本图像集中的每一营业执照样本图像输入至神经网络模型中进行特征提取，得到文本特征图；

第三获取模块，用于根据所述文本特征图，获取文本信息，所述文本信息包括：文本位置信息以及对应的文本类别信息；

训练模块，用于根据所述文本信息与预设文本信息对所述神经网络模型进行训练，得到文本分割网络模型。

可选的，所述第三获取模块，包括：

第二获取单元，用于将所述文本特征图通过连通域分析算法进行处理，获取文本位置信息；

第三获取单元，用于根据所述文本位置信息，获取文本类别信息。

可选的，所述训练模块，包括：

第四获取单元，用于根据所述文本信息与预设文本信息，获取所述神经网络模型的损失值；

处理单元，用于根据所述损失值与预设损失值的差值，对所述神经网络模型进行迭代优化，直至迭代次数达到预设次数和/或所述损失值达到预设损失值，得到文本分割网络模型。

第三方面，本发明实施例提供了一种电子设备，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的营业执照识别方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的营业执照识别方法。

在本发明实施例中，通过获取营业执照图像，并通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域，对每一文本区域进行文字识别，得到每一文本区域对应的文字识别结果，根据每一文本区域对应的文字识别结果生成目标营业执照。利用文本分割网络模型可以对营业执照图像进行结构化分析，自动提取营业执照图像中的不同文本类别的文本区域，不仅可以自动提取文本内容，还简化了现有技术中先进行版面分析再进行文本识别的计算过程，提高文本识别效率。

附图说明

图1是本发明实施例提供的营业执照识别方法的步骤流程图；

图2是本发明实施例提供的文本分割网络模型的训练方法的步骤流程图；

图3是本发明实施例提供的营业执照识别装置的结构框图；

图4是本发明实施例提供的电子设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

具体的，如图1所示，本发明实施例提供了一种营业执照识别方法，上述方法具体包括：

步骤101，获取营业执照图像。

具体的，获取关于营业执照的图像，即营业执照图像。获取方式可以通过用户对营业执照拍照并上传的方式获取，也可以通过其他方式获取，在此不做具体限定。

步骤102，通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域。

具体的，在获取营业执照图像之后，将该营业执照图像输入至文本分割网络模型中，通过该文本分割网络模型对营业执照图像进行分割，分割的方式是：按照文本类别进行区域划分，将不同的文本类别划分不同的区域，一个文本类别对应有一个文本区域，由此得到不同文本类别对应的不同文本区域。

步骤103，对每一文本区域进行文字识别，得到每一文本区域对应的文字识别结果。

具体的，针对每一个文本区域，通过文字识别技术识别出该文本区域中的文字内容，即得到该文本区域对应的文字识别结果，进一步得出营业执照图像中的所有文本区域的文字识别结果。

步骤104，根据每一文本区域对应的文字识别结果生成目标营业执照。

具体的，在得到每一文本区域对应的文字识别结果之后，将文字识别结果按照不同类别自动填充至空白的营业执照模板中，由此生成目标营业执照，该目标营业执照为填充文字识别结果之后的目标营业执照。上述过程自动填充空白营业执照模板中所需要的文本内容，不需要人工填写，更加方便快捷。

在本发明上述实施例中，通过获取营业执照图像，并通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域，对每一文本区域进行文字识别，得到每一文本区域对应的文字识别结果，根据每一文本区域对应的文字识别结果生成目标营业执照。利用文本分割网络模型可以对营业执照图像进行结构化分析，自动提取营业执照图像中的不同文本类别的文本区域，不仅可以自动提取文本内容，还简化了现有技术中先进行版面分析再进行文本识别的计算过程，提高文本识别效率。

作为一可选的实施例，所述步骤102通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域，包括：

具体的，在获取营业执照图像之后，将该营业执照图像输入至文本分割网络模型中，通过该文本分割网络模型，可以获取该营业执照图像中的不同文本的位置信息以及对应于每一文本位置信息的文本类别信息，即不同的文本位置信息具有其对应的文本类别信息。其中，文本位置信息可以为坐标信息。

例如：文本位置信息为坐标信息，文本类别信息包括：地址、单位名称、联系方式等。将营业执照图像输入至文本分割网络模型之后，可以获取下述坐标信息以及其对应的文本类别信息：第一坐标对应的文本类别为地址，第二坐标对应的文本类别为单位名称，第三坐标对应的文本类别为联系方式。

并且，通过该文本分割网络模型，并根据文本位置信息以及其对应的文本类别信息，可以对营业执照图像进行不同文本类别的区域分割，即按照文本类别进行区域划分，将不同的文本类别划分不同的区域，一个文本类别对应有一个文本区域，由此得到不同文本类别对应的不同文本区域。

作为一可选的实施例，如图2所示，所述步骤102通过文本分割网络模型，对所述营业执照图像进行不同文本类型的区域分割，得到不同文本类型的文本区域之前，所述方法还包括步骤A1至步骤A4：

步骤A1，获取营业执照样本图像集和图像标签。

具体的，获取关于营业执照样本的多个营业执照样本的图像以及预先设置的图像标签，构成营业执照样本图像集，即该营业执照样本图像集中包含多个营业执照样本的图像。

步骤A2，将所述营业执照样本图像集中的每一营业执照样本图像输入至神经网络模型中进行特征提取，得到文本特征图。

具体的，将预先设置的图像标签与营业执照样本图像集中的每一个营业执照样本图像输入至神经网络模型中进行网络训练；首先对每一个营业执照样本图像通过神经网络模型进行特征提取，得到关于该营业执照样本图像的文本特征图。其中，此处的图像标签为营业执照图像中的文本位置信息以及文本类别信息。

步骤A3，根据所述文本特征图，获取文本信息，所述文本信息包括：文本位置信息以及对应的文本类别信息。

具体的，根据文本特征图可以得到关于该营业执照样本图像的文本位置信息以及对应的文本类别信息，即将营业执照样本图像输入神经网络模型中，输出关于该营业执照样本图像的文本位置信息以及对应的文本类别信息。

步骤A4，根据所述文本信息与预设文本信息对所述神经网络模型进行训练，得到文本分割网络模型。

具体的，根据上述输出的文本信息与预设的文本信息(即预设的图像标签)，并通过损失函数计算本次模型训练所产生的损失值，并求其反向传播速度，重复上述步骤A1至步骤A4不断优化神经网络模型，得到文本分割网络模型。

通过上述步骤A1至步骤A4训练得到的文本分割网络模型对营业执照图像进行结构化分析，自动提取营业执照图像中的不同文本类别的文本区域，此过程不再需要进行版面分析，简化了文本识别的计算过程，提高文本识别效率。

作为一可选的实施例，所述步骤A3根据所述文本特征图，获取文本信息，包括：

根据所述文本位置信息，获取文本类别信息。

具体的，在得到文本特征图之后，对该文本特征图通过连通域分析算法进行处理，可以得到文本位置信息；并且，通过该文本位置信息，可以得到与其对应的文本类别信息。

作为一可选的实施例，所述步骤A4根据所述文本信息与预设文本信息对所述神经网络模型进行训练，得到文本分割网络模型，包括：

具体的，根据上述输出的文本信息与预设的文本信息(即预设的图像标签)，并通过分割网络损失函数计算本次模型训练所产生的损失值，并求其反向传播速度，重复上述步骤A1至步骤A4不断训练优化神经网络模型中的网络参数，直至迭代次数达到预设次数和/或所述损失值达到预设损失值即完成网络参数训练，得到文本分割网络模型。

需要说明的是，上述预设次数为预先设置的、判断迭代次数是否达到完成网络参数训练的次数阈值，可以根据需要进行设定。预设损失值为预先设置的、判断损失值是否达到完成网络参数训练的损失阈值，可以根据需要进行设定。

综上所述，本发明上述实施例，通过将该营业执照图像输入至文本分割网络模型中，通过该文本分割网络模型，可以获取该营业执照图像中的不同文本位置信息以及对应于每一文本位置信息的文本类别信息，通过该文本位置信息以及对应于每一文本位置信息的文本类别信息，可以提取任意旋转角度的营业执照中所需的文本内容，实现结构化识别企业信息，提升文本结构化速度，不需要复杂的算法设计，运行速度快，提升任意角度营业执照文本识别的准确率；并且能够自动填写所需提取文本内容，不需人工手动填写，更加简便、高效，能够提升服务效率。

以上介绍了本发明实施例提供的营业执照识别方法，下面将结合附图介绍本发明实施例提供的营业执照识别装置。

如图3所示，本发明实施例还提供了一种营业执照识别装置300，包括：

第一获取模块301，用于获取营业执照图像；

分割模块302，用于通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域；

识别模块303，用于对每一文本区域进行文字识别，得到每一文本区域对应的文字识别结果；

生成模块304，用于根据每一文本区域对应的文字识别结果生成目标营业执照。

可选的，所述分割模块302，包括：

可选的，所述装置还包括：

第二获取模块，用于获取营业执照样本图像集；

可选的，所述第三获取模块，包括：

可选的，所述训练模块，包括：

在此需要说明的是，本发明实施例提供的上述营业执照识别装置，能够实现上述营业执照识别方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

优选的，如图4所示，本发明实施例还提供了一种电子设备，包括：处理器410，存储器420，存储在存储器420上并可在处理器410上运行的计算机程序，该计算机程序被处理器410执行时实现上述营业执照识别方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述营业执照识别方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

本领域普通技术人员可以意识到，结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种营业执照识别方法，其特征在于，包括：

获取营业执照图像；

根据每一文本区域对应的文字识别结果生成目标营业执照。

2.根据权利要求1所述的方法，其特征在于，所述通过文本分割网络模型，对所述营业执照图像进行不同文本类别的区域分割，得到不同文本类别对应的文本区域，包括：

3.根据权利要求1所述的方法，其特征在于，所述通过文本分割网络模型，对所述营业执照图像进行不同文本类型的区域分割，得到不同文本类型的文本区域之前，所述方法还包括：

获取营业执照样本图像集；

4.根据权利要求3所述的方法，其特征在于，所述根据所述文本特征图，获取文本信息，包括：

根据所述文本位置信息，获取文本类别信息。

5.根据权利要求3所述的方法，其特征在于，所述根据所述文本信息与预设文本信息对所述神经网络模型进行训练，得到文本分割网络模型，包括：

6.一种营业执照识别装置，其特征在于，包括：

第一获取模块，用于获取营业执照图像；

7.根据权利要求6所述的装置，其特征在于，所述分割模块，包括：

8.根据权利要求6所述的装置，其特征在于，所述装置还包括：

第二获取模块，用于获取营业执照样本图像集；

9.根据权利要求8所述的装置，其特征在于，所述第三获取模块，包括：

10.根据权利要求8所述的装置，其特征在于，所述训练模块，包括：

11.一种电子设备，其特征在于，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的营业执照识别方法的步骤。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的营业执照识别方法的步骤。