WO2021012570A1

WO2021012570A1 - 数据录入方法、装置、设备及存储介质

Info

Publication number: WO2021012570A1
Application number: PCT/CN2019/122812
Authority: WO
Inventors: 胡苗青
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-07-22
Filing date: 2019-12-03
Publication date: 2021-01-28
Also published as: CN110555372A

Abstract

一种数据录入方法、装置、设备及存储介质，所述方法包括：获取文本文件对应的待处理图像；提取文本区域在待处理图像内的边界框得到边界图像；将边界图像输入图像文本识别模型输出对应的文本信息；将文本信息输入关键词提取模型进行关键词提取，获取对应的关键词；将文本信息和对应的关键词存储至目标数据库中完成数据录入。

Description

数据录入方法、装置、设备及存储介质

本申请要求于2019年7月22日提交中国专利局、申请号为201910663209.9、发明名称为“数据录入方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据处理领域，尤其涉及一种数据录入方法、装置、设备及存储介质。

背景技术

传统数据保存的方式大多是利用纸质文件对数据进行保存，但是纸质文件不仅容易丢失，也容易由于遇水、遇火等意外导致损毁，并且纸质文件在查找时，查找效率也比较低。

为了提高数据保存的安全性，现有的数据保存方式通常是将纸质文件上的数据人工输入数据管理系统。然而，现有的人工录入的方式不仅录入效率低，并且在录入时，容易出现错误，录入准确率低。

因此，如何提高数据录入的效率和准确率成为亟待解决的问题。

发明内容

本申请提供了一种数据录入方法、装置、设备及存储介质，为甄别骗保欺诈提供了重要参考。

第一方面，本申请提供了一种数据录入方法，所述方法包括：

获取文本文件对应的待处理图像，所述待处理图像包括文本区域；

对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息；

根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像；

将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；

将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；

将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。

第二方面，本申请还提供了一种数据录入装置，所述装置包括：

待处理图像模块，用于获取文本文件对应的待处理图像，所述待处理图像包括文本区域；

边界框提取模块，用于对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息；及根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像；

文本识别模块，用于将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；

关键词提取模块，用于将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；

数据录入模块，用于将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。

第三方面，本申请还提供了一种计算机设备，所述计算机设备包括存储器和处理器；所述存储器用于存储计算机程序；所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如上述的数据录入方法。

第四方面，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如上述的数据录入方法。

本申请公开了一种数据录入方法、装置、设备及存储介质，通过获取文本文件对应的待处理图像，然后提取待处理图像中的文本区域的边界框，得到边界图像，将边界图像输入图像文本识别模型进行文本识别，输出文本信息，再将文本信息输入关键词提取模型进行关键词提取，从而获得关键词，最后将文本信息和与文本信息对应的关键词存储在目标数据库中，完成数据录入。相对于需要通过人工对纸质文件的内容进行信息录入的方式，本方案通过对文本文件对应的待处理图像进行处理，实现文本信息的录入，提高了数据录入的效率和准确率。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的实施例提供的图像文本识别模型的训练方法的示意流程图；

图2是本申请实施例提供的一种数据录入方法的示意流程图；

图3是本申请实施例提供的子步骤的示意流程图；

图4是本申请实施例提供的对文本信息进行关键词提取的示意流程图；

图5是本申请实施例提供的对文本信息进行关键词提取的子步骤的示意流程图；

图6是本申请实施例提供的另一种数据录入方法的步骤示意流程图；

图7是本申请实施例提供的子步骤的示意流程图；

图8是本申请一实施例提供的一种模型训练装置的示意性框图；

图9是本申请的实施例还提供一种数据录入装置的示意性框图；

图10是本申请的实施例还提供另一种数据录入装置的示意性框图；

图11为本申请一实施例提供的一种计算机设备的结构示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

本申请的实施例提供了一种数据录入方法、装置、计算机设备及存储介质。该数据录入方法可以应用于终端或服务器中，以提高数据录入的准确率和效率。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参阅图1，图1是本申请的实施例提供的图像文本识别模型的训练方法的示意流程图。该图像文本识别模型是基于卷积神经网络进行模型训练得到的，当然也可以采用其他网络进行训练得到。

需要说明的是，在本实施例中，使用GoogLeNet进行模型训练以得到目标识别模型，当然也可以采用其他网络，比如采用卷积神经网络(Convolutional Neural Network，CNN)、深度残差网络(Deep Residual Network，DResNet)或长短期记忆网络(Long Short-Term Memory，LSTM)等中的一个或多个组合的深度学习算法等。以下将以GoogLeNet为例进行介绍。

如图1所示，该图像文本识别模型的训练方法，用于训练出图像文本识别模型以便应用在数据录入方法上。其中，该图像文本识别模型的训练方法包括步骤S101和步骤S102。

S101、获取文本图像样本。

其中，所述文本图像样本为包括文本区域的图像。文本区域的内容可以是合同内容，也可以是身份证内容，还可以是其他文字内容。以下将以文本区域的内容为合同内容为例进行详细说明。

在本实施例中，文本图像样本可以是买卖合同图像、运输合同图像、技术合同图像等不同类型的合同图像，这些合同图像构成文本图像样本，用于训练图像文本识别模型。将多种不同的合同图像作为样本，提高图像文本识别模型的识别准确率。

S102、基于卷积神经网络，根据所述文本图像样本进行模型训练以得到图像文本识别模型，并将所述图像文本识别模型作为预设的图像文本识别模型。

具体地，使用构建的样本数据，通过GoogLeNet进行模型训练，具体可以采用方向传播训练，使用GoogLeNet的卷积层和池化层从输入样本数据中提取特征，使用完全连接层用来做分类器，该分类器的输出是不同图像和文本的概率值。

用随机值初始化所有过滤器和参数/权重；卷积神经网络将训练的样本数据作为输入，经过前向传播步骤(卷积，ReLU激活和池化操作以在完全连接层中的前向传播)，最终得到每个类别的输出概率。

将上述样本数据中的部分图像作为标定数据(ground truth)，利用准备的样本数据通过大规模迭代训练,让卷积神经网络在学习图片语义信息后输出每个文本的输出概率,使用输出概率与标定数据(ground truth)的定义损失函数(loss),在模型训练中尽量缩小损失函数(loss),来保证模型的准确度，以完成模型训练。

由于，数据录入方法可以应用于终端或服务器中，因此需要将训练好的模型保存在终端或服务器中。其中，该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备；服务器可以为独立的服务器，也可以为服务器集群。

如果是应用于终端中，为了保证该终端的正常运行以及快速识别检测出图像的文本信息，还需要对训练得到的图像文本识别模型进行压缩处理，将压缩处理后的模型保存在终端。

其中，该压缩处理具体包括对图像文本识别模型进行剪枝处理、量化处理和哈夫曼编码处理等，以减小图像文本识别模型的大小，进而方便保存在容量较小的终端中。

上述实施例提供的训练方法，通过获取多种文本图像样本，然后基于卷积神经网络，根据文本图像样本进行模型训练以得到图像文本模型，并将得到的图像文本模型作为预先训练的图像文本模型应用于数据录入方法中，由此可提高图像中文本识别的准确度。

请参阅图2，图2是本申请实施例提供的一种数据录入方法的示意流程图。该数据录入方法用于对数据进行识别和录入，提高录入效率和准确率。以下以数据录入方法应用于服务器为例进行介绍。

如图2所示，该数据录入方法，具体包括：步骤S201至步骤S205。

S201、获取文本文件对应的待处理图像。

具体地，所述待处理图像包括文本区域和非文本区域。在具体实施过程中，文本文件对应的待处理图像可以通过图像采集设备例如摄像头进行采集。用户通过图像采集设备采集待处理图像后，由服务器对图像采集设备采集的待处理图像进行获取，以便于对待处理图像进行后续操作。

S202、提取所述文本区域在所述待处理图像内的边界框，以得到边界图像。

其中，所述边界图像为所述边界框内的待处理图像。通过对文本区域进行边界框提取，从而得到边界图像，再对提取后的边界图像进行文本识别，减少合同图像识别时的计算量，进而提高合同图像的识别效率。

在一个实施例中，如图3所示，为了提高边界框提取的准确度，提取所述文本区域在所述待处理图像内的边界框，以得到边界图像，具体包括子步骤S202a和S202b。

S202a、对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息。

其中，对所述待处理图像中的文本区域进行识别是指对待处理图像内的文本、表格信息和位置关系所进行的自动分析。通过对待处理图像中的文本区域进行识别可以获取文本区域的位置信息，并且可以根据文本区域的位置信息判断文本区域的尺寸信息。

具体地，首先对待处理图像中的文本区域进行识别，得到文本区域内文本的区域坐标，所述区域坐标是指文本区域在所述待处理图像上的像素位置坐标；根据文本区域内文本的区域坐标计算外包区域，从而得到文本区域的尺寸信息，所述外包区域是指包括了文本区域的最小区域。

S202b、根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像。

在具体实施过程中，根据文本区域的尺寸信息和位置信息即能够确定文本区域的边界框，然后基于该边界框提取边界框内的待处理图像，并将提取到的待处理图像作为边界图像。

S203、将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息。

具体地，将边界图像输入至预先训练好的图像文本识别模型进行文本识别，由图像文本识别模型输出边界图像中所包括的文本信息。

S204、将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词。

具体地，将从边界图像中识别出的文本信息，输入预先训练的关键词提取模型进行关键词提取，从而从中获得对应的关键词。

例如：从边界图像中识别出的文本信息为：本合同有效期自2017年6月28日起至2019年6月28日。经过关键词提取模型进行关键词提取，得出对应的关键词为：生效日期2017年6月28日，终止日期2018年6月28日。

在一些实施例中，如图4所示，对文本信息进行关键词提取，具体包括子步骤S204a至S204c。

S204a、对所述文本信息进行分词并得到分词结果。

其中，所述分词结果包括至少一个分词。具体地，可以采用最大匹配算法对文本信息进行分词，以得到文本信息包含的每一个分词，并将文本信息包含的各个分词的集合作为分词结果。

其中，最大匹配算法是指以词典为依据，取词典中最长单词为首次扫描串，在词典中进行扫描。例如：词典中最长词为“中华人民共和国”共7个汉字，则最大匹配起始字数为7个汉字。然后逐字递减，在对应的词典中进行查找。可以理解的，在其他实施例中，也可以采用其他方法对文本信息进行分词，例如采用维特比(Viterbi)算法等。

S204b、将至少一个所述分词分别输入预先训练好的关键词提取模型，以获取各所述分词对应的重要性权重。

具体地，将每个分词对应的词向量输入关键词提取模型，由关键词提取模型输出每个分词的重要性权重，重要性权重越大表示该分词的重要性越强。

其中，关键词提取模型可以网络上选取预设数量的标准合同样本对深度学习模型进行模型训练而获得。例如选取1000份标准合同样本进行模型训练。具体的，关键词提取模型包括前后依次连接的双向的长短时记忆(BLSTM)算法模型、最大池化(Max Pooling)算法模型和Softmax算法模型。

S204c、根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词。

其中，关键词可以为合同签约日期、生效日期、终止日期、时效等关键字样。通过关键词提取模型提取文本信息对应的关键词，使得在查询文本信息时，无需遍历文本信息中的每个词，避免查询数据量过大，提高查询效率。

在一些实施例中，请参考图5，步骤S204c包括步骤S204c1和步骤S204c2。

S204c1、根据所述重要性权重对各所述分词进行排序，以获得排序结果。

S204c2、基于所述排序结果选取分词作为所述文本信息的关键词。

具体地，根据重要性权重，对分词结果中的各个分词进行降序排序，选取预设数目的分词作为所述文本信息的关键词。例如，可以选取重要性权重排前三的词作为所述排序结果的关键词。

例如：某份保险合同的签约日期为2018年4月10日，生效日期为2018年4月20日，终止日期为2019年4月10日，时效为一年。其中，签约日期的重要性权重为0.28，生效日期的重要性权重为0.22，终止日期的重要性权重为0.42，时效的重要性权重为0.08。则排序结果如下：终止日期2019年4月10日、签约日期2018年4月10日、生效日期2018年4月20日、时效一年。关键词为终止日期2019年4月10日、签约日期2018年4月10日、生效日期2018年4月20日。

S205、将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。

具体地，在获得文本信息的关键词后，将文本信息和关键词存储至目标数据库，从而完成文本信息的录入，即完成合同相关信息的录入，提高了录入效率和录入准确度。

上述实施例提供的数据录入方法，通过获取包括文本区域的待处理图像；然后提取文本区域在待处理图像内的边界框，以得到边界图像；将边界图像输入预先训练的图像文本识别模型进行文本识别，从而输出文本信息；将文本信息输入关键词提取模型进行关键词提取，从而获取关键词；最终将文本信息和与文本信息对应的关键词存储至目标数据库中，以完成数据录入。通过对文本文件对应的待处理图像进行处理，实现文本信息的录入，提高了数据录入的效率和准确率。

请参阅图6，图6是本申请实施例提供的另一种数据录入方法的步骤示意流程图。该数据录入方法能够提高数据录入的准确率和效率，并提高数据查询的效率。

如图6所示，该数据录入方法，具体包括：步骤S301至步骤S308。

S301、获取文本文件对应的待处理图像。

S302、提取所述文本区域在所述待处理图像内的边界框，以得到边界图像。

具体地，如图7所示，为了避免待识别的合同图片中的噪声、杂点、背景图像等干扰，提高图片识别准确率，提取所述文本区域在所述待处理图像内的边界框，以得到边界图像，包括子步骤S302a至S302c。

S302a、对所述边界框内的待处理图像进行图像平滑处理和小波滤波处理，以得到去噪图像。

具体的，图像平滑处理和小波滤波处理可以消除边界图像的噪声点，从而使边界图像产生较少的模糊。

其中，图像平滑处理可采用邻域平均法。邻域平均法是指将一个像素及其邻域中所有像素的平均值赋输出图像中相应的像素，从而达到平滑的目的，其过程是使一个窗口在图像上滑动，窗口中心位置的值用窗内各点值的平均值来代替，即用几个像素的灰度平均值来代替一个像素的灰度。当然，在其他实施例中，也可以采用其他图像平衡处理的方法，例如中值滤波法。

S302b、对所述去噪图像进行方向矫正处理，以得到矫正图像。

由于所接收的合同可能会有多种旋转角度，因而需要将合同旋转到正确的方向，以便于下一步操作。对去噪图像进行方向矫正处理，以使合同旋转的正确的方向，从而得到矫正图像。

具体的，可以采用图像压缩正位网络对去噪图像进行旋转，完成去噪图像的方向矫正，从而使得去噪图像中的合同文本处于正确的方向，得到矫正图像。图像压缩正位网络是通过机器学习的方法训练得到的，具有图像旋转功能。

S302c、对所述矫正图像进行去背景处理，以得到去背景图像作为边界图像。

具体的，矫正图像包括合同及背景图像，通过去背景处理可以去除矫正图像中背景图像的干扰。

S303、将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息。

具体地，将边界图像输入至预先训练好的图像文本识别模型进行文本识别，从而输出边界图像中所包括的文本信息。

S304、将所述文本信息输入预先训练的文本分类模型进行类别识别，以输出所述文本信息对应的分类类别。

比如，文本信息为保险合同，则该文本分类模型可能识别出保险合同的分类类别包括保险标的和保险保障风险等信息。保险标的包括：人身保险或财产保险。保险保障风险包括：人寿保险、人身意外伤害保险或健康保险等。例如识别的文本信息的保险标的和保险保障风险分别为人身保险和人寿保险。

S305、将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词。

需要说明的是，本方案中并不限制步骤S304和步骤S305之间的执行顺序。

S306、根据所述分类类别，将所述文本信息和与所述文本信息对应的关键词存储至目标数据库对应的子数据库中，以完成数据录入。

具体地，每一分类类别对应有一个子数据库，各子数据库的集合构成目标数据库。在获得文本信息对应的分类类别后，可以确定目标数据库中与该分类类别对应的子数据库，将文本信息和该文本信息对应的关键词信息存储至该子数据库中，从而完成对合同信息的高效录入，录入准确度高并降低了人力成本。

S307、接收数据查询请求。

其中，所述数据查询请求包括查询关键词，查询关键词可以包括分类类别、生效日期等等。具体地，查询请求可以是用户通过问话模式输入语音信息，由该语音信息所转化得到的具有查询请求的文本，也可以是用户直接向服务器发送的数据查询请求。

S308、根据所述查询关键词匹配所述目标数据库中的关键词，以获取与所述查询关键词对应的目标文本信息。

具体地，在接收到数据查询请求后，根据数据查询请求中的查询关键词在目标数据库中进行匹配。若查询关键词与目标数据库中的关键词匹配一致，则将匹配到的关键词对应的文本信息作为目标文本信息进行输出，从而高效的完成目标合同的查询。

当查询关键词中包括分类类别时，首先根据分类类别从目标数据库中选择与分类类别对应的子数据库，然后根据其他查询关键词在该子数据库中进行关键词匹配，提高查询的效率。

上述实施例提供的数据录入方法通过获取包括文本区域的待处理图像；然后提取文本区域在待处理图像内的边界框，以得到边界图像；对边界图像进行文本识别，从而输出文本信息；对文本信息进行类别识别，得到文本信息的分类类别；对文本信息进行关键词提取，从而获取关键词；最终根据分类类别将文本信息和与文本信息对应的关键词存储至目标数据库中，以完成数据录入。然后接收数据查询请求，并根据该数据查询请求匹配目标数据库中的关键词，从而获得文本信息。通过对文本文件对应的待处理图像进行处理，实现文本信息的录入，提高了数据录入的效率和准确率。对文本信息进行分类，提高数据录入时的条理性，也在进行数据查询时，提高查询效率。

请参阅图8，图8是本申请一实施例提供的一种模型训练装置的示意性框图，该模型训练装置可以配置于服务器中，用于执行前述的图像文本识别模型的训练方法。

如图8所示，该模型训练装置400，包括：样本获取模块401和模型训练模块402。

样本获取模块401，用于获取文本图像样本，所述文本图像样本为包括文本区域的图像。

模型训练模块402，用于基于卷积神经网络，根据所述文本图像样本进行模型训练以得到图像文本识别模型，并将所述图像文本识别模型作为预设的图像文本识别模型。

请参阅图9，图9是本申请的实施例还提供一种数据录入装置的示意性框图，该数据录入装置用于执行前述的数据录入方法。其中，该数据录入装置可以配置于服务器或终端中。

其中，服务器可以为独立的服务器，也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。

如图9所示，数据录入装置500包括：待处理图像模块501、边界框提取模块502、文本识别模块503、关键词提取模块504和数据录入模块505。

待处理图像模块501，获取文本文件对应的待处理图像，所述待处理图像包括文本区域。

边界框提取模块502，用于提取所述文本区域在所述待处理图像内的边界框，以得到边界图像，所述边界图像为所述边界框内的待处理图像。

在一个实施例中，边界框提取模块502包括区域识别子模块5021和边界框确定子模块5022。

其中，区域识别子模块5021，用于对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息。边界框确定子模块5022，用于根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像。

文本识别模块503，用于将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息。

关键词提取模块504，用于将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词。

在一些实施例中，关键词提取模块504包括分词结果子模块5041、权重获取子模块5042、关键词确定子模块5043。

其中，分词结果子模块5041，用于对所述文本信息进行分词并得到分词结果。权重获取子模块5042，用于将至少一个所述分词分别输入预先训练好的关键词提取模型，以获取各所述分词对应的重要性权重。关键词确定子模块5043，用于根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词。

在一些实施例中，关键词确定子模块5043具体用于：根据所述重要性权重对各所述分词进行排序，以获得排序结果；基于所述排序结果选取分词作为所述文本信息的关键词。

数据录入模块505，用于将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。

请参阅图10，图10是本申请的实施例还提供另一种数据录入装置的示意性框图，该数据录入装置用于执行前述的数据录入方法。其中，该数据录入装置可以配置于服务器中。

如图10所示，该数据录入装置600包括：待处理图像模块601、边界框提取模块602、文本识别模块603、类别确定模块604、关键词提取模块605、数据录入模块606、请求接收模块607和查询匹配模块608。

待处理图像模块601，获取文本文件对应的待处理图像，所述待处理图像包括文本区域。

边界框提取模块602，用于提取所述文本区域在所述待处理图像内的边界框，以得到边界图像，所述边界图像为所述边界框内的待处理图像。

在一个实施例中，边界框提取模块602包括去噪图像子模块6021、矫正图像子模块6022和去背景图像子模块6023。

其中，去噪图像子模块6021，用于对所述边界框内的待处理图像进行图像平滑处理和小波滤波处理，以得到去噪图像。矫正图像子模块6022，用于对所述去噪图像进行方向矫正处理，以得到矫正图像。去背景图像子模块6023，用于对所述矫正图像进行去背景处理，以得到去背景图像作为边界图像。

文本识别模块603，用于将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息。

类别确定模块604，用于将所述文本信息输入预先训练的文本分类模型进行类别识别，以输出所述文本信息对应的分类类别。

关键词提取模块605，用于将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词。

数据录入模块606，用于根据所述分类类别，将所述文本信息和与所述文本信息对应的关键词存储至目标数据库对应的子数据库中，以完成数据录入。

请求接收模块607，用于接收数据查询请求，所述数据查询请求包括查询关键词。

查询匹配模块608，用于根据所述查询关键词匹配所述目标数据库中的关键词，以获取与所述查询关键词对应的目标文本信息。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的数据录入装置和各模块的具体工作过程，可以参考前述数据录入方法实施例中的对应过程，在此不再赘述。

上述的数据录入装置可以实现为一种计算机程序的形式，该计算机程序可以在如图11所示的计算机设备上运行。

请参阅图11，图11是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。

参阅图11，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口，其中，存储器可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行任意一种数据录入方法。

处理器用于提供计算和控制能力，支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行任意一种数据录入方法。

该网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图11中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中，在一个实施例中，所述处理器用于运行存储在存储器中的计算机程序，以实现如下步骤：

获取文本文件对应的待处理图像，所述待处理图像包括文本区域；提取所述文本区域在所述待处理图像内的边界框，以得到边界图像，所述边界图像为所述边界框内的待处理图像；将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。

在一个实施例中，所述处理器在实现所述提取所述文本区域在所述待处理图像内的边界框，以得到边界图像时，用于实现：

对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息；根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像。

在另一个实施例中，所述处理器在实现所述提取所述文本区域在所述待处理图像内的边界框，以得到边界图像时，用于实现：

对所述边界框内的待处理图像进行图像平滑处理和小波滤波处理，以得到去噪图像；对所述去噪图像进行方向矫正处理，以得到矫正图像；对所述矫正图像进行去背景处理，以得到去背景图像作为边界图像。

在一些实施例中，所述处理器在实现所述将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词时，用于实现：

对所述文本信息进行分词并得到分词结果，所述分词结果包括至少一个分词；将至少一个所述分词分别输入预先训练好的关键词提取模型，以获取各所述分词对应的重要性权重；根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词。

在一个实施例中，所述处理器在实现所述根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词时，用于实现：

根据所述重要性权重对各所述分词进行排序，以获得排序结果；基于所述排序结果选取分词作为所述文本信息的关键词。

其中，在另一实施例中，所述处理器用于运行存储在存储器中的计算机程序，以实现如下步骤：

获取文本文件对应的待处理图像，所述待处理图像包括文本区域；提取所述文本区域在所述待处理图像内的边界框，以得到边界图像，所述边界图像为所述边界框内的待处理图像；将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入；接收数据查询请求，所述数据查询请求包括查询关键词；根据所述查询关键词匹配所述目标数据库中的关键词，以获取与所述查询关键词对应的目标文本信息。

获取文本图像样本，所述文本图像样本为包括文本区域的图像；基于卷积神经网络，根据所述文本图像样本进行模型训练以得到图像文本识别模型，并将所述图像文本识别模型作为预设的图像文本识别模型。

本申请的实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序中包括程序指令，所述处理器执行所述程序指令，实现本申请实施例提供的任一项数据录入方法。

其中，所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元，例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备，例如所述计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种数据录入方法，所述方法包括：

获取文本文件对应的待处理图像，所述待处理图像包括文本区域；

对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息；

根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像；

将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；

将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；

将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。
根据权利要求1所述的数据录入方法，其中，所述根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像，包括：

对所述边界框内的待处理图像进行图像平滑处理和小波滤波处理，以得到去噪图像；

对所述去噪图像进行方向矫正处理，以得到矫正图像；

对所述矫正图像进行去背景处理，以得到去背景图像作为边界图像。
根据权利要求1所述的数据录入方法，其中，所述将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词，包括：

对所述文本信息进行分词并得到分词结果，所述分词结果包括至少一个分词；

将至少一个所述分词分别输入预先训练好的关键词提取模型，以获取各所述分词对应的重要性权重；

根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词。
根据权利要求3所述的数据录入方法，其中，所述根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词，包括：

根据所述重要性权重对各所述分词进行排序，以获得排序结果；

基于所述排序结果选取分词作为所述文本信息的关键词。
根据权利要求1所述的数据录入方法，其中，还包括：

接收数据查询请求，所述数据查询请求包括查询关键词；

根据所述查询关键词匹配所述目标数据库中的关键词，以获取与所述查询关键词对应的目标文本信息。
根据权利要求1所述的数据录入方法，其中，还包括：

获取文本图像样本，所述文本图像样本为包括文本区域的图像；

基于卷积神经网络，根据所述文本图像样本进行模型训练以得到图像文本识别模型，并将所述图像文本识别模型作为预设的图像文本识别模型。
根据权利要求1所述的数据录入方法，其中，所述关键词包括合同签约日期、生效日期、终止日期和时效。
一种数据录入装置，所述装置包括：

待处理图像模块，用于获取文本文件对应的待处理图像，所述待处理图像包括文本区域；

边界框提取模块，用于对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息；及根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像；

文本识别模块，用于将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；

关键词提取模块，用于将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；

数据录入模块，用于将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。
一种计算机设备，所述计算机设备包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如下步骤：

获取文本文件对应的待处理图像，所述待处理图像包括文本区域；

对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息；

根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像；

将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；

将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；

将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。
如权利要求9所述的计算机设备，其中，所述处理器在实现所述根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像时，用于实现：

对所述边界框内的待处理图像进行图像平滑处理和小波滤波处理，以得到去噪图像；

对所述去噪图像进行方向矫正处理，以得到矫正图像；

对所述矫正图像进行去背景处理，以得到去背景图像作为边界图像。
如权利要求9所述的计算机设备，其中，所述处理器在实现所述将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词时，用于实现：

对所述文本信息进行分词并得到分词结果，所述分词结果包括至少一个分词；

将至少一个所述分词分别输入预先训练好的关键词提取模型，以获取各所述分词对应的重要性权重；

根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词。
如权利要求11所述的计算机设备，其中，所述处理器在实现所述根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词时，用于实现：

根据所述重要性权重对各所述分词进行排序，以获得排序结果；

基于所述排序结果选取分词作为所述文本信息的关键词。
如权利要求9所述的计算机设备，其中，所述处理器还用于实现：

接收数据查询请求，所述数据查询请求包括查询关键词；

根据所述查询关键词匹配所述目标数据库中的关键词，以获取与所述查询关键词对应的目标文本信息。
如权利要求9所述的计算机设备，其中，所述处理器还用于实现：

获取文本图像样本，所述文本图像样本为包括文本区域的图像；

基于卷积神经网络，根据所述文本图像样本进行模型训练以得到图像文本识别模型，并将所述图像文本识别模型作为预设的图像文本识别模型。
如权利要求9所述的计算机设备，其中，所述关键词包括合同签约日期、生效日期、终止日期和时效。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如下步骤：

获取文本文件对应的待处理图像，所述待处理图像包括文本区域；

对所述待处理图像中的文本区域进行识别，以获取所述文本区域的尺寸信息和位置信息；

根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像；

将所述边界图像输入预先训练的图像文本识别模型进行文本识别，以输出与所述边界图像对应的文本信息；

将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词；

将所述文本信息和与所述文本信息对应的关键词存储至目标数据库中，以完成数据录入。
如权利要求16所述的计算机可读存储介质，其中，所述处理器在实现所述根据所述尺寸信息和位置信息确定所述文本区域的边界框，并将所述边界框内的待处理图像作为边界图像时，用于实现：

对所述边界框内的待处理图像进行图像平滑处理和小波滤波处理，以得到去噪图像；

对所述去噪图像进行方向矫正处理，以得到矫正图像；

对所述矫正图像进行去背景处理，以得到去背景图像作为边界图像。
如权利要求16所述的计算机可读存储介质，其中，所述处理器在实现所述将所述文本信息输入预先训练的关键词提取模型进行关键词提取，以获取与所述文本信息对应的关键词时，用于实现：

对所述文本信息进行分词并得到分词结果，所述分词结果包括至少一个分词；

将至少一个所述分词分别输入预先训练好的关键词提取模型，以获取各所述分词对应的重要性权重；

根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词。
如权利要求18所述的计算机可读存储介质，其中，所述处理器在实现所述根据所述重要性权重，选取与所述重要性权重对应的所述分词作为所述文本信息的关键词时，用于实现：

根据所述重要性权重对各所述分词进行排序，以获得排序结果；

基于所述排序结果选取分词作为所述文本信息的关键词。
如权利要求16所述的计算机可读存储介质，其中，所述处理器还用于实现：

接收数据查询请求，所述数据查询请求包括查询关键词；

根据所述查询关键词匹配所述目标数据库中的关键词，以获取与所述查询关键词对应的目标文本信息。