CN112287653B

CN112287653B - 产生电子合同的方法、计算设备和计算机存储介质

Info

Publication number: CN112287653B
Application number: CN202011601017.4A
Authority: CN
Inventors: 朱彪; 肖剑锋; 昝凌
Original assignee: Shanghai Bake Information Technology Co ltd; Nanjing Zhishanying Technology Co ltd
Current assignee: Shanghai Bake Information Technology Co ltd; Nanjing Zhishanying Technology Co ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-05-07
Anticipated expiration: 2040-12-30
Also published as: CN112861503A; CN112287653A

Abstract

本发明提供了一种产生电子合同的方法、计算设备和计算机可读存储介质。该方法包括：基于合同创建请求确定与所述合同创建请求匹配的合同模板的图像；利用文本检测和识别的深度学习算法基于所述合同模板的图像确定所述合同模板所包含的一个或多个变量对象；为所述一个或多个变量对象分别赋予变量值；以及基于所述一个或多个变量对象和每个变量对象的变量值产生电子合同图像，其中所述电子合同图像至少包含由所述一个或多个变量对象的变量值构成的图层。

Description

产生电子合同的方法、计算设备和计算机存储介质

技术领域

本发明概括而言涉及计算机软件领域，更具体地，涉及一种产生电子合同的方法、计算设备和计算机可读存储介质。

背景技术

合同是指双方或多方当事人针对他们之间就某项民事关系达成的协议而签署的文件，其类型包括购买合同、租赁合同、担保合同、借贷合同等等。对于许多企业，如银行、电信企业等，其通常为其每种业务准备有相应的纸质格式合同，用户在格式合同的预留空白字段中填入相应的信息并签署，签署后的纸质合同由企业留档。此外，还存在着一些服务平台，其作为用户与企业之间的中介，帮助企业向用户推荐合适的业务类型并协助企业与用户之间的合同签署。在这种情况下，这些服务平台需要针对各个不同企业的各种不同业务类型协助签署各种不同类型的合同。

为此，一种实现方式是在服务平台处向计算机填入所有合同信息以生成文本格式的合同并打印出纸质合同。另一种实现方式是在服务平台处直接打印企业所提供的电子合同模板，然后手动填写相应的合同内容以产生该纸质合同。

然而，上述第一种实现方式虽然完全实现了电子化，但是不适合于合同由多方共同生成的情况。另一种实现方式虽然比较灵活，但是存在着用户手动填写带来的效率低的问题。

尤其是，在一些情况下，企业的纸质合同有其特殊要求，例如必须使用特殊的纸张、必须打印在企业提供的纸质合同模板上等。

在这种情况下，如何在服务平台处产生适合于各种纸质合同模板的电子合同成为一个需要解决的问题。

发明内容

针对上述问题，本发明提供了一种产生电子合同的方案，其通过针对用户的合同创建请求选择匹配的合同模板并利用文本检测和识别的深度学习算法对合同模板中包含的变量对象进行识别，能够快速准确地生成电子合同。

根据本发明的一个方面，提供了一种产生电子合同的方法。该方法包括：基于合同创建请求确定与所述合同创建请求匹配的合同模板的图像；利用文本检测和识别的深度学习算法基于所述合同模板的图像确定所述合同模板所包含的一个或多个变量对象；为所述一个或多个变量对象分别赋予变量值；以及基于所述一个或多个变量对象和每个变量对象的变量值产生电子合同图像，其中所述电子合同图像至少包含由所述一个或多个变量对象的变量值构成的图层。

根据本发明的另一个方面，提供了一种计算设备。该计算设备包括：至少一个处理器；以及至少一个存储器，该至少一个存储器被耦合到该至少一个处理器并且存储用于由该至少一个处理器执行的指令，该指令当由该至少一个处理器执行时，使得该计算设备执行根据上述方法的步骤。

根据本发明的再一个方面，提供了一种计算机可读存储介质，其上存储有计算机程序代码，该计算机程序代码在被运行时执行如上所述的方法。

在一些实施例中，确定所述合同模板所包含的一个或多个变量对象包括：利用VGGNet对所述合同模板的图像进行特征提取以得到所述图像的基于最小文本框的图像特征；利用滑动窗对所述图像特征进行滑动以得到多个特征向量；将所述多个特征向量输入双向长短期模型和全连接层以得到所述图像中的所有最小文本框；连接相邻的最小文本框以构成所述图像的多个文本框；将所述多个文本框之间的空白区域确定为所述一个或多个变量对象的位置；以及基于每个变量对象的位置确定所述多个文本框中与所述变量对象最近的文本框，并对所述文本框进行文本识别以确定所述变量对象。

在一些实施例中，确定所述合同模板所包含的一个或多个变量对象包括：对所述合同模板的图像执行卷积共享以产生所述图像的共享特征图；采用全卷积网络对所述图像的共享特征图进行文本检测以产生预测的文本框；基于所述预测的文本框将所述共享特征图的每个感兴趣区域转换为固定大小的区域；利用所述固定大小的区域的区域特征对所述区域中的文本进行预测识别以确定区域文本；基于预测的文本框和所述区域文本确定包含所述区域的文本内容的文本框；以及基于每个文本框的文本内容确定变量对象的名称。

在一些实施例中，基于所述预测的文本框将所述共享特征图的每个感兴趣区域转换为固定大小的区域包括：通过文本提议的预测来确定仿射变换矩阵，所述仿射变换矩阵可以基于所述共享特征图中的像素与包含所述像素的边界框的顶部、底部、左侧和右侧的距离以及所述边界框相对于水平方向的倾斜角度来确定；以及利用所述仿射变换矩阵对所述共享特征图的每个感兴趣区域的共享特征进行映射以获得水平共享特征。

在一些实施例中，确定区域文本包括：利用长短期记忆网络基于所述区域的区域特征预测所述区域的文本标签以作为所述区域的区域文本。

附图说明

通过参考下列附图所给出的本发明的具体实施方式的描述，将更好地理解本发明，并且本发明的其他目的、细节、特点和优点将变得更加显而易见。

图1示出了用于实现根据本发明的实施例的产生电子合同的方法的系统的示意图。

图2示出了根据本发明的一些实施例的产生电子合同的方法的流程图。

图3示出了一种合同模板的图像的示意图。

图4示出了根据本发明的用于确定合同模板所包含的一个或多个变量对象的步骤的一种实施例的流程图。

图5示出了根据图4所示的步骤获得的文本框的示意图。

图6示出了根据本发明的用于确定合同模板所包含的一个或多个变量对象的步骤的另一种实施例的流程图。

图7示出了根据本发明实施例的一种基于深度学习算法的端到端OCR模型的结构示意图。

图8示出了适合实现本发明的实施例的计算设备的结构方框图。

具体实施方式

下面将参照附图更详细地描述本发明的优选实施方式。虽然附图中显示了本发明的优选实施方式，然而应该理解，可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本发明更加透彻和完整，并且能够将本发明的范围完整的传达给本领域的技术人员。

在下文的描述中，出于说明各种发明的实施例的目的阐述了某些具体细节以提供对各种发明实施例的透彻理解。但是，相关领域技术人员将认识到可在无这些具体细节中的一个或多个细节的情况来实践实施例。在其它情形下，与本申请相关联的熟知的装置、结构和技术可能并未详细地示出或描述从而避免不必要地混淆实施例的描述。

除非语境有其它需要，在整个说明书和权利要求中，词语“包括”和其变型，诸如“包含”和“具有”应被理解为开放的、包含的含义，即应解释为“包括，但不限于”。

在整个说明书中对“一个实施例”或“一些实施例”的提及表示结合实施例所描述的特定特点、结构或特征包括于至少一个实施例中。因此，在整个说明书的各个位置“在一个实施例中”或“在一些实施例”中的出现不一定全都指相同实施例。另外，特定特点、结构或特征可在一个或多个实施例中以任何方式组合。

此外，说明书和权利要求中所用的第一、第二等术语，仅仅出于描述清楚起见来区分各个对象，而并不限定其所描述的对象的大小或其他顺序等。

图1示出了用于实现根据本发明的实施例的产生电子合同的方法的系统1的示意图。如图1中所示，系统1包括一个或多个用户终端10（图1中仅示例性地示出了一个用户终端10）、一个或多个平台服务器20（图1中仅示例性地示出了一个平台服务器20）、一个或多个企业服务器30（图1中仅示例性地示出了一个企业服务器30）和网络40。用户终端10、平台服务器20和企业服务器30可以通过网络40进行数据交互。这里，每个用户终端10可以是平台的用户的移动或固定终端，如手机、平板电脑、台式电脑等。用户终端10例如可以通过其上安装的平台应用程序与平台服务器20通信，以向平台服务器20发送信息和/或从平台服务器20接收信息。平台服务器20可以基于来自用户终端10和/或企业服务器30的数据执行相应的操作。平台服务器20可以包括至少一个处理器210和与该至少一个处理器210耦合的至少一个存储器220，该存储器220中存储有可由该至少一个处理器210执行的指令230，该指令230在被该至少一个处理器210执行时执行如下所述的方法100的至少一部分。注意，在本文中，平台服务器20执行的功能也可以由企业服务器30直接执行，在这种情况下，平台服务器20可以是企业服务器30的一部分。平台服务器20或企业服务器30的具体结构例如可以如下结合图8所述。

图2示出了根据本发明的一些实施例的产生电子合同的方法100的流程图。方法100例如可以由图1中所示的系统1中的平台服务器20或企业服务器30执行。以下以在平台服务器20中执行为例，结合图1至图8对方法100进行描述。

如图2中所示，方法100包括步骤110，其中平台服务器20基于合同创建请求确定与该合同创建请求匹配的合同模板的图像。这里，合同创建请求例如可以是从一个用户的用户终端10接收的，其中至少包含其所请求创建的合同的类型。平台服务器20可以从其合同模板库中选择与该合同创建请求中所指定的合同类型相对应的合同模板。在系统1中包含多个企业的企业服务器30的情况下，合同创建请求还可以包含该用户所针对的企业的名称或标识符。在这种情况下，平台服务器20可以从其合同模板库中选择与该合同创建请求中所指定的企业和合同类型都对应的合同模板。

这里，合同模板库例如是平台服务器20预先采集的各个企业的各种类型的业务的纸质合同模板的电子图像所组成的数据库。

在一些实施例中，平台服务器20的合同模板库中可能不包含用户终端10的合同创建请求中所指定的合同模板的图像。在这种情况系，平台服务器30可以基于该合同创建请求向对应的企业服务器30请求该合同模板的图像。或者，平台服务器30可以线下获取该合同模板的图像，并将其添加到合同模板库中。

接下来，在步骤120，平台服务器20利用文本检测和识别的深度学习算法基于步骤110确定的合同模板的图像确定该合同模板所包含的一个或多个变量对象。

如前所述，对于格式合同而言，其中通常预留有若干空白字段以供用户填入适当的合同信息。例如，这些空白字段例如可以包括：合同编号、合同参与方的名称、地址（家庭地址、单位地址和/或户籍地址等）、联系方式、合同开始日期、结束日期、生效日期等。在平台服务器20中，可以为这些用于填入合同信息的空白字段分别设置和管理一个变量对象。

图3示出了一种合同模板的图像300的示意图。如图3中所示，合同模板是图像格式的，因此无法直接通过文本比较的方式确定其中的变量对象，必须首先从图像中检测和识别出文字。

图4示出了根据本发明的用于确定合同模板所包含的一个或多个变量对象的步骤120的一种实施例的流程图。在图4所示的实施例中，通过检测合同模板的图像300中的文本框来确定文本框之间的空白区域的位置以确定该一个或多个变量对象。更具体地，图4中利用CTPN（Connectionist Text Proposal Network，连接文本提议网络）模型来进行文本框检测，CTPN特别适合于横向分布的文本的检测。

如图4中所示，步骤120可以包括子步骤121，其中利用VGGNet（VGG网络，VGG是Visual Geometry Group（计算机视觉组）的缩写）对图像300进行特征提取以得到图像300的基于最小文本框的图像特征。

VGGNet是牛津大学计算机视觉组和Google DeepMind公司的研究员一起研发的深度卷积神经网络，是一个16~19层深的卷积神经网络。在子步骤121中，可以利用16层的VGGNet（即VGG16）来进行特征提取。VGG16包含5个卷积层Conv1、Conv2、Conv3、Conv4和Conv5。在子步骤121中，在最后一个卷积层Conv5，利用与最小文本框对应的小尺寸卷积核（如3X3的卷积核）对上一层的特征图像进行卷积以得到图像300的基于最小文本框的图像特征。这里，最小文本框的大小可以根据输入的图像大小来确定。

接下来，在子步骤122，利用滑动窗对子步骤121得到的图像特征进行滑动以得到多个特征向量。例如，在卷积层Conv5使用3X3的卷积核的情况下，可以利用大小为3X3、步长为1的滑动窗来进行滑动，从而得到多个特征向量。

接下来，在子步骤123，将子步骤122得到的多个特征向量输入BiLSTM（Bi LongShort Term，双向长短期）模型和全连接层以得到图像300中的所有最小文本框。

在子步骤124，可以连接相邻的最小文本框以构成图像300的多个文本框。图5示出了根据图4所示的步骤获得的文本框301、302、303、304和305的示意图。注意，出于简洁起见，图5中仅标出了图像300的一部分的文本框。

在图4所示的方法中，由于在文本框检测中采用了最小文本框，因此能够准确地检测出所有文本框，并且在这种检测方式中，变量对象所处的区域（其是空白区域后者如图5所示的由下划线构成的区域）不会被检测为文本框。

因此，在子步骤125，可以进一步将子步骤124中确定的文本框之间的空白区域确定为变量对象的位置。例如，在图5中，可以确定空白区域311、312、313和314作为变量对象（以下也称为变量对象311、312、313和314）的位置。这里，子步骤125可以进一步包括去除明显不属于变量对象的空白区域。例如，对于文本框301，其大小明显不同于其他文本框，因此可在子步骤125之前去除该文本框301。

进一步地，在子步骤126，基于子步骤125确定的变量对象的位置确定与该变量对象最近的文本框，并对该文本框进行文本识别以确定该变量对象。例如，对于变量对象311，可以确定与其最近的文本框302，并对该文本框302中的文本进行识别。注意，如果与一个变量对象最近的文本框有两个（即该变量对象前后各有一个距离相同的文本框），在这种情况下，仅取该变量对象之前的一个文本框作为与该变量对象对应的文本框。

图6示出了根据本发明的用于确定合同模板所包含的一个或多个变量对象的步骤120的另一种实施例的流程图。在图6所示的实施例中，可以通过检测合同模板的图像300中的文本框并识别文本框中的文字来确定该一个或多个变量对象。与图4和图5所示的实施例相比，图6的实施例将文本检测和识别集成在一起，从而能够更加快速地直接得到文本检测结果。更具体地，在图6所示的实施例中，利用基于深度学习算法的端到端OCR（光学字符识别）模型来确定合同模板的图像中所包含的一个或多个变量对象。与其他OCR方式相比，基于深度学习的端到端OCR更加适合于具有固定格式的文本的识别，因此更加适合于如本文中所述的格式合同模板的情况。

图7示出了根据本发明实施例的一种基于深度学习算法的端到端OCR模型700的结构示意图。如图7中所示，模型700包括共享卷积层710、文本检测层720、ROI（感兴趣区域）旋转层730、文本识别层740和检测结果层750。卷积共享层710例如可以利用残差网络（ResNet）实现，以基于输入的图像300产生图像300的共享特征图。例如，卷积共享层710可以利用50层残差网络（ResNet-50）实现。文本检测层720例如可以采用全卷积网络来对输入的共享特征图进行文本检测以产生预测的文本框。ROI旋转层730基于文本检测层720输出的预测的文本框将卷积共享层710输出的共享特征图的每个感兴趣区域转换为固定大小的区域。文本识别层740利用ROI旋转层730产生的固定大小的区域的区域特征对该区域中的文本进行预测识别以确定区域文本。检测结果层750基于文本检测层720预测的文本框和文本识别层740识别的区域文本确定包含文本识别结果（即该区域的文本内容）的文本框。

如图6中所示，步骤120可以包括子步骤121'，其中在模型700的共享卷积层710，对合同模板的图像300执行卷积共享以产生图像300的共享特征图。例如，在共享卷积层710使用ResNet-50的情况下，共享卷积层710对图像300的底层和高层的特征进行融合，以产生图像300的共享特征图，其中该共享特征图的分辨率是图像300的1/4。

接下来，在子步骤122'，在文本检测层720，采用全卷积网络对步骤121'产生的图像300的共享特征图进行文本检测以产生预测的文本框。例如，可以将共享卷积层710中原始输入的图像300的1/32到1/4大小的特征映射放大。在提取共享特征之后，应用一个转换来输出密集的每像素的单词预测，并且利用一个通道来计算每个像素为正样本的概率。这里，将原始文本区域的缩小版本中的像素认为是正样本。对于每个正样本，通过4个不同通道分别预测其到包含此像素的边界框（即感兴趣区域的边界）的顶部、底部、左侧和右侧的距离，最后一个通道预测相关边界框的方向，从而通过6个不同通道得到预测的文本框。

接下来，在子步骤123'，在ROI旋转层730，可以基于子步骤122'输出的预测的文本框将子步骤121'输出的共享特征图的每个感兴趣区域转换为固定大小的区域。

更具体地，可以首先通过文本提议（Text Proposal）的预测来确定仿射变换矩阵M。仿射变换矩阵M可以基于共享特征图中的像素与包含该像素的边界框的顶部、底部、左侧和右侧的距离以及该边界框相对于水平方向的倾斜角度来确定。例如，仿射变换矩阵M可以表示为：

其中

x, y表示子步骤121'输出的共享特征图的每个像素的横坐标和纵坐标；

h _t表示仿射变换后的共享特征图的高度；

w _t表示仿射变换后的共享特征图的宽度；

t、b、l、r分别表示共享特征图中的像素（x, y）与包含该像素的边界框的顶部、底部、左侧和右侧的距离；

θ表示该边界框相对于水平方向的倾斜角度。

然后利用该仿射变换矩阵M对共享特征图的每个感兴趣区域的共享特征进行映射以获得水平共享特征。具体地，可以如下确定水平共享特征：

其中，

表示在像素位置(n, m)，通道c的输入；

表示在像素位置(i, j)，通道c的输出；

h _s表示输入的共享特征图的高度；

w _s表示输入的共享特征图的宽度；

、

是双线性差值的核函数k的参数。

在子步骤124'，在文本识别层740，可以利用子步骤123'产生的固定大小的区域的区域特征对该区域中的文本进行预测识别以确定区域文本。

具体地，在子步骤124'中，可以利用长短期记忆（LSTM，Long Short-Term Memory）网络基于子步骤123'产生的区域的区域特征预测该区域的文本标签以作为该区域的区域文本。这里的操作与卷积循环神经网络（CRNN）中类似，本文不再赘述。

接下来，在子步骤125'，在检测结果层750，基于子步骤122'预测的文本框和子步骤124'识别的区域文本确定包含该区域的文本内容的文本框。

通过上述子步骤121'至125'，检测并识别出了图像300中的每个文本框（如图5中所示的文本框301至305）及其文本内容。

接下来，在子步骤126'，基于每个文本框的文本内容确定变量对象的名称。例如，平台服务器20中预先存储有各个变量对象的名称，在子步骤126'，可以将子步骤125'确定的文本框中的文本内容与预存的变量对象的名称进行匹配，以确定匹配的文本框。例如，如图5中所示，假设文本框301至305中，文本框301中的文本内容与预存的变量对象的名称都不匹配，而文本框302至305中的文本内容与预存的变量对象的名称匹配。因此可以确定文本框302至305具有与其相对应的变量对象，并且将文本框302至305后方的预定区域作为变量对象的位置。

继续图2，在步骤130，平台服务器20为步骤120中确定的一个或多个变量对象分别赋予变量值。

具体地，步骤130可以包括：确定该一个或多个变量对象的变量名称。例如，如果步骤120中对与变量对象311最近的文本框302的识别结果指示该文本框302中的内容为“合同号”，这表示变量对象311的变量名称是“合同号”。类似地，如果步骤120中对与变量对象312最近的文本框303的识别结果指示该文本框303中的内容为“贷款人”，这表示变量对象312的变量名称是“贷款人”。

平台服务器20中可以预先存储各种变量名称的变量类型，变量类型可以指示变量值的来源。变量值的来源例如可以包括平台服务器20自动生成、用户终端10输入或者平台服务器20中预先存储等。

例如，假设一个变量名称（如“合同号”）的变量类型指示该变量对象的变量值可以由平台服务器20自动生成。在这种情况下，平台服务器20可以自动为该变量类型的变量对象产生变量值。具体地，平台服务器20中可以记录有每个企业的预设规则信息，例如合同号编号规则。对于当前的合同创建请求，平台服务器20可以根据该合同创建请求中的企业的名称或标识符确定该企业的合同号编号规则，并且根据该合同号编号规则自动为当前的合同产生合同号。例如，某个企业的合同号编号规则是数字递增规则，则平台服务器20可以将其中存储的该企业当前的最后一个合同的合同号加一作为当前的合同的合同号。

又例如，假设一个变量名称（如“贷款人”）的变量类型指示该变量对象的变量值由用户终端10输入。在这种情况下，平台服务器20可以向用户终端10发送消息以要求用户终端10输入该变量对象的变量值。或者，平台服务器20可以从步骤110接收的合同创建请求中提取该变量对象的变量值。

又例如，假设一个变量名称（如“签章”，图中未示出）的变量类型指示该变量对象的变量值预先存储在平台服务器20中。在这种情况下，平台服务器20可以根据合同创建请求中的用户标识获取预先存储的变量值。

在对所有变量对象赋值之后，在步骤140，平台服务器20可以基于步骤120确定的一个或多个变量对象和步骤130确定的每个变量对象的变量值产生电子合同图像。

具体地，在子步骤120中，在确定一个或多个变量对象311、312、313和314时，确定了该变量对象的位置。该位置例如可以由相应的空白区域311、312、313和314的四个角的坐标来表示。因此，在步骤140中，可以将步骤130确定的每个变量对象的变量值填充到相应的空白区域中以产生该电子合同图像。

在一种实施例中，该电子合同图像可以包括两个图层，第一图层包括该合同模板的图像300，位于第一图层之上的第二图层包括与各个变量对象311、312、313和314的位置相对应的变量值。在这种情况下，打印电子合同图像能够产生完整的纸质合同。

在另一种实施例中，该电子合同图像可以包括单个图层，该图层包括与各个变量对象的位置相对应的变量值，即上述第二图层。在这种情况下，可以在纸质合同模板上套打该电子合同图像，以产生完整的纸质合同。

图8示出了适合实现本发明的实施例的计算设备800的结构方框图。计算设备800例如可以是如上所述的平台服务器20或者企业服务器30。

如图8中所示，计算设备800可以包括一个或多个中央处理单元（CPU）810（图中仅示意性地示出了一个），其可以根据存储在只读存储器（ROM）820中的计算机程序指令或者从存储单元880加载到随机访问存储器（RAM）830中的计算机程序指令，来执行各种适当的动作和处理。在RAM 830中，还可存储计算设备800操作所需的各种程序和数据。CPU 810、ROM 820以及RAM 830通过总线840彼此相连。输入/输出（I/O）接口850也连接至总线840。

计算设备800中的多个部件连接至I/O接口850，包括：输入单元860，例如键盘、鼠标等；输出单元870，例如各种类型的显示器、扬声器等；存储单元880，例如磁盘、光盘等；以及通信单元890，例如网卡、调制解调器、无线通信收发机等。通信单元890允许计算设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

上文所描述的方法100例如可由计算设备800的CPU 810执行。例如，在一些实施例中，方法100可被实现为计算机软件程序，其被有形地包括于机器可读介质，例如存储单元880。在一些实施例中，计算机程序的部分或者全部可以经由ROM 820和/或通信单元890而被载入和/或安装到计算设备800上。当计算机程序被加载到RAM 830并由CPU 810执行时，可以执行上文描述的方法100的一个或多个操作。此外，通信单元890可以支持有线或无线通信功能。

本领域技术人员可以理解，图8所示的计算设备800仅是示意性的。在一些实施例中，平台服务器20或企业服务器30可以包含比计算设备800更多或更少的部件。

利用本发明的方案，通过针对用户的合同创建请求选择匹配的合同模板并利用文本检测和识别的深度学习算法对合同模板中包含的变量对象进行识别，能够快速准确地生成电子合同。

以上结合附图对根据本发明的产生电子合同的方法100及可用作平台服务器20或企业服务器30的计算设备800进行了描述。然而本领域技术人员可以理解，方法100的步骤的执行并不局限于图中所示和以上所述的顺序，而是可以以任何其他合理的顺序来执行。此外，计算设备800也不必须包括图8中所示的所有组件，其可以仅仅包括执行本发明中所述的功能所必须的其中一些组件，并且这些组件的连接方式也不局限于图中所示的形式。

本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本发明的各个方面的计算机可读程序指令。

在一个或多个示例性设计中，可以用硬件、软件、固件或它们的任意组合来实现本发明所述的功能。例如，如果用软件来实现，则可以将所述功能作为一个或多个指令或代码存储在计算机可读介质上，或者作为计算机可读介质上的一个或多个指令或代码来传输。

本文公开的装置的各个单元可以使用分立硬件组件来实现，也可以集成地实现在一个硬件组件，如处理器上。例如，可以用通用处理器、数字信号处理器（DSP）、专用集成电路（ASIC）、现场可编程门阵列（FPGA）或其它可编程逻辑器件、分立门或者晶体管逻辑、分立硬件组件或用于执行本文所述的功能的任意组合来实现或执行结合本发明所描述的各种示例性的逻辑块、模块和电路。

本领域普通技术人员还应当理解，结合本发明的实施例描述的各种示例性的逻辑块、模块、电路和算法步骤可以实现成电子硬件、计算机软件或二者的组合。

本发明的以上描述用于使本领域的任何普通技术人员能够实现或使用本发明。对于本领域普通技术人员来说，本发明的各种修改都是显而易见的，并且本文定义的一般性原理也可以在不脱离本发明的精神和保护范围的情况下应用于其它变形。因此，本发明并不限于本文所述的实例和设计，而是与本文公开的原理和新颖性特性的最广范围相一致。

Claims

1.一种产生电子合同的方法，包括：

基于合同创建请求确定与所述合同创建请求匹配的合同模板的图像；

利用文本检测和识别的深度学习算法基于所述合同模板的图像确定所述合同模板所包含的一个或多个变量对象；

为所述一个或多个变量对象分别赋予变量值；以及

基于所述一个或多个变量对象和每个变量对象的变量值产生电子合同图像，其中所述电子合同图像至少包含由所述一个或多个变量对象的变量值构成的图层，

其中确定所述合同模板所包含的一个或多个变量对象包括：

对所述合同模板的图像执行卷积共享以产生所述图像的共享特征图；

采用全卷积网络对所述图像的共享特征图进行文本检测以产生预测的文本框；

基于所述预测的文本框将所述共享特征图的每个感兴趣区域转换为固定大小的区域；

利用所述固定大小的区域的区域特征对所述区域中的文本进行预测识别以确定区域文本；

基于预测的文本框和所述区域文本确定包含所述区域的文本内容的文本框；以及

基于每个文本框的文本内容确定变量对象的名称。

2.如权利要求1所述的方法，其中基于所述预测的文本框将所述共享特征图的每个感兴趣区域转换为固定大小的区域包括：

通过文本提议的预测来确定仿射变换矩阵，所述仿射变换矩阵基于所述共享特征图中的像素与包含所述像素的边界框的顶部、底部、左侧和右侧的距离以及所述边界框相对于水平方向的倾斜角度来确定；以及

利用所述仿射变换矩阵对所述共享特征图的每个感兴趣区域的共享特征进行映射以获得水平共享特征。

3.如权利要求1所述的方法，其中确定区域文本包括：

利用长短期记忆网络基于所述区域的区域特征预测所述区域的文本标签以作为所述区域的区域文本。

4.一种计算设备，包括：

至少一个处理器；以及

至少一个存储器，所述至少一个存储器被耦合到所述至少一个处理器并且存储用于由所述至少一个处理器执行的指令，所述指令当由所述至少一个处理器执行时，使得所述计算设备执行根据权利要求1至3中任一项所述的方法的步骤。

5.一种计算机可读存储介质，其上存储有计算机程序代码，所述计算机程序代码在被运行时执行如权利要求1至3中任一项所述的方法。