CN116720495A

CN116720495A - 一种合同生成方法、装置、电子设备和存储介质

Info

Publication number: CN116720495A
Application number: CN202310689614.4A
Authority: CN
Inventors: 张哲�; 陈哲仟
Original assignee: Guangdong Caihua Network Technology Co ltd
Current assignee: Guangdong Caihua Network Technology Co ltd
Priority date: 2023-06-12
Filing date: 2023-06-12
Publication date: 2023-09-08

Abstract

本发明公开了一种合同生成方法、装置、电子设备和存储介质，所述方法包括：接收多媒体数据，其中，所述多媒体数据包含合同签订双方的交流内容；根据所述多媒体数据，确定合同的使用场景以及合同内容；根据所述使用场景，确定相应的合同模板；在所述合同模板中填入所述合同内容由此，通过接收多媒体数据，根据多媒体数据，确定合同的使用场景以及合同内容；根据使用场景，确定相应的合同模板；在合同模板中填入合同内容，以完成合同的生成。此过程无需依托于完善的系统和平台，技术难度大大降低，同时还提高效率，减少了手动撰写合同的时间和人力成本，减少了人工犯错的风险，提高了合同的准确性。

Description

一种合同生成方法、装置、电子设备和存储介质

技术领域

本发明涉及文档处理技术领域，尤其涉及一种合同生成方法、装置、电子设备和存储介质。

背景技术

目前合同基本上为人工撰写，存在繁琐、耗时、易出错等问题。也有少部分通过动态合同生成，可以根据特定条件和参数自动生成标准合同文本。但需要有专业的技术支持，技术难度较高，需要专业人员来进行维护和管理。需要依托于完善的系统和平台，如果系统不稳定或者存在漏洞，可能会对合同生成和管理带来影响。

发明内容

本发明实施例提供了一种合同生成方法、装置、电子设备和存储介质，具有提高工作效率并且降低技术难度的有益效果。

本发明提供一种合同生成方法，所述方法包括：

接收多媒体数据，其中，所述多媒体数据包含合同签订双方的交流内容；

根据所述多媒体数据，确定合同的使用场景以及合同内容；

根据所述使用场景，确定相应的合同模板；

在所述合同模板中填入所述合同内容。

通过接收多媒体数据，根据多媒体数据，确定合同的使用场景以及合同内容；根据使用场景，确定相应的合同模板；在合同模板中填入合同内容，以完成合同的生成。此过程无需依托于完善的系统和平台，技术难度大大降低，同时还提高效率，减少了手动撰写合同的时间和人力成本，减少了人工犯错的风险，提高了合同的准确性。

在一可实施方式中，所述根据所述多媒体数据，确定合同的使用场景以及合同内容，包括：

若所述多媒体数据为文本数据，则通过自然语言处理模型识别所述文本数据，得到合同的使用场景以及合同内容。

若所述多媒体数据为影像数据，则通过图像识别模型识别影像中物体数据；

根据所述物体数据，得到合同的使用场景；

通过提取所述影像数据中的声音数据，将所述声音数据转换为文本数据；

通过自然语言处理模型识别所述文本数据，以得到合同内容。

在一可实施方式中，所述多媒体数据为影像数据；

相应的，所述根据所述多媒体数据，确定合同的使用场景，包括：

分别提取图像的GIST特征值、LBP特征值与HSV特征值；

将GIST特征值、LBP特征值与HSV特征值归一化；

将归一化后的GIST特征值、LBP特征值与HSV特征值进行融合得到融合特征值；

将融合特征值带入分类器中，分类器对融合特征进行识别并输出合同的使用场景。

通过对影像数据进行GIST特征值、LBP特征值和HSV特征值的提取，将这些特征值进行归一化和融合，得到融合特征值，并将其输入到分类器中进行识别。分类器可以根据融合特征值的不同组合来识别不同的合同使用场景，从而实现自动生成合同的目的。

相较于传统的合同生成方法，该方法不需要手动填写各项合同内容，而是直接通过影像数据生成合同，并且可以根据影像数据的特征快速准确地确定合同使用场景，具有高效性和准确性的优势。

在合同生成中，GIST特征值可以用于识别影像数据的场景和内容特征，LBP特征值可以用于识别影像数据中的纹理特征，HSV特征值可以用于识别影像数据的颜色特征，综合利用GIST特征值、LBP特征值与HSV特征值等，可以将影像数据的多个特征进行融合，得到更加全面和准确的特征描述符，进而实现合同使用场景的自动识别和合同内容的自动生成。

在一可实施方式中，所述GIST特征值的提取过程为：

选择5个尺度与8个方向的GABOR核；

将图像与上述40个GABOR核依次做卷积得到40个处理后的图像；

将每个处理后的图像分为b×b个小块，并计算每个小块的灰度均值得到40×b×b个灰度均值，40×b×b个能量值组成的向量即为40×b×b维的GIST特征值；其中b的取值为3或4。

不同尺度的纹理信息在图像中所占比例不同，而且一些纹理信息只在特定的尺度下才能被有效提取。所以，选择5个尺度可以更全面地提取图像的纹理信息。选择8个方向的Gabor核可以提取图像中更丰富的纹理特征，一方面，这些方向能够涵盖图像中的水平、垂直和对角线等方向，对于不同的图像纹理能够有更好的适应性，另一方面，使用多个方向的Gabor核可以捕捉图像中的不同方向和频率的纹理信息，这有助于区分不同的图像区域，提高合同生成的准确性和可靠性。40×b×b维的GIST特征值包含了图像全局信息的抽象表示，可以用于确定合同的使用场景以及合同的内容。

在一可实施方式中，所述LBP特征值的提取过程为：

设置3像素点×3像素点的计算窗口；

将计算窗口加到图像上，比较计算窗口的周围点像素值是否大于中心点像素值；

利用计算窗口遍历整个图像，得到图像中每个非边缘像素点的新像素值，并将各边缘像素点的新像素值设为特定值，即得到经过LBP处理后的图像；其中，边缘像素点是指图像四条边上的像素点，非边缘像素点是指图像中除了四条边上的像素点以外的像素点；

将经过LBP处理后的图像分为c×c个小块，并分别计算每个小块灰度直方图，所述灰度直方图中的灰度采用64阶表示，便得到每个小块中64个灰阶上分布的像素点数；

将c×c个小块64个灰阶上分布的像素点数依次排列最终得到c×c×64维的LBP特征值；其中c的取值为2或3。

将图像分为小块并计算每个小块的灰度直方图，可以减小图像尺寸，降低维度，提高特征提取效率。LBP特征值可以用于识别合同中的印章、签名、文字等局部纹理特征，有助于提高合同识别的准确率。

在一可实施方式中，所述HSV特征值的提取过程为：

将图像分为e×e个小块，并分别计算每个小块的颜色直方图，所述颜色直方图中的颜色采用90阶表示，便得到每个小块中90个色阶上分布的像素点数；将e×e个小块90个灰阶上分布的像素点数依次排列最终得到e×e×90维的HSV特征值；其中e的取值为2或3。

HSV特征值是通过计算图像中各个小块的颜色分布特征而得到的，可以反映图像的色彩特征和颜色分布情况。本申请使用HSV特征值来描述合同中的彩色元素，如图标、章节标记、表格等，从而进行自动识别、分类、分割等处理，提高合同生成的效率和准确度。

本发明另一方面提供一种合同生成装置，所述装置包括：

数据接收模块，用于接收多媒体数据，其中，所述多媒体数据包含合同签订双方的交流内容；

数据识别模块，用于根据所述多媒体数据，确定合同的使用场景以及合同内容；

模板选取模块，用于根据所述使用场景，确定相应的合同模板；

数据写入模块，用于在所述合同模板中填入所述合同内容。

本发明另一方面提供一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现权利要求上述任一项所述的方法步骤。

本发明另一方面提供一种计算机存储介质，所述存储介质存储有计算机可执行指令，当所述指令被执行时用执行上述任一项所述的合同生成方法。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

在附图中，相同或对应的标号表示相同或对应的部分。

图1为本发明实施例一种合同生成方法的实现流程示意图；

图2为本发明实施例一种合同生成装置的结构组成图。

具体实施方式

为使本发明的目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明提供一种合同生成方法，方法包括：

步骤101，接收多媒体数据，其中，多媒体数据包含合同签订双方的交流内容；

步骤102，根据多媒体数据，确定合同的使用场景以及合同内容；

步骤103，根据使用场景，确定相应的合同模板；

步骤104，在合同模板中填入合同内容。

本实施例中，在步骤101中，多媒体数据可以至少包括文本数据、图像数据、声音数据、视频数据等，交流内容指的是合同签订双方对于合同的事项描述，例如合同的标的、金额、日期等事项。

上述数据可以通过手持移动设备采集并在移动设备中执行合同的生成，也可以通过移动设备将多媒体数据上传到云端服务器，进而通过云端服务器来执行合同的生成步骤，以提供执行效率。

以云端服务器处理该方法为例，在步骤102中，云端服务器根据多媒体数据进行分析，判断该合同的使用场景并从交流内容中提取关于合同的合同内容。其中，使用场景可以是售楼场景、招聘场景等等，具体判断方式可以是根据文本信息、图像信息、声音信息的其中一种或多种分析出使用场景，同时从多媒体数据中分析提取出合同内容部分。

在步骤103中，由于不同使用场景所对应不同的合同模板，例如，在招聘场景中，所对应的是劳务合同模板；在售楼场景中，所对应的是购房合同模板。云端服务器在分析出使用场景之后，从相关数据库中获取与该使用场景相映射的合同模板，其中，合同模板一般包括合同编号、合同类型、合同主体、合同日期、合同条款等信息。

在步骤104中，云端服务器在确定使用场景以及合同模板之后，将之前所提到的合同内容对应写入到合同模板中，至此完成合同的生成。生成后的合同再反馈至合同签订双方的设备中。

由此，通过接收多媒体数据，根据多媒体数据，确定合同的使用场景以及合同内容；根据使用场景，确定相应的合同模板；在合同模板中填入合同内容，以完成合同的生成。此过程无需依托于完善的系统和平台，技术难度大大降低，同时还提高效率，减少了手动撰写合同的时间和人力成本，减少了人工犯错的风险，提高了合同的准确性。

在一可实施方式中，根据多媒体数据，确定合同的使用场景以及合同内容，包括：

若多媒体数据为文本数据，则通过自然语言处理模型识别文本数据，得到合同的使用场景以及合同内容。

本实施例中，若多媒体数据为文本数据的情况下，云端服务器可选择用自然语言处理模型中的语义识别模型来识别文本数据，进而得到合同的使用场景以及合同内容，其中语义识别模型可以具体是NNLM神经网络语言模型、Word2vec神经网络模型、TextCNN神经网络模型等。

若多媒体数据为影像数据，则通过图像识别模型识别影像中物体数据；

根据物体数据，得到合同的使用场景；

通过提取影像数据中的声音数据，将声音数据转换为文本数据；

通过自然语言处理模型识别文本数据，以得到合同内容。

本实施例中，影像数据包括图像数据、声音数据、视频数据。

若多媒体数据为图像数据或者视频数据的情况下，云端服务器可选择用图像识别模型来识别得到图像或者视频中的物体，再通过所识别到的物体得到合同的使用场景。以售楼场景为例，其中的物体可以是楼盘模型，又以招聘场景为例，其中的物体可以是招聘海报，然后通过这些物体确认合同的使用场景。

若多媒体数据为声音数据的情况下，云端服务器可选择用语音识别技术将声音转为文本，然后再利用自然语言处理模型识别该文本数据，以得到合同内容。

在一可实施方式中，多媒体数据为影像数据；

相应的，根据多媒体数据，确定合同的使用场景，包括：

分别提取图像的GIST特征值、LBP特征值与HSV特征值；

将GIST特征值、LBP特征值与HSV特征值归一化；

本实施例中，GIST特征是一种生物启发式的特征，本身模拟生物视觉系统。GIST特征是通过多尺度多方向GABOR滤波器组对图像滤波后得到的形状信息。GABOR滤波器组在图像处理中使用广泛，主要目的是提取图像的不同尺度不同方向的轮廓细节，在本发明中，尺度选择5个，方向选择8个。

对每个特征值进行归一化，以GIST特征值的距离归一化为例，经过前述方法得到包含40×4×4＝640个元素的GIST特征值向量，令为(a1,a2,a3,...a640)，归一化后的GIST特征值向量为(a1/sG,a2/sG,a3/sG,...a640/sG)。

经过归一化后，三种特征值向量中的每个元素都在同一定的数值范围内，如归一化后的特征值元素都在0～1之间，以便后续融合。

将同一图像归一化后的三种特征值按照一定的顺序排列，便得到一个融合特征。如某图像归一化后的GSIT特征值为(a1/sG,a2/sG,a3/sG,...a640/sG)，归一化后的LBP特征值为(b1/sL,b2/sL,b3/sL,...b256/sL)，归一化后的HSV特征值为(c1/sH,c2/sH,c3/sH,...c360/sH)。其中，融合特征值为：(a1/sG,a2/sG,a3/sG,...a640/sG,b1/sL,b2/sL,b3/sL,...b256/sL,c1/sH,c2/sH,c3/sH,...c360/sH)。

分类器选用的是SVM分类器(支持向量机)。它是一种二类分类器，其基本模型定义为特征空间上的间隔最大的线性分类器，其学习思想是间隔最大化，最终可转化为一个凸二次规划问题的求解，主要特点是训练样本需求小，与样本的维度无关，只与支持向量有关，良好的过拟合等。

在一可实施方式中，GIST特征值的提取过程为：

选择5个尺度与8个方向的GABOR核；

将图像与上述40个GABOR核依次做卷积得到40个处理后的图像；

本实施例中，将图像与上述40个GABOR核依次做卷积得到40个处理后的图像。考虑到本发明方法主要用于智能手机上，而GABOR滤波器本身是加窗傅立叶变换，为了加快计算速度，在本发明的一个具体实施例中先把图像变换到频域，与GABOR核依次做乘积后，将结果变换回时域得到轮廓信息。

在一可实施方式中，LBP特征值的提取过程为：

设置3像素点×3像素点的计算窗口；

将经过LBP处理后的图像分为c×c个小块，并分别计算每个小块灰度直方图，灰度直方图中的灰度采用64阶表示，便得到每个小块中64个灰阶上分布的像素点数；

本实施例中，若大于将该周围点的像素点设为1，否则设为0，将8个周围点的像素值依次排列得到一个8位无符号的二进制数，将这个无符号二进制数作为中心点的新像素值。取8个周围点的像素值的顺序可以是以计算窗口左上角的点为起点顺时针取，也可以以其他周围点为起点，顺时针或逆时针取，但是不管以什么样的顺序取值组合得到8位二进制数，只要保证遍历整幅图像的每个计算窗口中的取值顺序一致即可。

利用计算窗口遍历整个图像，得到图像中每个非边缘像素点的新像素值，并将各边缘像素点的新像素值设为某值，如设为0，即得到经过LBP处理后的图像。其中，边缘像素点是指图像四条边上的像素点，非边缘像素点是指图像中除了四条边上的像素点以外的像素点。

在一可实施方式中，HSV特征值的提取过程为：

将图像分为e×e个小块，并分别计算每个小块的颜色直方图，颜色直方图中的颜色采用90阶表示，便得到每个小块中90个色阶上分布的像素点数；将e×e个小块90个灰阶上分布的像素点数依次排列最终得到e×e×90维的HSV特征值；其中e的取值为2或3。

在一可实施方式中，若物体数据包括文本数据，根据物体数据，得到合同的使用场景，包括：

通过光学字符识别技术识别物体数据中的文本数据；

根据文本数据，得到合同的使用场景。

本实施例中，若经过图像识别模型得到的物体中包含文本数据，例如图像中包含一张纸，纸上包含着合同内容，在此情况下，通过光学字符识别技术识别物体数据中的文本数据，通过该文本数据来识别得到合同的使用场景。

在一可实施方式中，在通过提取影像数据中的声音数据，将声音数据转换为文本数据之后，方法还包括：

将光学字符识别技术所识别得到的文本数据和声音数据转换得到的文本数据进行核对；

在核对无误的情况下，通过自然语言处理模型识别文本数据，以得到合同内容。

本实施例中，若影像数据存在声音数据的情况下，光学字符识别技术所识别得到的文本数据和声音数据转换得到的文本数据进行核对，以确定两者的文本数据是准确无误，提高了数据的准确性。

在一可实施方式中，在合同模板中填入合同内容之后，方法还包括：

检查合同模板中是否含有未填信息；

在确定合同模板中含有未填信息的情况下，发出相应的提醒。

本实施例中，在合同模板中填入合同内容之后，遍历该合同模板，以检查合同模板中是否还有未填的信息，若还有未填的信息，则给合同签订方发出相应的提醒，该提醒可以是弹窗信息，也可以是电话短信信息。

获取合同签订方的人脸信息；

将人脸信息发送至公安的人脸识别系统，并得到相应的身份信息；

若身份信息与合同内容不一致，则发出相应的提醒。

本实施例中，在合同模板中填入合同内容之后，为了提升签订合同的真实性，可通过摄像头拍摄合同签订方的人脸信息，将人脸信息发送至公安的人脸识别系统，并得到相应的身份信息，将该身份信息与合同内容进行核对，若不一致，则也发出相应的提醒。

在一可实施方式中，在所述合同模板中填入所述合同内容之后，所述方法还包括：

将生成的合同通过区块链发送给合同签订双方；

或者，将合同数据加密或者设置为只读模式之后发送给合同签订双方。

本实施例中，为了防止合同在签订之后被篡改，提升签订合同的安全性，将生成的合同通过区块链发送给合同签订双方，区块链技术具有高安全性、高透明性、高自治性以及不可篡改性。

除了上述方法之外，还可以通过将合同数据加密或者将文档设置为只读模式之后再发送给签订双方，进而提高合同的安全性。

如图2所示，本发明另一方面提供一种合同生成装置，装置包括：

数据接收模块201，用于接收多媒体数据，其中，多媒体数据包含合同签订双方的交流内容；

数据识别模块202，用于根据多媒体数据，确定合同的使用场景以及合同内容；

模板选取模块203，用于根据使用场景，确定相应的合同模板；

数据写入模块204，用于在合同模板中填入合同内容。

本实施例中，在数据接收模块201中，多媒体数据可以至少包括文本数据、图像数据、声音数据、视频数据等，交流内容指的是合同签订双方对于合同的事项描述，例如合同的标的、金额、日期等事项。

以云端服务器处理该方法为例，在数据识别模块202中，云端服务器根据多媒体数据进行分析，判断该合同的使用场景并从交流内容中提取关于合同的合同内容。其中，使用场景可以是售楼场景、招聘场景等等，具体判断方式可以是根据文本信息、图像信息、声音信息的其中一种或多种分析出使用场景，同时从多媒体数据中分析提取出合同内容部分。

在模板选取模块203中，由于不同使用场景所对应不同的合同模板，例如，在招聘场景中，所对应的是劳务合同模板；在售楼场景中，所对应的是购房合同模板。云端服务器在分析出使用场景之后，从相关数据库中获取与该使用场景相映射的合同模板，其中，合同模板一般包括合同编号、合同类型、合同主体、合同日期、合同条款等信息。

在数据写入模块204中，云端服务器在确定使用场景以及合同模板之后，将之前所提到的合同内容对应写入到合同模板中，至此完成合同的生成。生成后的合同再反馈至合同签订双方的设备中。

在一可实施方式中，数据识别模块202具体用于：

根据物体数据，得到合同的使用场景；

通过自然语言处理模型识别文本数据，以得到合同内容。

在一可实施方式中，若物体数据包括文本数据，数据识别模块202具体用于：

通过光学字符识别技术识别物体数据中的文本数据；

根据文本数据，得到合同的使用场景。

在一可实施方式中，在通过提取影像数据中的声音数据，将声音数据转换为文本数据之后，数据识别模块202还具体用于：

在一可实施方式中，在合同模板中填入合同内容之后，数据写入模块204还具体用于：

检查合同模板中是否含有未填信息；

获取合同签订方的人脸信息；

若身份信息与合同内容不一致，则发出相应的提醒。

在一可实施方式中，在所述合同模板中填入所述合同内容之后，数据写入模块204还具体用于：

将生成的合同通过区块链发送给合同签订双方；

本发明另一方面提供一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现上述方法步骤。

本实施例中，执行存储器上所存放的程序时，接收多媒体数据，其中，多媒体数据包含合同签订双方的交流内容；根据多媒体数据，确定合同的使用场景以及合同内容；根据使用场景，确定相应的合同模板；在合同模板中填入合同内容。

本发明另一方面提供一种计算机存储介质，存储介质存储有计算机可执行指令，当指令被执行时用执行上述合同生成方法。

本实施例中，计算机存储介质呗执行时，接收多媒体数据，其中，多媒体数据包含合同签订双方的交流内容；根据多媒体数据，确定合同的使用场景以及合同内容；根据使用场景，确定相应的合同模板；在合同模板中填入合同内容。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种合同生成方法，其特征在于，所述方法包括：

根据所述多媒体数据，确定合同的使用场景以及合同内容；

根据所述使用场景，确定相应的合同模板；

在所述合同模板中填入所述合同内容。

2.根据权利要求1所述的方法，其特征在于，所述根据所述多媒体数据，确定合同的使用场景以及合同内容，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述多媒体数据，确定合同的使用场景以及合同内容，包括：

根据所述物体数据，得到合同的使用场景；

4.根据权利要求1所述的方法，其特征在于，所述多媒体数据为影像数据；

分别提取图像的GIST特征值、LBP特征值与HSV特征值；

将GIST特征值、LBP特征值与HSV特征值归一化；

5.根据权利要求4所述的方法，其特征在于，所述GIST特征值的提取过程为：

选择5个尺度与8个方向的GABOR核；

将图像与上述40个GABOR核依次做卷积得到40个处理后的图像；

6.根据权利要求4所述的方法，其特征在于，所述LBP特征值的提取过程为：

设置3像素点×3像素点的计算窗口；

7.根据权利要求4所述的方法，其特征在于，所述HSV特征值的提取过程为：

8.根据权利要求1所述的方法，其特征在于，在所述合同模板中填入所述合同内容之后，所述方法还包括：

将生成的合同通过区块链发送给合同签订双方；

9.一种合同生成装置，其特征在于，所述装置包括：

数据写入模块，用于在所述合同模板中填入所述合同内容。

10.一种计算机存储介质，所述存储介质存储有计算机可执行指令，当所述指令被执行时用执行权利要求1-8任一项所述的合同生成方法。