CN110069594B - 合同确认方法、装置、电子设备及存储介质 - Google Patents
合同确认方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110069594B CN110069594B CN201910173139.9A CN201910173139A CN110069594B CN 110069594 B CN110069594 B CN 110069594B CN 201910173139 A CN201910173139 A CN 201910173139A CN 110069594 B CN110069594 B CN 110069594B
- Authority
- CN
- China
- Prior art keywords
- contract
- verified
- sample
- label
- clause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种合同确认方法,包括:计算样本合同中每个词语的IDF指标值;根据所述IDF指标值计算所述样本合同中每一条款中每个词语的TF‑IDF权重值;将所述每个词语的TF‑IDF权重值进行降序排序,并提取排在前面的预设个数TF‑IDF权重值对应的词语;根据提取的词语概括对应条款的内容,并加入一条款标签;扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签;及当所述待验证合同中包含所述样本合同中的所有条款标签时,确认所述待验证合同验证通过。本发明还提供一种合同确认装置、电子设备及存储介质。通过本发明采用数据比对的方式实现避免待验证合同中条款缺失或有误的情况出现。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种合同确认方法、装置、电子设备及存储介质。
背景技术
合同因其具有极强的约束力和灵活的变通性而广泛应用于生产生活中的各个领域,一份完整的合同由数条明确双方权利义务的合同条款组成,合同条款的严谨与否直接影响了一份合同的效力与可行性。绝大多数的诉讼案件均是起始并纠缠于合同中的某条或数条条款之上,对于法律知识掌握程度的差异性决定了自身合法权益受保护的程度。随着新兴事物的不断丰富和国际一体化的发展趋势,越来越多的陌生人通过合同建立了首次信任的基础,作为合同全部组成部分、确保合同本着公平公正方向履行的合同条款,自然随之显得尤为重要。
《合同法》中的合同风险则是指各种非正常的损失,它既包括可归责于合同一方或双方当事人的事由所导致的损失,又包括不可归责于合同双方当事人的事由所导致的损失。合同条款的风险包括但不限于条款因减免一方义务而导致无效、因不可归责于一方原因而造成免责、因难以继续履行的事由发生而被终止等等。
合同领域没有专门的语料资源,同时也没有专门的字典表,导致也没有合同领域专有的TF-IDF相关的数据。非合同领域的IDF数据,计算的TF-IDF指标不具有代表意义,不能真实反映关键词的权重,从而无法判断待确认的合同是否具备所需条款。
发明内容
鉴于以上内容,有必要提出一种合同确认方法、装置、电子设备及存储介质,可以避免待验证合同中条款缺失或有误的情况出现。
本发明的第一方面提供一种合同确认方法,所述方法包括:
计算样本合同中每个词语的IDF指标值;
根据所述IDF指标值计算所述样本合同中每一条款中每个词语的TF-IDF权重值;
将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
根据提取的词语概括对应条款的内容,并加入一条款标签;
扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签,其中,所述待验证合同的类别与所述样本合同的类别一致;及
当所述待验证合同中包含所述样本合同中的所有条款标签时,确认所述待验证合同验证通过。
优选地,在“根据提取的词语概括对应条款的内容,并加入一条款标签”之后,所述方法还包括:
保存所述条款标签,并建立所述样本合同的标签词库。
优选地,确认所述待验证合同中是否包含所述样本合同中的所有条款标签的方法包括:
扫描所述待验证合同,计算所述待验证合同中每一条款中每个词语的TF-IDF权重值;
将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
根据提取的词语概括对应条款的内容,并加入一待验证条款标签;
确定所述待验证条款标签是否包含所述标签词库中的所述条款标签;
当所述待验证条款标签包含所述标签词库中的所述条款标签时,确认所述待验证合同验证通过;
当所述待验证条款标签未包含所述标签词库中的所述条款标签时,确认所述待验证合同未验证通过。
优选地,在确认所述待验证合同中是否包含所述样本合同中的所有条款标签之前,所述方法还包括:
通过计算所述样本合同与所述待验证合同之间的相似度指标来对所述待验证合同进行初步筛选。
优选地,当所述样本合同与所述待验证合同之间的相似度指标值大于等于预设值,确认所述样本合同与所述待验证合同之间相似度高,将所述待验证合同中待验证条款标签与所述标签词库中的所述条款标签进行比对,以确认所述待验证合同;
当所述样本合同与所述待验证合同之间的相似度指标值小于所述预设值,确认所述样本合同与所述待验证合同之间相似度低,无需将所述待验证合同中待验证条款标签与所述标签词库中的所述条款标签进行比对,确认所述待验证合同验证未通过。
优选地,计算所述样本合同与所述待验证合同之间的相似度指标的步骤包括:
获取所述样本合同的关键词;
获取所述待验证合同的关键词;
根据所述样本合同的关键词的TF-IDF权重值得到所述样本合同的向量,及根据所述待验证合同的关键词的TF-IDF权重值得到所述待验证合同的向量;
利用余弦定理计算所述样本合同的向量和所述待验证合同的向量之间的余弦值,所述余弦值即为所述样本合同与所述待验证合同之间的相似度指标。
优选地,在“计算样本合同中每个词语的IDF指标值”之前,所述方法还包括:
确定所述样本合同的类别。
本发明的第二方面提供一种合同确认装置,所述装置包括:
计算模块,用于计算样本合同中每个词语的IDF指标值;
所述计算模块,还用于根据所述IDF指标值计算所述样本合同中每条款中每个词语的TF-IDF权重值;
提取模块,用于将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
处理模块,用于根据提取的词语概括对应条款的内容,并加入一条款标签;及
确认模块,用于扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签,其中,所述待验证合同的类别与所述样本合同的类别一致;及
所述确认模块,还用于当所述待验证合同中包含所述样本合同中的所有条款标签时,确认所述待验证合同验证通过。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述合同确认方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述合同确认方法。
本发明所述的合同确认方法、装置、电子设备及存储介质,本发明通过计算样本合同中词语的TF-IDF权重值筛选样本合同条款的关键词,并根据所述关键词概括条款内容,再加入一条款标签以标记所述样本合同,根据所述样本合同中的条款标签来确认待验证合同是否验证通过,可以避免待验证合同中条款缺失或有误的情况出现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例一提供的合同确认方法的流程图。
图2是本发明实施例二提供的合同确认装置的功能模块图。
图3是本发明实施例三提供的电子设备的示意图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例的合同确认方法应用在电子设备中。所述对于需要进合同确认的电子设备,可以直接在电子设备上集成本发明的方法所提供的合同确认功能,或者安装用于实现本发明的方法的客户端。再如,本发明所提供的方法还可以以软件开发工具包(Software Development Kit,SDK)的形式运行在服务器等设备上,以SDK的形式提供合同确认功能的接口,电子设备或其他设备通过提供的接口即可实现合同确认功能。
实施例一
图1是本发明实施例一提供的合同确认方法的流程图。根据不同的需求,所述流程图中的执行顺序可以改变,某些步骤可以省略。
步骤S1、确定样本合同的类别。
在本实施方式中,所述样本合同包括标题、签约主体、鉴于条款、释义、正文和结尾等内容。可以理解的是,所述正文是合同中最核心的部分,与当事人的权利义务关系最直接、最密切。所述正文至少包括约定条款和格式条款。所述约定条款即特定合同的个性化条款。如买卖合同中标的、价款、运输方式等;出资协议中出资额、出资比例及出资时间等。所述格式条款即与合同性质无关,几乎所有合同都可以记载的条款。如,不可抗力,合同变更及解除,违约责任,法律适用,争议解决等等。
本实施方式中,所述合同的类别包括,但不限于,买卖合同、借款合同、赠与合同、租赁合同、技术开发合同、委托合同、保管合同、运输合同、承揽合同、仓储合同。
在本实施方式中,通过将样本合同中的数据输入合同分类模型,从而获取该合同对应的类别,以实现确认所述样本合同的类别的目的。
具体地,所述合同分类模型通过机器学习的训练方法获取,其中,训练所述合同分类模型的方法包括:
a)将合同数据训练集输入卷积神经网络,其中,所述合同数据训练集包括若干合同的数据和所述若干合同分别对应的类别;
b)对所述卷积神经网络进行优化并执行步骤a),直至所述卷积神经网络的准确率达到预先设定的训练标准,将训练好的所述卷积神经网络作为合同分类模型。
可以理解的是,以上列举的确定所述样本合同的类别的方法仅是一个示例性的说明,并不对本发明构成限制,所述机器学习的方法包括但不限于机械学习、通过传授学习、类比学习、归纳学习、基于解释的学习和通过事例学习等现有的以及未来出现的机器学习方法,都在本发明的保护范围之内。
在另一实施方式中,所述确定样本合同的类别包括:
(a1)读取所述样本合同的文本内容的前N个字,其中,N可以为大于或等于预设值(例如7,8,或者10)的正整数;
(a2)从所述前N个字中查找与所述合同类别所对应的字词,若所述前N个字中存在与某个合同类别所对应的字词,则确定所述样本合同属于所述某个合同类别。
举例而言,假设所述N等7,所述样本合同的文本内容的前7个字为“葡萄酒买卖合同”,则可以从该前7个字中找到与合同类别为“买卖合同”所对应的字词,那么即可确定所述样本合同的合同类别为买卖合同。
步骤S2、计算所述样本合同中每个词语的IDF指标值。
具体地,假设所述样本合同D包含n个条款d1,d2…,dn,若记nw,d表示词语w在条款d中出现的次数,则w关于d的词频(Term Rrequency,TF)可定义:
其中,u∈d表示词语u包含在条款d中。
记nw表示样本合同D中包含词语w的条款的数据,则w关于D的逆文档频度(InverseDocument Frequency,IDF)可定义为:
其中,w∈D表示w至少出现在样本合同D的某个条款中(避免nw=0)。
步骤S3、根据所述IDF指标值计算所述样本合同中每条款中每个词语的TF-IDF权重值。
在本实施方式中,通过计算所述样本合同中每个词语的IDF指标值,然后再据此计算每个合同中每个条款下每个词语的TF-IDF权重值,最终确定每个条款的核心关键词。
所述词频-逆文档频度(Term Frequency-Inverse Document Frequency,TF-IDF)技术,它是一种用于资讯检索与文本挖掘的常用加权技术,可以用来评估一个词对于一个文档集或语料库中某个文档的重要程度。
由上述的公式可以得到词语w关于条款d的TF-IDF值定义为:
TFIDF(w,d):=γw,d=αw,d·βw,D,其值越大,表示词语w与条款d的相关性越高。
在本实施方式中,通过计算所述样本合同中每条款中每个词语的TF-IDF权重值来生成该条款的关键词。
步骤S4、将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语。
例如,在计算所述样本合同中每条款中每个词语的TF-IDF权重值后,对所述TF-IDF权重值进行降序排序,然后提取排在前面的十个TF-IDF权重值对应的词语。那么,这十个词语就是该条款所需的关键词。
步骤S5、根据提取的词语概括对应条款的内容,并加入一条款标签。
例如,上述十个关键词都与所述样本合同中代表着“权利”的条款内容相关,那么可以根据所述十个关键词确认该条款为合同中描述权利的条款,从而可以为该条款加入一权利标签。
又如,上述十个关键词都与所述样本合同中代表着“义务”的条款内容相关,那么可以根据所述十个关键词确认该条款为合同中描述义务的条款,从而可以为该条款加入一权利标签。
在本实施方式中,所述提取排在前面的TF-IDF权重值对应的词语的个数可以增加或减少,不限于上述的十个。但是可以理解的是,所述预设个数至少为三个,从而可以方便根据提取的词语概括对应条款的内容。
步骤S6、保存所述条款标签,并建立所述样本合同的标签词库。
可以理解的是,所述样本合同可以包括多个条款,每一条款都可加入一条款标签,从而可以对所述样本合同进行标记,再根据所述样本合同的所有条款的条款标签建立所述标签词库,并将所述标签此词库保存至数据库中。方便后续与待验证合同进行比对,以确认所述待验证合同是否包含与所述样本合同相同的所有条款。从而可以避免待验证合同中条款缺失或有误的情况出现。
步骤S7、扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签,其中,所述待验证合同的类别与所述样本合同的类别一致。
在本实施方式中,为了保证所述待验证合同与样本合同的一致性,避免出现不同类型的合同具有相同条款的情况出现,需要所述待验证合同的类别与所述样本合同的类别一致,从而再将所述待验证合同中的条款与样本合同的条款进行比对,来确认所述待验证合同。
具体地,当所述待验证合同中包含所述样本合同中的所有条款标签时,说明所述待验证合同中包含有所述样本合同中的所有条款,确认所述待验证合同验证通过;当所述待验证合同中未包含所述样本合同中的所有条款标签时,说明所述待验证合同中可能出现条款缺失或有误的情况,确认所述待验证合同验证未通过。
具体地,确认所述待验证合同中是否包含所述样本合同中的所有条款标签的方法包括:
扫描所述待验证合同,计算所述待验证合同中每条款中每个词语的TF-IDF权重值;
将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
根据提取的词语概括对应条款的内容,并加入一待验证条款标签;
确定所述待验证条款标签是否包含所述标签词库中所述条款标签;
当所述待验证条款标签包含所述标签词库中所述条款标签时,确认所述待验证合同验证通过;
当所述待验证条款标签未包含所述标签词库中所述条款标签时,说明所述待验证合同中可能出现条款缺失或有误的情况,确认所述待验证合同未验证通过。
优选地,在确认所述待验证合同中是否包含所述样本合同中的所有条款标签的步骤之前,还可以通过计算所述样本合同与所述待验证合同之间的相似度指标来对所述待验证合同进行初步筛选。
当所述样本合同与所述待验证合同之间的相似度指标值大于等于预设值,说明所述样本合同与所述待验证合同之间相似度高,可以对所述待验证合同再进行条款标签比对,以确认所述待验证合同;当所述样本合同与所述待验证合同之间的相似度指标值小于所述预设值,说明所述样本合同与所述待验证合同之间相似度低,无需进行条款标签的比对,确认所述待验证合同验证未通过。
在本实施方式中,计算所述样本合同与所述待验证合同之间的相似度指标的步骤包括:
获取所述样本合同的关键词;
获取所述待验证合同的关键词;
根据所述样本合同的关键词的TF-IDF权重值得到所述样本合同的向量,及根据所述待验证合同的关键词的TF-IDF权重值得到所述待验证合同的向量;
利用余弦定理计算所述样本合同的向量和所述待验证合同的向量之间的余弦值,即可得到所述样本合同与所述待验证合同之间的相似度指标。
可以理解的是,所述样本合同的向量和所述待验证合同的向量之间的余弦值越大,表示所述样本合同的向量和所述待验证合同的向量之间的夹角越小,则所述样本合同的向量和所述待验证合同的向量之间的相似度越高。
综上所述,本发明提供的合同确认方法包括,计算样本合同中每个词语的IDF指标值;根据所述IDF指标值计算所述样本合同中每条款中每个词语的TF-IDF权重值;将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;根据提取的词语概括对应条款的内容,并加入一条款标签;扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签;及当所述待验证合同中包含所述样本合同中的所有条款标签时,确认所述待验证合同验证通过。本发明通过计算样本合同中词语的TF-IDF权重值筛选样本合同条款的关键词,并根据所述关键词概括条款内容,再加入一条款标签以标记所述样本合同,根据所述样本合同中的条款标签来确认待验证合同是否验证通过,可以避免待验证合同中条款缺失或有误的情况出现。
以上所述,仅是本发明的具体实施方式,但本发明的保护范围并不局限于此,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。
下面结合图2和图3,分别对实现上述合同确认方法的电子设备的功能模块及硬件结构进行介绍。
实施例二
图2为本发明合同确认装置较佳实施例中的功能模块图。
在一些实施例中,所述合同确认装置20运行于电子设备中。所述合同确认装置20可以包括多个由程序代码段所组成的功能模块。所述合同确认装置20中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行合同确认功能。
本实施例中,所述合同确认装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:计算模块201、提取模块202、处理模块203及确认模块204。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在一些实施例中,关于各模块的功能将在后续的实施例中详述。
所述确认模块204用于确定样本合同的类别。
在本实施方式中,所述样本合同包括标题、签约主体、鉴于条款、释义、正文和结尾等内容。可以理解的是,所述正文是合同中最核心的部分,与当事人的权利义务关系最直接、最密切。所述正文至少包括约定条款和格式条款。所述约定条款即特定合同的个性化条款。如买卖合同中标的、价款、运输方式等;出资协议中出资额、出资比例及出资时间等。所述格式条款即与合同性质无关,几乎所有合同都可以记载的条款。如,不可抗力,合同变更及解除,违约责任,法律适用,争议解决等等。
本实施方式中,所述合同的类别包括,但不限于,买卖合同、借款合同、赠与合同、租赁合同、技术开发合同、委托合同、保管合同、运输合同、承揽合同、仓储合同。
在本实施方式中,通过将样本合同中的数据输入合同分类模型,从而获取该合同对应的类别,以实现确认所述样本合同的类别的目的。
具体地,所述合同分类模型通过机器学习的训练方法获取,其中,训练所述合同分类模型的方法包括:
a)将合同数据训练集输入卷积神经网络,其中,所述合同数据训练集包括若干合同的数据和所述若干合同分别对应的类别;
b)对所述卷积神经网络进行优化并执行步骤a),直至所述卷积神经网络的准确率达到预先设定的训练标准,将训练好的所述卷积神经网络作为合同分类模型。
可以理解的是,以上列举的确定所述样本合同的类别的方法仅是一个示例性的说明,并不对本发明构成限制,所述机器学习的方法包括但不限于机械学习、通过传授学习、类比学习、归纳学习、基于解释的学习和通过事例学习等现有的以及未来出现的机器学习方法,都在本发明的保护范围之内。
在另一实施方式中,所述确定样本合同的类别包括:
(a1)读取所述样本合同的文本内容的前N个字,其中,N可以为大于或等于预设值(例如7,8,或者10)的正整数;
(a2)从所述前N个字中查找与所述合同类别所对应的字词,若所述前N个字中存在与某个合同类别所对应的字词,则确定所述样本合同属于所述某个合同类别。
举例而言,假设所述N等7,所述样本合同的文本内容的前7个字为“葡萄酒买卖合同”,则可以从该前7个字中找到与合同类别为“买卖合同”所对应的字词,那么即可确定所述样本合同的合同类别为买卖合同。
所述计算模块201用于计算所述样本合同中每个词语的IDF指标值。
具体地,假设所述样本合同D包含n个条款d1,d2…,dn,若记nw,d表示词语w在条款d中出现的次数,则w关于d的词频(Term Rrequency,TF)可定义:
其中,u∈d表示词语u包含在条款d中。
记nw表示样本合同D中包含词语w的条款的数据,则w关于D的逆文档频度(InverseDocument Frequency,IDF)可定义为:
其中,w∈D表示w至少出现在样本合同D的某个条款中(避免nw=0)。
所述计算模块201还用于根据所述IDF指标值计算所述样本合同中每条款中每个词语的TF-IDF权重值。
在本实施方式中,通过计算所述样本合同中每个词语的IDF指标值,然后再据此计算每个合同中每个条款下每个词语的TF-IDF权重值,最终确定每个条款的核心关键词。
所述词频-逆文档频度(Term Frequency-Inverse Document Frequency,TF-IDF)技术,它是一种用于资讯检索与文本挖掘的常用加权技术,可以用来评估一个词对于一个文档集或语料库中某个文档的重要程度。
由上述的公式可以得到词语w关于条款d的TF-IDF值定义为:
TFIDF(w,d):=γw,d=αw,d·βw,D,其值越大,表示词语w与条款d的相关性越高。
在本实施方式中,通过计算所述样本合同中每条款中每个词语的TF-IDF权重值来生成该条款的关键词。
所述提取模块202用于将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语。
例如,在计算所述样本合同中每条款中每个词语的TF-IDF权重值后,对所述TF-IDF权重值进行降序排序,然后提取排在前面的十个TF-IDF权重值对应的词语。那么,这十个词语就是该条款所需的关键词。
在本实施方式中,所述提取排在前面的TF-IDF权重值对应的词语的个数可以增加或减少,不限于上述的十个。但是可以理解的是,所述预设个数至少为三个,从而可以方便处理模块203根据提取的词语概括对应条款的内容。
所述处理模块203用于根据提取的词语概括对应条款的内容,并加入一条款标签。
例如,上述十个关键词都与所述样本合同中代表着“权利”的条款内容相关,那么可以根据所述十个关键词确认该条款为合同中描述权利的条款,从而可以为该条款加入一权利标签。
又如,上述十个关键词都与所述样本合同中代表着“义务”的条款内容相关,那么可以根据所述十个关键词确认该条款为合同中描述义务的条款,从而可以为该条款加入一权利标签。
所述处理模块203还用于保存所述条款标签,并建立所述样本合同的标签词库。
可以理解的是,所述样本合同可以包括多个条款,每一条款都可加入一条款标签,从而可以对所述样本合同进行标记,再根据所述样本合同的所有条款的条款标签建立所述标签词库。方便后续与待验证合同进行比对,以确认所述待验证合同是否包含与所述样本合同相同的所有条款。从而可以避免待验证合同中条款缺失或有误的情况出现。
所述确认模块204用于扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签,其中,所述待验证合同的类别与所述样本合同的类别一致。
在本实施方式中,为了保证所述待验证合同与样本合同的一致性,需要所述待验证合同的类别与所述样本合同的类别一致,从而再将所述待验证合同中的条款与样本合同的条款进行比对,来确认所述待验证合同。
具体地,当所述待验证合同中包含所述样本合同中的所有条款标签时,说明所述待验证合同中包含有所述样本合同中的所有条款,确认所述待验证合同验证通过;当所述待验证合同中未包含所述样本合同中的所有条款标签时,说明所述待验证合同中可能出现条款缺失或有误的情况,确认所述待验证合同验证未通过。
具体地,确认所述待验证合同中是否包含所述样本合同中的所有条款标签的方法包括:
扫描所述待验证合同,计算所述待验证合同中每条款中每个词语的TF-IDF权重值;
将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
根据提取的词语概括对应条款的内容,并加入一待验证条款标签;
确定所述待验证条款标签是否包含所述标签词库中所述条款标签;
当所述待验证条款标签包含所述标签词库中所述条款标签时,确认所述待验证合同验证通过;
当所述待验证条款标签未包含所述标签词库中所述条款标签时,说明所述待验证合同中可能出现条款缺失或有误的情况,确认所述待验证合同未验证通过。
优选地,在确认所述待验证合同中是否包含所述样本合同中的所有条款标签的之前,还可以通过计算所述样本合同与所述待验证合同之间的相似度指标来对所述待验证合同进行初步筛选。
当所述样本合同与所述待验证合同之间的相似度指标值大于等于预设值,说明所述样本合同与所述待验证合同之间相似度高,可以对所述待验证合同再进行条款标签比对,以确认所述待验证合同;当所述样本合同与所述待验证合同之间的相似度指标值小于所述预设值,说明所述样本合同与所述待验证合同之间相似度低,无需进行条款标签的比对,确认所述待验证合同验证未通过。
在本实施方式中,计算所述样本合同与所述待验证合同之间的相似度指标的方法包括:
获取所述样本合同的关键词;
获取所述待验证合同的关键词;
根据所述样本合同的关键词的TF-IDF权重值得到所述样本合同的向量,及根据所述待验证合同的关键词的TF-IDF权重值得到所述待验证合同的向量;
利用余弦定理计算所述样本合同的向量和所述待验证合同的向量之间的余弦值,即可得到所述样本合同与所述待验证合同之间的相似度指标。
可以理解的是,所述样本合同的向量和所述待验证合同的向量之间的余弦值越大,表示所述样本合同的向量和所述待验证合同的向量之间的夹角越小,则所述样本合同的向量和所述待验证合同的向量之间的相似度越高。
综上所述,本发明所述的合同确认装置20,包括计算模块201、提取模块202、处理模块203及确认模块204。所述计算模块201用于计算样本合同中每个词语的IDF指标值;所述计算模块201还用于根据所述IDF指标值计算所述样本合同中每条款中每个词语的TF-IDF权重值;所述提取模块202用于将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;所述处理模块203用于根据提取的词语概括对应条款的内容,并加入一条款标签;所述确认模块204用于扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签;及所述确认模块204还用于当所述待验证合同中包含所述样本合同中的所有条款标签时,确认所述待验证合同验证通过。本发明通过计算样本合同中词语的TF-IDF权重值筛选样本合同条款的关键词,并根据所述关键词概括条款内容,再加入一条款标签以标记所述样本合同,根据所述样本合同中的条款标签来确认待验证合同是否验证通过,可以避免待验证合同中条款缺失或有误的情况出现。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,双屏设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
图3为本发明实施例三提供的电子设备的示意图。
所述电子设备3包括:存储器31、至少一个处理器32、存储在所述存储器31中并可在所述至少一个处理器32上运行的计算机程序33、至少一条通讯总线34及数据库35。
所述至少一个处理器32执行所述计算机程序33时实现上述合同确认方法实施例中的步骤。
示例性的,所述计算机程序33可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述至少一个处理器32执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序33在所述电子设备3中的执行过程。
所述电子设备3可以是手机、平板电脑、个人数字助理(Personal DigitalAssistant,PDA)等安装有应用程序的设备。本领域技术人员可以理解,所述示意图3仅仅是电子设备3的示例,并不构成对电子设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备3还可以包括输入输出设备、网络接入设备、总线等。
所述至少一个处理器32可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。所述处理器32可以是微处理器或者所述处理器32也可以是任何常规的处理器等,所述处理器32是所述电子设备3的控制中心,利用各种接口和线路连接整个电子设备3的各个部分。
所述存储器31可用于存储所述计算机程序33和/或模块/单元,所述处理器32通过运行或执行存储在所述存储器31内的计算机程序和/或模块/单元,以及调用存储在存储器31内的数据,实现所述电子设备3的各种功能。所述存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备3的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,图2中所述的各个模块(计算模块201、提取模块202、处理模块203及确认模块204)是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到合同确认的目的。
所述计算模块201用于计算样本合同中每个词语的IDF指标值;
所述计算模块201还用于根据所述IDF指标值计算所述样本合同中每条款中每个词语的TF-IDF权重值;
所述提取模块202用于将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
所述处理模块203用于根据提取的词语概括对应条款的内容,并加入一条款标签;
所述确认模块204用于扫描待验证合同,确认所述待验证合同中是否包含所述样本合同中的所有条款标签,其中,所述待验证合同的类别与所述样本合同的类别一致;及
所述确认模块204还用于当所述待验证合同中包含所述样本合同中的所有条款标签时,确认所述待验证合同验证通过。
优选地,在“根据提取的词语概括对应条款的内容,并加入一条款标签”之后,所述处理模块203还用于保存所述条款标签,并建立所述样本合同的标签词库。
优选地,确认所述待验证合同中是否包含所述样本合同中的所有条款标签的方法包括:
扫描所述待验证合同,计算所述待验证合同中每条款中每个词语的TF-IDF权重值;
将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
根据提取的词语概括对应条款的内容,并加入一待验证条款标签;
确定所述待验证条款标签是否包含所述标签词库中所述条款标签;
当所述待验证条款标签包含所述标签词库中所述条款标签时,确认所述待验证合同验证通过;
当所述待验证条款标签未包含所述标签词库中所述条款标签时,确认所述待验证合同未验证通过。
优选地,在确认所述待验证合同中是否包含所述样本合同中的所有条款标签之前,所述合同确认装置20还可以:
计算所述样本合同与所述待验证合同之间的相似度指标来对所述待验证合同进行初步筛选。
优选地,当所述样本合同与所述待验证合同之间的相似度指标值大于等于预设值,说明所述样本合同与所述待验证合同之间相似度高,将所述待验证合同中待验证条款标签与所述标签词库中所述条款标签比对,以确认所述待验证合同;
当所述样本合同与所述待验证合同之间的相似度指标值小于所述预设值,说明所述样本合同与所述待验证合同之间相似度低,无需将所述待验证合同中待验证条款标签与所述标签词库中所述条款标签比对,确认所述待验证合同验证未通过。
优选地,计算所述样本合同与所述待验证合同之间的相似度指标的步骤包括:
获取所述样本合同的关键词;
获取所述待验证合同的关键词;
根据所述样本合同的关键词的TF-IDF权重值得到所述样本合同的向量,及根据所述待验证合同的关键词的TF-IDF权重值得到所述待验证合同的向量;
利用余弦定理计算所述样本合同的向量和所述待验证合同的向量之间的余弦值,所述余弦值即为所述样本合同与所述待验证合同之间的相似度指标。
优选地,在“计算样本合同中每个词语的IDF指标值”之前,所述合同确认装置20还可以确定样本合同的类别。
所述数据库(Database)35是按照数据结构来组织、存储和管理数据的建立在所述电子设备3上的仓库。数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。在本实施方式中,所述数据库35用于存储条款标签等信息。
所述电子设备3集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应所述理解到,所揭露的电子设备和方法,可以通过其它的方式实现。例如,以上所描述的电子设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神范围。
Claims (8)
1.一种合同确认方法,其特征在于,所述方法包括:
计算样本合同中每个词语的IDF指标值;
根据所述IDF指标值计算所述样本合同中每一条款中每个词语的TF-IDF权重值;
将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
根据提取的词语概括对应条款的内容,并加入一条款标签;
扫描待验证合同,计算所述待验证合同中每一条款中每个词语的TF-IDF权重值,将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语,根据提取的词语概括对应条款的内容,并加入一待验证条款标签,确定所述待验证条款标签是否包含标签词库中的所述条款标签,其中,所述标签词库为样本合同的标签词库,所述待验证合同的类别与所述样本合同的类别一致;及
当所述待验证条款标签包含所述标签词库中的所述条款标签时确认所述待验证合同验证通过。
2.如权利要求1所述的合同确认方法,其特征在于,在确认所述待验证合同中是否包含所述样本合同中的所有条款标签之前,所述方法还包括:
通过计算所述样本合同与所述待验证合同之间的相似度指标来对所述待验证合同进行初步筛选。
3.如权利要求2所述的合同确认方法,其特征在于:
当所述样本合同与所述待验证合同之间的相似度指标值大于等于预设值,确认所述样本合同与所述待验证合同之间相似度高,将所述待验证合同中待验证条款标签与所述标签词库中的所述条款标签进行比对,以确认所述待验证合同;
当所述样本合同与所述待验证合同之间的相似度指标值小于所述预设值,确认所述样本合同与所述待验证合同之间相似度低,无需将所述待验证合同中待验证条款标签与所述标签词库中的所述条款标签进行比对,确认所述待验证合同验证未通过。
4.如权利要求2所述的合同确认方法,其特征在于,计算所述样本合同与所述待验证合同之间的相似度指标的步骤包括:
获取所述样本合同的关键词;
获取所述待验证合同的关键词;
根据所述样本合同的关键词的TF-IDF权重值得到所述样本合同的向量,及根据所述待验证合同的关键词的TF-IDF权重值得到所述待验证合同的向量;
利用余弦定理计算所述样本合同的向量和所述待验证合同的向量之间的余弦值,所述余弦值即为所述样本合同与所述待验证合同之间的相似度指标。
5.如权利要求1所述的合同确认方法,其特征在于,在“计算样本合同中每个词语的IDF指标值”之前,所述方法还包括:
确定所述样本合同的类别。
6.一种合同确认装置,其特征在于,所述装置包括:
计算模块,用于计算样本合同中每个词语的IDF指标值;
所述计算模块,还用于根据所述IDF指标值计算所述样本合同中每一条款中每个词语的TF-IDF权重值;
提取模块,用于将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语;
处理模块,用于根据提取的词语概括对应条款的内容,并加入一条款标签;及
确认模块,用于扫描待验证合同,计算所述待验证合同中每一条款中每个词语的TF-IDF权重值,将所述每个词语的TF-IDF权重值进行降序排序,并提取排在前面的预设个数TF-IDF权重值对应的词语,根据提取的词语概括对应条款的内容,并加入一待验证条款标签,确定所述待验证条款标签是否包含标签词库中的所述条款标签,其中,所述标签词库为样本合同的标签词库,所述待验证合同的类别与所述样本合同的类别一致;及
所述确认模块,还用于当所述待验证条款标签包含所述标签词库中的所述条款标签时,确认所述待验证合同验证通过。
7.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至5中任意一项所述的合同确认方法。
8.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任意一项所述的合同确认方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910173139.9A CN110069594B (zh) | 2019-03-07 | 2019-03-07 | 合同确认方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910173139.9A CN110069594B (zh) | 2019-03-07 | 2019-03-07 | 合同确认方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110069594A CN110069594A (zh) | 2019-07-30 |
CN110069594B true CN110069594B (zh) | 2023-10-10 |
Family
ID=67366099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910173139.9A Active CN110069594B (zh) | 2019-03-07 | 2019-03-07 | 合同确认方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110069594B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689459B (zh) * | 2019-09-27 | 2022-12-27 | 北京百度网讯科技有限公司 | 合同处理方法、装置、设备及存储介质 |
CN114255042A (zh) * | 2021-12-27 | 2022-03-29 | 中国农业银行股份有限公司 | 一种免密支付的签约方法、装置、计算机设备及介质 |
CN116976683B (zh) * | 2023-09-25 | 2024-02-27 | 江铃汽车股份有限公司 | 一种合同条款自动审核方法、系统、存储介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844337A (zh) * | 2016-12-30 | 2017-06-13 | 全民互联科技(天津)有限公司 | 一种合同缺失条款自动扫描方法及系统 |
CN106844544A (zh) * | 2016-12-30 | 2017-06-13 | 全民互联科技(天津)有限公司 | 一种合同条款风险识别方法及系统 |
CN108399227A (zh) * | 2018-02-12 | 2018-08-14 | 平安科技(深圳)有限公司 | 自动打标签的方法、装置、计算机设备及存储介质 |
CN109344382A (zh) * | 2018-10-23 | 2019-02-15 | 出门问问信息科技有限公司 | 审核合同的方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10891699B2 (en) * | 2015-02-09 | 2021-01-12 | Legalogic Ltd. | System and method in support of digital document analysis |
EP3392780A3 (en) * | 2017-04-19 | 2018-11-07 | Tata Consultancy Services Limited | Systems and methods for classification of software defect reports |
-
2019
- 2019-03-07 CN CN201910173139.9A patent/CN110069594B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844337A (zh) * | 2016-12-30 | 2017-06-13 | 全民互联科技(天津)有限公司 | 一种合同缺失条款自动扫描方法及系统 |
CN106844544A (zh) * | 2016-12-30 | 2017-06-13 | 全民互联科技(天津)有限公司 | 一种合同条款风险识别方法及系统 |
CN108399227A (zh) * | 2018-02-12 | 2018-08-14 | 平安科技(深圳)有限公司 | 自动打标签的方法、装置、计算机设备及存储介质 |
CN109344382A (zh) * | 2018-10-23 | 2019-02-15 | 出门问问信息科技有限公司 | 审核合同的方法、装置、电子设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
贾强 ; 冯锡炜 ; 王志峰 ; 朱睿 ; 秦航 ; .基于改进的TF-IDF文本特征词提取算法研究.辽宁石油化工大学学报.2017,(第04期),第63-66,71页. * |
Also Published As
Publication number | Publication date |
---|---|
CN110069594A (zh) | 2019-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163478B (zh) | 一种合同条款的风险审查方法及装置 | |
CN110069594B (zh) | 合同确认方法、装置、电子设备及存储介质 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN109325146B (zh) | 一种视频推荐方法、装置、存储介质和服务器 | |
US11720615B2 (en) | Self-executing protocol generation from natural language text | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN111767375A (zh) | 语义召回方法、装置、计算机设备及存储介质 | |
CN112597300A (zh) | 文本聚类方法、装置、终端设备及存储介质 | |
CN112668320A (zh) | 基于词嵌入的模型训练方法、装置、电子设备及存储介质 | |
CN112214576B (zh) | 舆情分析方法、装置、终端设备及计算机可读存储介质 | |
CN115687647A (zh) | 公证文书生成方法、装置、电子设备及存储介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN112925898A (zh) | 基于人工智能的问答方法、装置、服务器及存储介质 | |
CN113204953A (zh) | 基于语义识别的文本匹配方法、设备及设备可读存储介质 | |
CN109657043B (zh) | 自动生成文章的方法、装置、设备及存储介质 | |
TW202123026A (zh) | 資料歸檔方法、裝置、電腦裝置及存儲介質 | |
CN112307175B (zh) | 一种文本处理方法、装置、服务器及计算机可读存储介质 | |
CN111444712A (zh) | 一种关键词提取方法、终端、计算机可读存储介质 | |
WO2022257455A1 (zh) | 一种相似文本的确定方法、装置、终端设备及存储介质 | |
CN116127087A (zh) | 一种知识图谱构建方法、装置、电子设备及存储介质 | |
CN115098619A (zh) | 资讯去重方法、装置、电子设备及计算机可读取存储介质 | |
CN114153939A (zh) | 文本识别方法及装置 | |
CN111914868A (zh) | 模型训练方法、异常数据检测方法、装置和电子设备 | |
CN111046654B (zh) | 一种语句识别方法、语句识别装置及智能设备 | |
CN117131426B (zh) | 基于预训练的品牌识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |